Blog

Data Lakes - Der Datenozean als nächster Evolutionsschritt?

Werden bislang bevorzug Data-Warehouses oder Data-Marts genutzt, um große Datenmengen zu speichern, kommen die sogenannten Data Lakes oder Datenozeane verstärkt ins Gespräch. Die Vorteile sind auf den ersten Blick plausibel, allerdings gibt es einige wichtige Einschränkungen zu beachten.

Datensparsamkeit - Ein Relikt vergangener Tage?

Der NSA-Skandal verursachte einen kurzen Aufschrei der Empörung, der nach wenigen Monaten weitestgehend verhallte. Auf den ersten Blick erscheint diese Entwicklung befremdlich, doch Abhörskandale sind nur die Spitze des Eisberges. Wer die Hintergründe der Gleichgültigkeit verstehen möchte, mit der breite Teile der Bevölkerung dem Datenschutz begegnen, muss tiefschürfende Analysen durchführen.

Big Data und die vier V-Herausforderungen

Im Zusammenhang mit Big-Data-Definitionen werden drei bis vier Herausforderungen beschrieben, die jeweils mit V beginnen. In der ursprünglichen Definition wurden nur drei Begriffe genannt: Volumen, Variety und Velocity. Volumen steht dabei für die Größe der Datenmenge bei unstrukturierten Daten: Die notwendige Datenanalyse kann nicht mehr mit herkömmlichen Mitteln bewältigt werden. Variety steht für die Vielfalt der Datenformate und Datenquellen, die durch komplexe Verarbeitungsprozesse im Unternehmen nicht mehr unter einen Hut gebracht werden können. Velocity steht für die zeitgerechte Verarbeitung der Datenmengen, damit schnell Resultate für Entscheidungsprozesse vorliegen. Recht früh konnte man aber in der Big-Data-Diskussion feststellen, dass nur dann gute Resultate mit Big Data erzielt werden können, wenn die zugrundeliegende Datenqualität ausreichend gesichert ist. Der vierte V-Begriff (Veracity) ist damit integraler Bestand von Big-Data-Definitionen geworden. Was steckt aus Unternehmersicht hinter den vier V-Begriffen und wie müssen Big-Data-Konzepte mit diesen Herausforderungen im Unternehmensinteresse klar kommen?