Ein Data Lake beherbergt all Ihre Unternehmensdaten mit Leichtigkeit. Aber Vorsicht: So ein XXL-Datendepot kann sich allzu leicht in einen Sumpf verwandeln und Ihre User verschrecken. Lesen Sie, wie Sie das verhindern. [...]
VOM DATA LAKE ZUM DATENSUMPF
Datenbanken, so Perez weiter, seien teuer und der Data Lake die Antwort auf dieses Problem: „Data Lakes – und generell alle Big-Data-Initiativen – kommen aus zwei Gründen zustande: Erstens wegen des Wettbewerbsdrucks und zweitens wegen der Datengeneratoren in der ‚echten‘ Welt, die ständig neue Datenpakete produzieren und neuen Speicherbedarf verursachen.“
Video: How to Build a Successful Data Lake
Das soll nicht heißen, dass ein Data Lake per se eine schlechte Idee wäre. Avi Perez ist sogar überzeugt davon, dass irgendwann jedes Unternehmen einen solchen braucht. Doch einen Data Lake zu schaffen, der den Endbenutzern echten Nutzen, beziehungsweise Mehrwert bringt, erfordert eine strategische Vorgehensweise. Wir schlagen Ihnen drei Strategien vor, um nicht im eigenen Data Lake zu ertrinken:
Laut Perez begehen viele Unternehmen den Fehler, zu viele Daten zu sammeln – einfach, weil sie es können. Der Experte führt das Smartphone als Beispiel an: „Am Ende hat man Millionen von Fotos auf dem Telefon, von denen 99 Prozent Datenmüll sind, den man sofort löschen könnte. Das Fotografieren ist dank des Smartphones so einfach geworden, dass es nahezu umsonst ist. Wahrscheinlich erwischen auch Sie sich öfter bei Gedankengängen wie ‚demnächst räume ich auf‘ – dazu kommt es natürlich nie. Stattdessen sammelt man enorme Mengen von Informationen und Daten – hat aber keinerlei effektive Möglichkeit, diese zu strukturieren.“
Um dieses Problem zu umgehen, rät der Experte, den Datenhahn zuzudrehen: „Nur weil es günstig ist, die Daten zu sammeln, muss es nicht günstig sein, die Daten zu nutzen. Das könnte sogar ganz schön teuer werden. Sammeln Sie also nicht überall und zu jeder Zeit Daten. Fokussieren Sie sich auf die Daten, von denen Sie bereits wissen, wie Sie sie nutzen wollen.“
Wenn Sie sich auf ein oder mehrere Data Sets fokussiert haben, sollten Sie auf Automatisierung setzen, um Mehrwert aus den Daten zu generieren. „Künstliche Intelligenz, Machine Learning, Deep Learning – welches Buzzword Sie auch verwenden, es ist die magische Lösung, die Ihnen den Weg durch die Daten ebnet. Ich behaupte, das ist der einfachste Weg um Mehrwert aus Ihrem 5-Petabyte-Data-Lake zu schöpfen“, so Perez.
3. IDENTIFIZIEREN SIE DEN GESCHÄFTSZWECK
Perez erklärt das Vorgehen am fiktiven Beispiel eines großen Retail-Unternehmens: „Sie wollen mehr darüber erfahren, welche Kunden Ihre Läden frequentieren. Dazu könnten Sie Ihre Kunden fotografieren und die Daten anschließend mit Hilfe eines künstlichen neuronalen Netzes (KNN) auswerten. Das KNN kann Ihnen dabei helfen zu bestimmen, ob es sich bei den Personen auf den Fotos beispielsweise um Kinder oder Erwachsene handelt. Wenn Sie damit fertig sind, verknüpfen Sie die Daten mit dem entsprechenden Geschäftsziel. So können Sie beispielsweise herausfinden, welche Zielgruppen sie eventuell verfehlen. Wichtig ist dabei, dass Sie von Anfang an eine klare Strategie besitzen.“
Dieser Artikel basiert auf einem Beitrag der US-Publikation cio.com.
Be the first to comment