Datenqualität im Big-Data-Zeitalter

Selbstlernende Analysealgorithmen durchkämmen riesige Datenberge. Die daraus resultierenden Erkenntnisse werden mehr und mehr zur Basis von Unternehmensentscheidungen. Doch das funktioniert nur, wenn die zugrunde liegenden Daten stimmen. [...]

Sie arbeitet 24 Stunden, 365 Tage im Jahr, braucht keinen Schlaf und keinen Kaffee – und ist trotzdem stets hellwach. Die Rede ist von „Vital“, Board-Mitglied des in Hongkong ansässigen Investors Deep Knowledge Venture (DKV), der sich auf Projekte im Pharma- und Medizinbereich konzentriert. Vital kann wie die anderen Manager im Board von DKV über Investitionsvorhaben mitabstimmen. Nur hebt sie dabei keine Hand: Validating Investment Tool for Advancing Life Sciences, so der volle Name, ist ein in Software gegossener Algorithmus, entwickelt von der britischen Softwarefirma Aging Analytics. Die Maschine tut nichts anderes, als riesige Datenmengen zu sammeln, auszuwerten und anhand der so gewonnenen Ergebnisse den Kollegen Ratschläge zu geben.

Vital ist ein gutes Beispiel für datengetriebenes Business. Das funktioniert allerdings nur, wenn die Daten, auf denen das Analysewerk beruht, korrekt sind. Die notwendige Datenqualität und Data Governance sicherzustellen, ist jedoch alles andere als einfach. Gerade in Zeiten von Big Data, in denen die Menge der Daten, die Zahl der Datenquellen und die Varianz der Datentypen ständig zunehmen, wachsen auch die Herausforderungen. „Die Tatsache, dass sich Big Data in vielen Unternehmen zunehmend zum Mainstream entwickelt, lässt auch das Risiko steigen, dass Daten verwendet werden, die sich nicht dafür eignen, die gesetzten Ziele zu erreichen“, sagt Michele Goetz, Analystin von Forrester Research.

CHIEF DATA OFFICER

Das Bewusstsein, etwas in Sachen Data Governance unternehmen zu müssen, scheint bei den meisten Verantwortlichen angekommen zu sein. So hat sich beispielsweise die Zahl der Chief Data Officers laut Kurt Schlegel, Research Vice President von Gartner, im vergangenen Jahr verdoppelt. Mitarbeiter, die ihr Hauptaugenmerk darauf richten, wie Daten im Unternehmen gesammelt, aufbereitet, verteilt und analysiert werden, dürften in Zukunft immer stärker gefragt sein – vor allem auch um die Organisation rund um die Datenflüsse in den Griff zu bekommen. „Aber auch die traditionellen Aufgaben rund um Data Warehouse, Reporting und die Datenintegration müssen weiter erledigt werden“, sagt Schlegel. Gartner plädiert daher für einen bimodalen Ansatz rund um die Daten: Einerseits brauche es eine einheitliche klare Strategie, die notwendige Sicherheit und eine zentrale Kontrolle, was mit Daten im Unternehmen passiert. Auf der anderen Seite müssten die Unternehmen aber auch dafür sorgen, Freiraum für neue Ideen rund um Daten zu schaffen. Mitarbeiter müssten über den Tellerrand schauen können. Das erfordere eine flexible und agile Organisation, die auch Fehler toleriere. Gartner geht davon aus, dass sich in den Fachabteilungen im Zuge der stärkeren Verbreitung von Self-Service-BI selbstständig Datenspezialisten heranbilden werden.

Diese Auffächerung versetzt zwar mehr Mitarbeiter in die Lage, ihren Job mit Hilfe von Analytics besser zu erledigen, macht aber zugleich die Aufgabe der Data-Governance-Verantwortlichen schwieriger. Nicht einmal jedes zehnte Unternehmen werde im kommenden Jahr Kontrollmechanismen für die eigenen Self-Service-BI-Aktivitäten eingerichtet haben, mutmaßt Thomas Oestreich, Research Director für den Bereich BI und Analytics bei Gartner. Unternehmen müssten sich verstärkt um Data Governance kümmern. Dabei gehe es vor allem darum, die Balance zwischen neuen Möglichkeiten ausgefeilter Analysewerkzeuge und den damit verbundenen Risiken zu finden.

Governance bedeutet aus Gartner-Sicht zu definieren, nach welchen Regeln im Umgang mit Daten gespielt werden soll. Das erfordere ein Agreement, an das sich alle Beteiligten halten. „Beispielsweise geht es im Zusammenhang mit Analytics-Governance um Fragen wie: Können wir bestimmte Dinge analysieren, und sollten wir dies auch tun?“, sagt Oestreich. Bei der Information Governance drehe sich vieles um den Wert bestimmter Informationen. So benötige die Finanzabteilung zu hundert Prozent korrekte Daten, um die geforderten Compliance-Anforderungen erfüllen zu können. Das bedeutet einen gewissen Aufwand, den man in anderen Bereichen nicht treiben muss. Im Marketing zum Beispiel genüge bei bestimmten Fragen eine Daten-Zielgenauigkeit von 80 Prozent.

Wichtig sei sicherzustellen, wer sich um die Governance kümmert, und auch den Erfolg der Maßnahmen zu messen, rät der Gartner-Analyst. Schließlich gehe es darum, definierte Ziele zu erreichen, wie beispielsweise die Kundenabwanderung zu verringern oder den Umsatz zu steigern. „Die Validierung von Datenprozessen wird immer wichtiger“, bilanziert Oestreich, „aber auch immer schwieriger.“ Zunehmend treffen Maschinen und Algorithmen Entscheidungen. Nutzer müssten dabei darauf vertrauen, dass diese Helfer richtig liegen.

Die Roadmaps der Anwenderunternehmen rund um BI und Analytics werden sich in den kommenden Jahren dementsprechend drastisch verändern, prophezeit Neil Chandler, Research Vice President von Gartner: „Die Ära des Data Warehouse ist vorbei.“ Chandler zufolge gehe es in Zukunft darum, neue Dinge mit Daten auszuprobieren. Ziel dürfe dabei allerdings nicht sein, bessere Data Lakes anzulegen. Vielmehr müsse stets im Fokus stehen, das eigene Geschäft voranzubringen. Mit dem Trend von der klassischen Reporting-BI hin zu Analytics-BI verändert sich die Fragestellung von „Was ist passiert?“ über „Warum ist es passiert?“ hin zu „Was wird passieren?“ und „Wie können wir bestimmte Dinge eintreten lassen?“

Martin Bayer|computerwoche


Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*