Nur wenn die Datenbasis stimmt, kann eine KI vernünftige Ergebnisse liefern. Guro Bergan, General Managerin EMEA bei Fivetran, über die Kunst, ein vertrauenswürdiges Fundament zu schaffen. [...]
Willkommen im Zeitalter der KI! Aber eigentlich ist das Thema gar nicht so neu: Seit Jahren schon arbeiten diverse KI-basierte-Lösungen im Hintergrund und erleichtern uns das Leben: In Unternehmen, aber auch im privaten Bereich.
Mit ChatGPT & Co. hat das Thema ein neues Level erreicht: Es ist omnipräsent. 87 Prozent der Unternehmen glauben, dass diejenigen, die KI nicht nutzen, auf der Strecke bleiben werden. Und doch kämpft die Mehrheit immer noch mit weit verbreiteten Problemen der Datenqualität, die den umfänglichen Einsatz behindern. Neun von zehn Unternehmen haben noch immer nicht die Art von Automatisierungsfähigkeiten, die es ermöglichen würden, saubere und zeitnahe Daten in wichtige ML-Programme einzuspeisen. Dies waren die wichtigsten Ergebnisse einer unserer Studien im Jahr 2023.
Was generative KI ist – und was sie nicht ist
Insbesondere Unternehmen müssen sich der Grenzen generativer KI und unserer menschlichen Denkweise bewusst sein: Auch wenn wir Dinge als menschenähnliche Intelligenz wahrnehmen, ist diese eben oft nicht wirklich intelligent.
KI zeichnet sich durch ultraschnelle Verarbeitungsleistung und ein tiefgreifendes Verständnis von Zusammenhängen aus. Ohne den menschlichen Kontext können sich Large Language Modelle nur auf Daten stützen. Die erste und entscheidende Frage, die sich Verantwortliche daher stellen müssen, ist also, ob sie den Daten selbst vertrauen.
Daten sind das Herzstück des KI-Erfolgs
KI-Ergebnisse werden immer nur so vertrauenswürdig sein wie die Daten, mit denen sie gefüttert werden. Fehlerhafte Datenprozesse treten bei der Nutzung von generativen KI-Lösungen deutlicher zu Tage als in den meisten anderen Bereichen. Doch während Menschen Sinn und Unsinn unterscheiden können, können Maschinen dies nicht. Und das kann zu falschen Entscheidungen im Business führen. Untersuchungen von Fivetran zeigen, dass technische Entscheider oft kein Vertrauen in KI haben und sogar Umsatzeinbußen durch unzureichend funktionierende KI-Modelle auf der Grundlage schlechter Daten hinnehmen müssen. Fragt man jedoch nach den zugrundeliegenden Datenprozessen, so werden am häufigsten Probleme genannt, die wirklich grundlegende Aspekte im Unternehmen betreffen: Hochqualifizierte Spezialisten müssen sich mit unzugänglichen Daten sowie mit manuellen und sich wiederholenden Aufgaben beschäftigen.
Um Daten erfolgreich in einem Kontext generativer KI zu nutzen, müssen Unternehmen daher wichtige Daten zugänglich machen und gleichzeitig einen starken Governance-Rahmen dafür schaffen, welche Daten in die Analyse einbezogen werden können, wie sie verarbeitet werden können und wer darauf zugreifen kann. Der mangelnde Zugang zu aktuellen und relevanten Daten ist eines der größten Wachstumshemmnisse für Datenteams. Data Scientists, Engineers und Analysts verschwenden jeden Tag enorme Ressourcen mit dem Versuch, die benötigten Daten manuell ausfindig zu machen. Und oft sind die Daten, wenn sie dann gefunden sind, schon veraltet. Data Analysts schätzen, dass sie ein Drittel jedes Arbeitstages mit ineffektiven Datenprozessen verlieren. Wenn Top-Talente Mühe haben, Daten zum Laufen zu bringen, welche Chance haben dann große Sprachmodelle?
Automatisierung von Datenbewegungen ist der Schlüssel zur Lösung des Problems der Datenzuverlässigkeit. Sie kann einen Echtzeitzugriff auf alle Daten eines Unternehmens ermöglichen, unabhängig davon, welche Abteilung sie erstellt hat oder ob sie in Softwareanwendungen oder lokalen Datenbanken gespeichert sind. Auf diese Weise können Verantwortliche sicherstellen, dass alle Mitarbeitenden und KI-Modelle nur die aktuellsten und korrekten Daten verwenden und folglich alle Ergebnisse auch vertrauenswürdig sind. Zudem können Unternehmen durch Automatisierung die Regeln für die Datennutzung vordefinieren.
Klare Regeln für Datenmanagement
Genauso wie man nicht jedem Besucher den Code zum Safe geben würde, so müssen Unternehmen auch den Zugang zu ihren Daten für die KI beschränken. Sie sind dafür verantwortlich, sensible Daten wie personenbezogene Daten (PII) zu schützen und diese zu „maskieren“, wenn Datensätze für Analysen verwendet werden. Sie müssen auch die Herkunft der Daten nachvollziehen können und sehen, welches System wann und wie auf welche Daten zugegriffen hat. Dieses Maß an Transparenz und Kontrolle ist von entscheidender Bedeutung, wenn Unternehmen Data-Governance-Richtlinien und -Prozesse einführen. Und diese werden von den Aufsichtsbehörden erwartet und von den Kunden gefordert. Glücklicherweise bietet die Technologie bereits eine Antwort auf diese modernen Probleme. Durch die gemeinsame Nutzung von Metadaten und die Integration mit Automatisierungstools müssen Unternehmen nicht bei Null anfangen, um die Vorteile der KI-Revolution zu nutzen.
Sobald alle Kriterien erfüllt sind, können Unternehmen ihre Data Opportunity voll nutzen. Erst so wird das volle Potenzial von maschinellem Lernen, künstlicher Intelligenz und Big Data ausgeschöpft.
*Die Autorin Guro Bergan, VP/General Managerin EMEA bei Fivetran, hat eine vieljährige Erfahrung in leitenden Positionen bei renommierten IT-Unternehmen. Sie verantwortet das gesamte Business von Fivetran, dem US-Spezialisten für Datenintegration, in Europa, dem mittleren Osten und Afrika. Sie gilt als Expertin auf dem Gebiet. Sie engagiert sich zudem für „Women in Tech“.
Be the first to comment