Wer Künstliche Intelligenz nutzen will, muss über eine vertrauenswürdige Datengrundlage verfügen. Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. Nur so können KI-Modelle robust, anpassungsfähig und vertrauenswürdig arbeiten. [...]

Qlik, Anbieter von Lösungen für Datenintegration, Datenqualität, Analytik und KI, stellt konkrete Maßnahmen vor, die Unternehmen ergreifen können, um eine vertrauenswürdige Datenbasis zu schaffen und ihre KI-Initiativen erfolgreich voranzutreiben. Die folgenden sechs Prinzipien sind demnach bei der Erstellung und Nutzung von KI-fähigen Daten unerlässlich.
Diversität
Daten sollten aus einer Vielzahl von Quellen stammen – also aus verschiedenen demographischen, geographischen und zeitlichen Kontexten. Eine diverse Datenbasis stellt sicher, dass KI-Modelle verschiedene Perspektiven und Szenarien berücksichtigen, da sie nur so faire und unvoreingenommene Ergebnisse zu erzielen können. Erreichen lässt sich dies durch die Integration von Daten aus internen wie auch externen Quellen. Nur mit einer diversen Datenbasis sind KI-Modelle also überhaupt in der Lage, zuverlässige Vorhersagen zu treffen.
Aktualität
Veraltete Daten können zu fehlerhaften Entscheidungen führen und die Leistung von KI-Modellen beeinträchtigen. Für den Einsatz von KI muss daher sichergestellt sein, dass ihre Daten regelmäßig aktualisiert werden. Dies kann durch die Implementierung von Echtzeit-Datenströmen und automatisierten Aktualisierungsprozessen erreicht werden. Nicht vergessen: Die Datenmanagement-Systeme müssen auch in der Lage sein, große Mengen an Daten in kurzer Zeit zu verarbeiten und auf dem aktuellen Stand zu halten.
Genauigkeit
Fehlerhafte oder ungenaue Daten können die Leistung von KI-Modellen erheblich beeinträchtigen und zu falschen Entscheidungen führen. Unternehmen sollten Datenvalidierungs- und Bereinigungsprozesse implementieren, um die Genauigkeit ihrer Daten sicherzustellen. Regelmäßige Datenqualitätsprüfungen sind ebenfalls wichtig, damit die Daten den erforderlichen Genauigkeitsstandards entsprechen. Daten sollten also so zuverlässig wie möglich sein, da sich nur so die Vertrauenswürdigkeit und Zuverlässigkeit von KI-Systemen gewährleisten lassen.
Sicherheit
Daten müssen sehr gut geschützt sein, nicht nur um Ransomware-Angriffen zu entgehen – sondern auch, um die Integrität von KI-Systemen zu wahren. Nicht zuletzt geht es auch darum, das Vertrauen der Anwender zu gewinnen. Verschlüsselung, Zugriffskontrollen und regelmäßige Sicherheitsaudits sollten längst ein Muss sein. Gleiches gilt für die Anforderung, dass Datenmanagement-Systeme den geltenden Datenschutzbestimmungen entsprechen – DSGVO lässt grüßen.
Auffindbarkeit
Die besten Daten sind wertlos, wenn weder Mensch noch Maschine wissen, wo sie zu finden sind. Datenkataloge und Metadaten-Management-Systeme schaffen hier ebenso Abhilfe wie benutzerfreundliche Datenmanagement-Systeme. Generell sollten Daten leicht auffindbar und zugänglich sein, um die Nutzung relevanter und kontextbezogener Informationen zu ermöglichen.
Nutzbarkeit
Nicht alle Formate sind für maschinelles Lernen (ML) und die Integration in KI-Modelle geeignet. Nutzbarmachung stellt sicher, dass KI-Modelle effizient und effektiv arbeiten können – etwa durch Einsatz gängiger Datenbankformate und Einhaltung einer konsistenten Struktur. Unternehmen können hierfür beispielsweise Datenstandardisierungs- und Harmonisierungsprozesse implementieren, um die Nutzbarkeit zu gewährleisten. Diese Datenmanagement-Systeme sollten in der Lage sein, Informationen aus verschiedenen Quellen zu integrieren und zu verarbeiten.
Be the first to comment