6 Grundsätze für eine KI-taugliche Datenbasis

Wer Künstliche Intelligenz nutzen will, muss über eine vertrauenswürdige Datengrundlage verfügen. Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. Nur so können KI-Modelle robust, anpassungsfähig und vertrauenswürdig arbeiten. [...]

Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. (c) stock.adobe.com/The Little Hut

Qlik, Anbieter von Lösungen für Datenintegration, Datenqualität, Analytik und KI, stellt konkrete Maßnahmen vor, die Unternehmen ergreifen können, um eine vertrauenswürdige Datenbasis zu schaffen und ihre KI-Initiativen erfolgreich voranzutreiben. Die folgenden sechs Prinzipien sind demnach bei der Erstellung und Nutzung von KI-fähigen Daten unerlässlich.

Diversität

Daten sollten aus einer Vielzahl von Quellen stammen – also aus verschiedenen demographischen, geographischen und zeitlichen Kontexten. Eine diverse Datenbasis stellt sicher, dass KI-Modelle verschiedene Perspektiven und Szenarien berücksichtigen, da sie nur so faire und unvoreingenommene Ergebnisse zu erzielen können. Erreichen lässt sich dies durch die Integration von Daten aus internen wie auch externen Quellen. Nur mit einer diversen Datenbasis sind KI-Modelle also überhaupt in der Lage, zuverlässige Vorhersagen zu treffen.

Aktualität

Veraltete Daten können zu fehlerhaften Entscheidungen führen und die Leistung von KI-Modellen beeinträchtigen. Für den Einsatz von KI muss daher sichergestellt sein, dass ihre Daten regelmäßig aktualisiert werden. Dies kann durch die Implementierung von Echtzeit-Datenströmen und automatisierten Aktualisierungsprozessen erreicht werden. Nicht vergessen: Die Datenmanagement-Systeme müssen auch in der Lage sein, große Mengen an Daten in kurzer Zeit zu verarbeiten und auf dem aktuellen Stand zu halten.

Genauigkeit

Fehlerhafte oder ungenaue Daten können die Leistung von KI-Modellen erheblich beeinträchtigen und zu falschen Entscheidungen führen. Unternehmen sollten Datenvalidierungs- und Bereinigungsprozesse implementieren, um die Genauigkeit ihrer Daten sicherzustellen. Regelmäßige Datenqualitätsprüfungen sind ebenfalls wichtig, damit die Daten den erforderlichen Genauigkeitsstandards entsprechen. Daten sollten also so zuverlässig wie möglich sein, da sich nur so die Vertrauenswürdigkeit und Zuverlässigkeit von KI-Systemen gewährleisten lassen.

Sicherheit

Daten müssen sehr gut geschützt sein, nicht nur um Ransomware-Angriffen zu entgehen – sondern auch, um die Integrität von KI-Systemen zu wahren. Nicht zuletzt geht es auch darum, das Vertrauen der Anwender zu gewinnen. Verschlüsselung, Zugriffskontrollen und regelmäßige Sicherheitsaudits sollten längst ein Muss sein. Gleiches gilt für die Anforderung, dass Datenmanagement-Systeme den geltenden Datenschutzbestimmungen entsprechen – DSGVO lässt grüßen.

Auffindbarkeit

Die besten Daten sind wertlos, wenn weder Mensch noch Maschine wissen, wo sie zu finden sind. Datenkataloge und Metadaten-Management-Systeme schaffen hier ebenso Abhilfe wie benutzerfreundliche Datenmanagement-Systeme. Generell sollten Daten leicht auffindbar und zugänglich sein, um die Nutzung relevanter und kontextbezogener Informationen zu ermöglichen.

Nutzbarkeit

Nicht alle Formate sind für maschinelles Lernen (ML) und die Integration in KI-Modelle geeignet. Nutzbarmachung stellt sicher, dass KI-Modelle effizient und effektiv arbeiten können – etwa durch Einsatz gängiger Datenbankformate und Einhaltung einer konsistenten Struktur. Unternehmen können hierfür beispielsweise Datenstandardisierungs- und Harmonisierungsprozesse implementieren, um die Nutzbarkeit zu gewährleisten. Diese Datenmanagement-Systeme sollten in der Lage sein, Informationen aus verschiedenen Quellen zu integrieren und zu verarbeiten.


Mehr Artikel

News

Ransomware-Erpresser setzen auf Kryptowährungen

Die Ransomware-Landschaft erlebte 2024 erhebliche Veränderungen, wobei Kryptowährungen weiterhin eine zentrale Rolle bei Erpressungen spielen. Das Gesamtvolumen der Lösegeldzahlungen ging im Jahresvergleich um etwa 35 Prozent zurück, was auf verstärkte Strafverfolgungsmaßnahmen, verbesserte internationale Zusammenarbeit und eine zunehmende Zahlungsverweigerung der Opfer zurückzuführen ist. […]

Reinhard Schröckner, Managing Director bei MannundMouse (c) timeline / Rudi Handl
Interview

„Resilienz als dynamischen Prozess begreifen, der ständig angepasst werden muss“

Unterbrochene Lieferketten, gestiegene Energiekosten, Inflation, immer besser ausgeführte Cyberangriffe nicht zuletzt dank des Einsatzes von Künstlicher Intelligenz sind Herausforderungen, die sich Unternehmen gegenwärtig stellen müssen. Wie man sein Unternehmen resilienter machen und im Fall eines Falles die Ausfallzeiten so gering wie möglich halten kann, erklärt Reinhard Schröckner, Managing Director bei MannundMouse, im ITWELT.at-Interview. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*