Vertrauen in Generative KI: Fünf Tipps, um die Datengrundlage sicher zu machen

Datenschutz und -sicherheit stehen für viele Unternehmen hierzulande an erster Stelle: Viele fragen sich aktuell, wie sich die Vorteile von KI nutzen lassen und der Datenschutz gleichzeitig gewahrt bleibt. [...]

Foto: Gerdaltmann/Pixabay

All jene, für die eine eigene Strategie für den Einsatz generativer KI infrage kommt, stehen vor der Aufgabe, einen geeigneten Ansatz zu wählen. Ein bevorzugtes Modell zur sicheren Nutzung der sogenannten Large Language Models (LLM) sieht das Training des KI-Modells rein auf Basis der unternehmenseigenen Daten vor.

Für Unternehmen, die ihre Implementierungsstrategie und Infrastrukturinvestitionen für ein LLM planen, hat Qlik hier fünf Möglichkeiten zusammengestellt, wie sich sicherstellen lässt, dass die Datengrundlage sicher und aufbereitet für generative KI-Anwendungen ist und somit das Vertrauen in die Anwendung sowie deren Qualität stärken lässt.

1. Intelligente Integration 

Das Unternehmen verfügt über eine große Menge an Daten in einer Vielzahl von Formaten und aus einer Vielzahl von, häufig verteilten, Quellen? Für generative KI-Tools ist das grundsätzlich eine gute Sache, da LLM davon profitieren, wenn sie auf großen Datensätzen trainiert werden.

Um jedoch einen nahtlosen und effizienten Informationsfluss zum Training des KI-Modells zu ermöglichen, sollte das Unternehmen in der Lage sein, die relevanten Daten zu identifizieren, zu sammeln und in einem zentralen, leistungsfähigen Data Warehouse oder Data Lake zeitnah verfügbar zu machen.

Eine entsprechende Datenreplikationsplattform repliziert, synchronisiert, verteilt und konsolidiert Daten aus und zwischen verschiedenen Quellen und gewährleistet dabei eine geringe Datenlatenz und maximale Datenverfügbarkeit.

2. Kontinuierliche Aktualisierung 

Die Bereitstellung stets aktueller Daten ermöglicht es LLMs, sich anzupassen, zu verbessern und kontextuell relevante und kohärente Ergebnisse für ein breites Spektrum sprachbasierter Aufgaben und Anwendungen zu erzeugen.

Das erfordert einen Datenmanagementansatz, der die Erfassung von Änderungsdaten in Echtzeit unterstützt und Daten kontinuierlich erfasst und repliziert, wann und wo sie benötigt werden. Durch das Streaming von Echtzeitdaten wird die Genauigkeit und Relevanz der Ergebnisse, die das Sprachmodell liefert, optimiert.

3. Datenumwandlung 

Damit die Daten nutzbar für ein LLM sind, müssen sie aus dem Rohzustand transformiert werden, also so, dass dies möglichst effizient erfolgt und sie für das Zielsystem geeignet ist. Beispielsweise eignet sich Push Down SQL hervorragend für ein Cloud Data Warehouse, während ein Spark Cluster und Spark SQL besser für einen Data Lake geeignet sind.

4. Automatische Datenbereinigung

Es lässt sich nicht oft genug betonen: Die Datenqualität ist für die generative KI von entscheidender Bedeutung, da sie die Zuverlässigkeit, Genauigkeit und Kohärenz der Modellergebnisse direkt beeinflusst. Durch die Verwendung hochwertiger Daten beim Training kann das Modell aussagekräftige Muster und Assoziationen lernen und so sicherstellen, dass es kontextuell angemessene und wertvolle Inhalte erzeugt.

Mit entsprechenden Lösungen lassen sich die Daten automatisch und nahezu in Echtzeit bereinigen und profilieren, so dass das Modell von Anfang an nur mit qualitativ hochwertigen Daten trainiert wird.

5. Datenverwaltung

Auch Data Governance ist für generative KI von entscheidender Bedeutung, da sie die verantwortungsvolle und effektive Nutzung von Daten durch das Sprachmodell gewährleistet. Dies kann nicht nur durch etablierte Strategien und Richtlinien für die Sammlung, Pflege und Speicherung von Daten erreicht werden, sondern auch durch Technologien zur Automatisierung dieser Prozesse für die Datenpipeline.

Mit Lösungen zur Katalogisierung und Herkunftsbestimmung (Data Lineage) werden die Daten in der Analysepipeline von der Quelle bis Anwendung transparent. Sie geben sofortigen Einblick in die Quelle und den Weg der Daten.

Fazit

Die Fähigkeit, Daten aus beliebigen Quellen nutzbar zu machen, die Qualität zu verbessern und eine sichere, umfassende und moderne Datenstruktur zu schaffen, ist ein Muss, um mit generativer KI erfolgreich zu sein.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*