28. April 2025

Vertrauen in Generative KI: Fünf Tipps, um die Datengrundlage sicher zu machen

Datenschutz und -sicherheit stehen für viele Unternehmen hierzulande an erster Stelle: Viele fragen sich aktuell, wie sich die Vorteile von KI nutzen lassen und der Datenschutz gleichzeitig gewahrt bleibt. [...]

artificial_intelligence_by_gerdaltmann — Foto: Gerdaltmann/Pixabay

All jene, für die eine eigene Strategie für den Einsatz generativer KI infrage kommt, stehen vor der Aufgabe, einen geeigneten Ansatz zu wählen. Ein bevorzugtes Modell zur sicheren Nutzung der sogenannten Large Language Models (LLM) sieht das Training des KI-Modells rein auf Basis der unternehmenseigenen Daten vor.

Für Unternehmen, die ihre Implementierungsstrategie und Infrastrukturinvestitionen für ein LLM planen, hat Qlik hier fünf Möglichkeiten zusammengestellt, wie sich sicherstellen lässt, dass die Datengrundlage sicher und aufbereitet für generative KI-Anwendungen ist und somit das Vertrauen in die Anwendung sowie deren Qualität stärken lässt.

1. Intelligente Integration

Das Unternehmen verfügt über eine große Menge an Daten in einer Vielzahl von Formaten und aus einer Vielzahl von, häufig verteilten, Quellen? Für generative KI-Tools ist das grundsätzlich eine gute Sache, da LLM davon profitieren, wenn sie auf großen Datensätzen trainiert werden.

Um jedoch einen nahtlosen und effizienten Informationsfluss zum Training des KI-Modells zu ermöglichen, sollte das Unternehmen in der Lage sein, die relevanten Daten zu identifizieren, zu sammeln und in einem zentralen, leistungsfähigen Data Warehouse oder Data Lake zeitnah verfügbar zu machen.

Eine entsprechende Datenreplikationsplattform repliziert, synchronisiert, verteilt und konsolidiert Daten aus und zwischen verschiedenen Quellen und gewährleistet dabei eine geringe Datenlatenz und maximale Datenverfügbarkeit.

2. Kontinuierliche Aktualisierung

Die Bereitstellung stets aktueller Daten ermöglicht es LLMs, sich anzupassen, zu verbessern und kontextuell relevante und kohärente Ergebnisse für ein breites Spektrum sprachbasierter Aufgaben und Anwendungen zu erzeugen.

Das erfordert einen Datenmanagementansatz, der die Erfassung von Änderungsdaten in Echtzeit unterstützt und Daten kontinuierlich erfasst und repliziert, wann und wo sie benötigt werden. Durch das Streaming von Echtzeitdaten wird die Genauigkeit und Relevanz der Ergebnisse, die das Sprachmodell liefert, optimiert.

3. Datenumwandlung

Damit die Daten nutzbar für ein LLM sind, müssen sie aus dem Rohzustand transformiert werden, also so, dass dies möglichst effizient erfolgt und sie für das Zielsystem geeignet ist. Beispielsweise eignet sich Push Down SQL hervorragend für ein Cloud Data Warehouse, während ein Spark Cluster und Spark SQL besser für einen Data Lake geeignet sind.

4. Automatische Datenbereinigung

Es lässt sich nicht oft genug betonen: Die Datenqualität ist für die generative KI von entscheidender Bedeutung, da sie die Zuverlässigkeit, Genauigkeit und Kohärenz der Modellergebnisse direkt beeinflusst. Durch die Verwendung hochwertiger Daten beim Training kann das Modell aussagekräftige Muster und Assoziationen lernen und so sicherstellen, dass es kontextuell angemessene und wertvolle Inhalte erzeugt.

Mit entsprechenden Lösungen lassen sich die Daten automatisch und nahezu in Echtzeit bereinigen und profilieren, so dass das Modell von Anfang an nur mit qualitativ hochwertigen Daten trainiert wird.

5. Datenverwaltung

Auch Data Governance ist für generative KI von entscheidender Bedeutung, da sie die verantwortungsvolle und effektive Nutzung von Daten durch das Sprachmodell gewährleistet. Dies kann nicht nur durch etablierte Strategien und Richtlinien für die Sammlung, Pflege und Speicherung von Daten erreicht werden, sondern auch durch Technologien zur Automatisierung dieser Prozesse für die Datenpipeline.

Mit Lösungen zur Katalogisierung und Herkunftsbestimmung (Data Lineage) werden die Daten in der Analysepipeline von der Quelle bis Anwendung transparent. Sie geben sofortigen Einblick in die Quelle und den Weg der Daten.

Fazit

Die Fähigkeit, Daten aus beliebigen Quellen nutzbar zu machen, die Qualität zu verbessern und eine sichere, umfassende und moderne Datenstruktur zu schaffen, ist ein Muss, um mit generativer KI erfolgreich zu sein.

Heinz-Peter Gahleitner, Leiter der Abteilung Branchenlösungen und Prokurist bei der PROGRAMMIERFABRIK (c) PROGRAMMIERFABRIK

PROGRAMMIERFABRIK verleiht Heinz-Peter Gahleitner die Prokura

25. April 2025 pi/cb

Seit 1987 arbeitet Heinz-Peter Gahleitner im Bereich Support und Entwicklung einer Individual-Software für österreichische Lagerhausgenossenschaften. […]

Die beiden Sprecherinnen von Women@DSAG: (links) Franziska Niebauer, Beraterin für SAP IS-H bei der Helios Kliniken GmbH, und Anna Hartmann, Geschäftsführerin der in4MD Service GmbH (c) Bild links: Helios Kliniken GmbH; Bild rechts: www.AndreasLander.de

Chancengleichheit der Geschlechter – überbewertet oder wichtiger denn je?

25. April 2025 pi/kdl

In den USA schaffen Großkonzerne auf Geheiß Donald Trumps ihre Diversitätsprogramme ab. Auch in Europa folgen Unternehmen dem „Anti-Woke-Kurs“. Die DSAG nahm dies zum Anlass, bei den Mitgliedern des Frauennetzwerks Women@DSAG nachzufragen, wie es derzeit um die Chancengleichheit der Geschlechter im Job steht. 139 Frauen aus Deutschland, Österreich und der Schweiz nahmen an der Umfrage teil. […]

In Großbritannien etwa nutzten Ende 2024 rund 50 Prozent der Erwachsenen digitale Erstbanken, Tendenz steigend. (c) Pexels

Unbricking the Wall: Neue Wege der Software-Governance in Großbanken

25. April 2025 Wolfgang Franz

Trotz erheblicher Investitionen in DevOps und CI/CD stoßen viele Banken bei der Softwarebereitstellung immer noch auf ein zentrales Hindernis: manuelle Governance-Prozesse. Diese bremsen nicht nur die Innovationsgeschwindigkeit, sondern bergen auch Compliance-Risiken. ITWelt.at hat sich eine aktuelle Kosli-Studie zu diesem Thema angesehen. […]

"Sammlung allerhand auserlesener Reponsorum […]", Johann Hieronymus Hermann, 1736 (c) Österreichische Nationalbibliothek

Kulturpool – digitalisiertes Kulturerbe

25. April 2025 pi/kdl

Einer der Vorteile der Digitalisierung ist, dass Kulturgüter zunehmend auch in digitalisierter Version für alle online zugänglich vorliegen. So versammelt das zentrale Suchportal für digitalisiertes Kulturerbe in Österreich, Kulturpool, 1,6 Millionen Objekten, darunter historische Handschriften, Bücher, Kunstwerke und vieles mehr. Einer der Hauptbeiträger von Kulturpool ist die Österreichische Nationalbibliothek. […]

IT ist nicht gleich IT-Security: Warum eine fachlich überschätzte IT-Abteilung zum Problem wird

25. April 2025

Selbst eine leistungsfähige IT-Abteilung mit qualifizierten Fachkräften deckt oft nicht automatisch den hochspezialisierten Bereich der Cybersicherheit ab. Fehlen spezifisches Knowhow und gezielte Ressourcen im Bereich IT-Security sind Unternehmen trotz starker IT-Infrastruktur anfällig für Cyberangriffe. […]

Unternehmen trotz verbesserter Schutzmaßnahmen noch immer Opfer von Cyberattacken

25. April 2025

Eine neue Studie von Veeam zeigt, dass die gemessenen Raten an Datenwiederherstellung angesichts fortschrittlicher Cyber-Bedrohungen alarmierend sind. Das unterstreicht den dringenden Bedarf an robusten Strategien für die Ausfallsicherheit von Daten. […]

Camunda veröffentlicht Buch zum Thema Enterprise Process Orchestration

25. April 2025

Camunda-Mitbegründer und Chief Technologist Bernd Rücker hat in Zusammenarbeit mit Principal Practice Strategist Leon Strauch einen praxisorientierten Leitfaden zur Nutzung von Prozessorchestrierung und Automatisierung geschrieben. […]

Cybercrime im Alltag: wie Betrüger analoge Wege nutzen

25. April 2025 Christian Reinhardt *

Der Begriff „Quishing“ – ein Kunstwort aus QR-Code und Phishing – steht exemplarisch für eine neue Form digitaler Täuschung im realen Raum. Cyberkriminelle platzieren dabei täuschend echte QR-Codes in öffentlich zugänglichen Orten, etwa auf Parkautomaten oder in öffentlichen Verkehrsmitteln. […]

YouTube optimal nutzen

25. April 2025 Andreas Fischer *

An der Videoplattform von Google kommt heute fast niemand vorbei. Auf YouTube finden Sie abertausende Videos aus verschiedensten Bereichen. Wir zeigen, wie Sie noch mehr aus der Webseite herausholen und sie optimal nutzen. […]

Vertrauen in Generative KI: Fünf Tipps, um die Datengrundlage sicher zu machen

Datenschutz und -sicherheit stehen für viele Unternehmen hierzulande an erster Stelle: Viele fragen sich aktuell, wie sich die Vorteile von KI nutzen lassen und der Datenschutz gleichzeitig gewahrt bleibt. [...]

1. Intelligente Integration

2. Kontinuierliche Aktualisierung

3. Datenumwandlung

4. Automatische Datenbereinigung

5. Datenverwaltung

Fazit

Mehr Artikel

PROGRAMMIERFABRIK verleiht Heinz-Peter Gahleitner die Prokura

Chancengleichheit der Geschlechter – überbewertet oder wichtiger denn je?

Unbricking the Wall: Neue Wege der Software-Governance in Großbanken

Kulturpool – digitalisiertes Kulturerbe

IT ist nicht gleich IT-Security: Warum eine fachlich überschätzte IT-Abteilung zum Problem wird

Unternehmen trotz verbesserter Schutzmaßnahmen noch immer Opfer von Cyberattacken

Camunda veröffentlicht Buch zum Thema Enterprise Process Orchestration

Cybercrime im Alltag: wie Betrüger analoge Wege nutzen

YouTube optimal nutzen

Be the first to comment

Leave a Reply Antworten abbrechen