Generative KI ist die Technologie der Stunde. Schon jetzt ist vieles möglich und die Entwicklung schreitet rasant voran. [...]
Die wachsende Leistungsfähigkeit von KI-Systemen macht diese für die verschiedensten Anwendungsfelder interessant. Um das Potential dieser Technologie voll ausschöpfen zu können, wird es allerdings noch dauern, denn es gibt noch viele Hindernisse und Herausforderungen zu überwinden.
Zwei Herausforderungen stechen dabei besonders heraus: Die erste Herausforderung stellt die Auswertung unstrukturierter Daten dar, denn nach Schätzungen sind 80 Prozent aller Daten unstrukturiert. Da händische Auswertungen sehr zeitintensiv sind, kann generative KI hier Abhilfe leisten.
Die Qualität einer KI-gestützten Auswertung hängt jedoch von dem zugrundeliegenden Large-Language-Model (LLM) ab. Das volle Potenzial unstrukturierter Daten entfaltet sich erst durch ein geeignetes LLM. Das Thema Sicherheit ist – wie so oft – die zweite große Herausforderung. KI-Anbieter sammeln häufig die erfassten Daten, um ihre Produkte damit weiterzuentwickeln.
Je nachdem, wie sensibel die Daten sind, kann das jedoch zu ernsthaften Problemen führen, zum Beispiel in Bezug auf den Datenschutz und das intellektuelle Eigentum.
Unstrukturiert darf nicht ungenutzt bedeuten
Generative KI ist vielseitig anwendbar, bedarf allerdings ein passendes Large-Language-Model, um das meiste aus unstrukturierten Daten herauszuholen. Da Unternehmen routinemäßig große Mengen an unstrukturierten Daten speichern, liegt dort auch viel Wissen versteckt.
Informationen und Erkenntnisse aus dieser Art Daten zu gewinnen ist eine wichtige Aufgabe, die in der Vergangenheit viel Aufwand mit sich brachte und auf manuelle, fehleranfällige Prozesse zurückgreifen musste.
Bestimmte LLMs können genau dabei helfen. In der Document AI von Snowflake etwa werden speziell angefertigte multimodale LLMs verwendet, die nativ in die Snowflake-Plattform integriert sind. So wird es möglich, Inhalte wie Rechnungsbeträge oder Vertragsbedingungen mit geringem Aufwand aus Dokumenten zu extrahieren.
Erkenntnisse lassen sich zudem über eine visuelle Nutzeroberfläche und durch natürliche Sprache gewinnen. Tiefgehende Fachkenntnisse sind damit an dieser Stelle nicht notwendig, so dass am Ende mehr Mitarbeitende selbst aktiv zu Erkenntnissen kommen – der Prozess wird demokratisiert.
Unstrukturierte Daten werden leichter zugänglich, Geschäftsprozesse beschleunigt und damit produktiver. In Zukunft können auch andere Bereiche von unstrukturierten Daten so erschlossen werden.
Innovation geht nur mit Datenschutz
Sicherheit und Governance dürfen dabei gerade bei einer solch disruptiven Technologie wie generativer KI keinesfalls vernachlässigt werden. Firmen haben ein riesiges Interesse daran, ihre Daten so gut es geht zu schützen und abzusichern. Bei einigen generativen KI-Systemen fehlt dieser Schutz jedoch, denn deren Anbieter sammeln Daten, um auf ihrer Basis die Systeme weiterzuentwickeln.
Zudem entsteht so die Gefahr, dass die gesammelten Daten von Cyberkriminellen gestohlen werden könnten. Um einen wirklichen Mehrwert zu bieten, muss Automatisierung Hand in Hand mit Sicherheit und Governance gehen. In älteren Data Lakes und Big-Data-Umgebungen fehlte es an diesen Garantien.
Zu diesem Zweck ist das Snowpark Entwickler-Framwork von Snowflake in seinem Kern auf Governance ausgerichtet. Dort lässt sich Nicht-SQL-Code mit verschiedenen Laufzeiten und Datenbanken bereitstellen und verarbeiten.
LLMs gehören zu den unterstützten Apps in den Snowpark Container Services. Der entscheidende Vorteil: Unternehmen müssen nicht auf generative KI verzichten, sondern können gleichzeitig sowohl das firmeneigene geistige Eigentum als auch die Kundendaten schützen.
Auch ein Feineinstellen oder andere Interaktionen mit LLMs sind abgedeckt. Daten, die hierfür verwendet werden, bleiben vor dem LLM-Anbieter verborgen. Somit kann auch das Potential hochsensibler Daten ausgeschöpft werden, ohne dass ein Risiko entsteht.
Die so geschaffene Vertrauensbasis wird die Anwendungsentwicklung im Bereich LLMs und darüber hinaus stärken, denn Anwendungen in einer sicheren Umgebung sind attraktiver für die Nutzerseite. Letztlich profitieren so auch Anbieter von Anwendungen und der Markt kann florieren.
Ein kontrollierter Datenschutz trägt außerdem zu einer erleichterten, da geregelten, Kollaboration bei. Hier wird auch von „governed collaboration” gesprochen. Sensible Daten können sicher über die eigene Organisation hinaus geteilt werden, da sie dafür nicht die geschützte Umgebung verlassen müssen.
Der Weg zu einem zeitgemäßen Umgang mit Daten
Generative KI geht schon jetzt über Chatbots und Bildgenerierung hinaus. Für die Verarbeitung von Daten stellt diese Technologien eine große Innovation dar. Damit Unternehmen dieses Potential angemessen nutzen können, sind zwei Punkte entscheidend. Der große Anteil an unstrukturierten Daten macht es notwendig, diese zu erschließen damit sie weiterverarbeitet werden können.
Geschieht dies nicht, bleiben entscheidende Erkenntnisse unentdeckt. Hinzu kommen Sicherheitsgarantien für den Schutz der Daten. Ohne diese Garantien bleiben viele Daten außen vor, da das Risiko – auch für Kundendaten – schlicht zu groß ist. Werden diese beiden Herausforderungen adäquat angegangen, wird ein zeitgemäßer Umgang mit Daten möglich.
*Torsten Grabs ist als Senior Director of Product Management bei Snowflake tätig. Er konzentriert sich bei seiner Arbeit auf Snowflakes Data Lake, Datenpipelines und Data Science Workloads sowie auf das Entwickler- und Partner-Ökosystem von Snowflake. Bevor er 2017 zu Snowflake kam, war er über ein Jahrzehnt bei Microsoft als Software-Entwickler und Produktmanager beschäftigt. Zudem promovierte Torsten in Informatik an der Eidgenössischen Technischen Hochschule in Zürich.
Be the first to comment