KI-Agenten sind nur so leistungsfähig wie die Daten, mit denen sie arbeiten – und dabei zählt nicht nur die Menge, sondern auch die Struktur. Unstrukturierte Daten können schnell ins Chaos führen, ähnlich wie gescheiterte Data-Lake-Ansätze in Unternehmen. Gut strukturierte Daten hingegen machen KI effizienter und zuverlässiger. [...]

Agentische Systeme – also KI-Anwendungen, die als eigenständige Einheiten agieren und Entscheidungen treffen – sind nur so gut wie die Daten, auf die sie Zugriff haben. Dazu gehört auch, wie repräsentativ bzw. ganzheitlich diese Daten sind. Genau wie viele Unternehmen mit dem Konzept des Data Lakes zu kämpfen hatten, welches viel zu oft zu einem Sumpf an unübersichtlichen und so kaum nutzbaren Daten wurde, kann auch KI davon profitieren, wenn man Struktur in diese Datenwildnis bringt. Welche Überlegungen und Schritte dazu nötig sind, erläutern die KI- und Datenexperten von KNIME.
Ein smarter Kühlschrank etwa kann heute analysieren, welche Zutaten er enthält, und er kann vorschlagen, welche Gerichte daraus gekocht werden können. Doch wenn man ihn fragt: Was soll ich heute Abend kochen?, stößt er schnell an seine Grenzen. Ohne zusätzlichen Kontext – etwa ob Gäste kommen, ob es Vegetarier gibt oder wie viel Zeit für die Zubereitung bleibt – kann er keine sinnvolle Empfehlung geben. Ein wirklich intelligenter Küchenassistent müsste also nicht nur den Inhalt des Kühlschranks kennen, sondern auch auf den Kalender, frühere Essensvorlieben und vielleicht sogar Bewertungen früherer Gerichte zugreifen können.
Dasselbe Prinzip gilt für KI-Assistenten: Um fundierte Antworten zu liefern und echten Mehrwert zu bieten, reichen konsistente Daten allein nicht aus. Auf Folgendes kommt es an:
Der Kontext ist entscheidend
KI-Agenten in Unternehmen müssen nicht nur auf einzelne Datenquellen zugreifen können, sondern auch den gesamten Kontext verstehen. Wenn ein Unternehmen beispielsweise eine ganzheitliche Sicht auf einen Kunden haben möchte, reichen Daten aus dem CRM allein nicht aus. Erst durch die Kombination mit weiteren Quellen – etwa ERP-Systemen, Ticketing-Tools, Anrufprotokollen oder möglicherweise sogar öffentlich zugängliche Informationen – entsteht ein vollständiges Bild.
Ohne diesen ganzheitlichen Blick bleibt der KI-Agent beschränkt. Er kann nur Teilinformationen liefern, aber keine echten, kontextbezogenen Entscheidungen treffen. Ein smartes System muss daher nicht nur über Daten verfügen, sondern auch die richtigen Verknüpfungen zwischen ihnen herstellen.
Daten intelligent integrieren
In der realen Welt jedoch wird es komplexer – es gibt viel mehr Datenquellen, die berücksichtigt werden müssen, und diese sind riesig. Wenn man beispielsweise eine Frage zu einem Kunden in einem großen Unternehmen hat und eine ganzheitliche Antwort erwartet, muss der Agent auf zahlreiche Datenquellen zugreifen. Der Agent bräuchte dann Zugriff auf das CRM, das ERP, das Ticketing-System, das Forum, die Anrufprotokolle und viele weitere Quellen, die relevante Informationen enthalten könnten. Möglicherweise soll er sogar öffentlich zugängliche Informationen einbeziehen.
Das zeigt auch schon, warum es nicht besonders nützlich ist, viel Geld für limitierte KIs auszugeben, die der CRM-Anbieter mit anbietet. Diese KI hilft mir zwar bei der Arbeit mit dem CRM selbst, ist aber bei breiteren Anfragen auf die Daten nur im CRM beschränkt.
Der Anbieter der im Unternehmen genutzten Datenplattform wird sagen: „Warum kopieren Sie nicht einfach alles in unser System, und unsere KI kümmert sich darum?“ Doch dieses Vorgehen würde zu mehreren Nachteilen führen:
- Strukturinformationen und Metadaten gehen verloren: Beim Übertragen der Daten können wichtige Verknüpfungen oder Kontextinformationen unbemerkt verloren gehen.
- Hoher Speicherverbrauch und Zeitverlust: Je mehr Daten kopiert und synchronisiert werden müssen, desto größer wird der Ressourcenaufwand – man verliert Zeit und Speicherplatz.
- Qualitätseinbußen: Die Ergebnisse werden niemals so gut sein, wie wenn der Agent direkt auf die Originalquelle zugreifen könnte.
Für wirklich fundierte Antworten bedarf es also einer intelligenten Integration der Daten.
Die richtigen Werkzeuge bereitstellen
Werfen wir einmal einen Blick unter die Haube: Wie profitieren Agenten eigentlich von all diesen Informationen? Sie nutzen spezialisierte Unteragenten und manchmal auch weniger agentische Systeme, die als „Tools“ bezeichnet werden. Diese Tools liefern Informationen oder erledigen Aufgaben, die der Hauptagent nicht selbst bewältigen kann. Viele von uns erinnern sich sicher noch daran, dass frühe Chatbots nicht rechnen konnten? Heute greifen sie auf ein Tool zurück, das Berechnungen korrekt durchführt. Genauso würde unser Agent in obigem Beispiel ein Tool nutzen, das vollständige Kundeninformationen bereitstellt.
Dieses Tool stellt aber nicht einfach nur den Zugriff auf CRM oder eines der anderen Systeme her. Warum? Weil es dem Agenten völlig egal ist, wo die Kundendaten gespeichert sind. Er will einfach nur alle relevanten Informationen zu einem Kunden erhalten, um seine Aufgabe mit einer ganzheitlichen Sicht zu erledigen.
Klingt wie eine Datenintegrations-Herausforderung, oder? Genau das ist es auch. Um wirklich leistungsfähige Agenten zu bauen, müssen wir ihnen die richtigen Werkzeuge zur Verfügung stellen: Werkzeuge, die ihnen gezielt die benötigten Informationen liefern, anstatt ihnen bloß unkontrollierten Zugriff auf Datenquellen zu geben. Und genau das ist eine klassische Aufgabe der Dateningenieure.
Kann eine KI manchmal diese Aufgabe übernehmen? Natürlich! Aber für regelmäßig benötigte Informationen (z. B. „Was wissen wir über diesen Kunden?“) lohnt es sich, den zusätzlichen Aufwand zu betreiben und unseren Agenten eine optimierte Sicht auf diese Informationen bereitzustellen.

„Je weniger mühsame Vorarbeit der Agent leisten muss, desto mehr kann er sich auf seine eigentliche Aufgabe konzentrieren – genau wie wir Menschen. Und genau wie zuvor schützt die Entkopplung der Datenintegration von den Datenplattformen auch die Investition in Agenten“, erklärt Michael Berthold, CEO von KNIME. „Auf diese Weise müssen beim Austausch eines der Systeme nur die mittlere Schicht der Integrationstools anpasst werden. Das Data Mesh lebt – gute Daten machen nicht nur Menschen effektiver, sondern helfen nun auch Agenten, ihre Arbeit besser zu erledigen.“
Be the first to comment