Der Markt für die Generierung natürlicher Sprache (Natural Language Generation) durch Künstliche Intelligenz (KI) hat sich sprunghaft weiterentwickelt. Doch fehlende Quellentransparenz oder generierte Falschaussagen trüben die Euphorie – vor allem in der Medien- und Contentbranche. Das hybride Modell der Ella Media AG vereint jetzt schnell erreichbare sprachliche Vielfalt mit Faktentreue. [...]
Effizient automatisierte Inhalte mit minimalen Anweisungen erstellen: Innovative Sprachmodelle schaffen aktuell alltägliche Berührungspunkte mit KI für jedermann und können die Contentproduktion von Grund auf verändern.
Doch die eindrucksvollen Tools bringen auch Probleme mit sich. Denn ChatGPT & Co. liefern keinen qualitätsgesicherten Output: Ihre Modelle aggregieren Texte nach Mustern, die in ihren vielfältigen Trainingsdaten vorliegen.
Faktentreue garantieren sie dabei nicht. Ob eine Information im richtigen Kontext steht oder eine verlässliche Quelle hat, bleibt unklar – menschliche Expertise ist gefragt, um mögliche Falschaussagen zu identifizieren. Vor allem für den Journalismus ist Faktentreue unbedingt erforderlich.
Das Beste aus zwei Welten
Für seine KI-Softwarelösungen hat das MediaTech-Unternehmen Ella deshalb das hybride Modell „Gaspito“ entwickelt. Speziell für das journalistische Umfeld und die deutsche Sprache geschaffen, verbindet es die Stärken des Sprachmodells GPT-3 mit denen des eigens entwickelten Sprachmodells Maskito.
Im Gegenzug gleichen sich die Schwächen der Modelle gegenseitig aus. Maskito zeichne sich durch eine hohe Faktentreue und inhaltliche Nähe zum Originaltext aus. Es wird durch ein großes Softwarepaket ergänzt, mit dem sich beispielsweise Fakten überprüfen lassen.
Aufgrund der inhaltlichen Nähe zum Original kann das Modell jedoch oft keine großen Veränderungen am Text vornehmen – genau das ist allerdings von Nutzer:innen gewünscht. GPT-3 hingegen verändert Originaltexte in hohem Maße und erstellt hochwertige Texte schnell und effektiv.
Doch es hat zwei Nachteile: Zum einen variiert es nicht alle Teile des Textes gleich stark, zum anderen genügen Faktentreue und Quellentransparenz des Outputs oft nicht den journalistischen Qualitätsstandards.
Durch die Kombination der beiden Modelle generiert das hybride Sprachmodell Gaspito kreativen Content – und erreicht dabei eine bessere Textqualität sowie eine hohe Faktensicherheit bei hoher sprachlicher Vielfalt für uniquen Content, heißt es weiter.
Qualität hat oberste Priorität
Für ein optimales Ergebnis arbeitet Gaspito in zwei Stufen: Nutzer:innen wählen über die KI-Assistant-Tools zunächst die gewünschten Quellen aus.
Dies sichere Quellentransparenz und hochwertigen Original-Content. Im ersten Schritt generiert GPT-3 daraus einen neuen, sprachlich stark veränderten Text. Im zweiten Schritt verändert Maskito die Abschnitte des Textes mit verschiedenen Verfahren, die GPT-3 zuvor nicht verändert hat.
Im Gegensatz zu beispielsweise ChatGPT prüft das hybride Modell den generierten Text außerdem auf faktische Korrektheit. Dazu gleichen zusätzliche Software und Überprüfungsmechanismen den Text mit dem Original ab. Kommen von Entwickler:innen als Fakten definierte Originalzitate, Eigennamen oder Daten im generierten Text nicht vor, korrigiert das hybride Modell dies.
Zusätzlich, so die Macher, sichert Ellas speziell entwickeltes Fact-Checking-Modell die Faktentreue der Textabschnitte, die Maskito generiert hat. Es erkennt und bewertet auch implizite Fakten, Zusammenhänge oder Änderungen im Vergleich zum Originaltext.
Sowohl diese Einschätzung als auch der direkte Abgleich fließen zusammen mit weiteren Faktoren in die Gesamtbewertung des Textes ein. Sind bestimmte Teile unzureichend, verändert oder ersetzt Maskito diese, um den hohen Qualitätsanforderungen von Ella gerecht zu werden.
Dabei geht jedoch Faktentreue vor sprachlicher Unterschiedlichkeit: Wenn nach der Anwendung von GPT-3 und Maskito immer noch keine ausreichend gute Textvariante vorliegt, nutzen die KI-Softwarelösungen von Ella stattdessen den Originaltext, um keine Falschinformationen zu verbreiten.
Spezialisierung auf einem Markt von Generalisten
Inzwischen existieren etliche Generative-AI-Tools, die mehr bieten als bloßes Paraphrasieren. Doch sie sind oft Generalisten mit breit gefächerten Trainingsdaten. Ella hingegen hat sich auf die Medien- und Contentbranche spezialisiert.
„Durch unsere Media-first-Lösungen können wir den Prozess der automatisierten Texterstellung auf die spezifischen Bedürfnisse und Anforderungen der Branche zuschneiden. Dabei helfen uns auch unsere Pilotkunden, mit denen wir unsere Tools und Modelle testen“, sagt Nasrin Saef, Head of Machine Learning im Ella-Lab.
„Durch die Einbindung von GPT-3 eröffnen sich neue Möglichkeiten. Gerade arbeiten wir an zahlreichen neuen Features, wie einem Bullet-to-text-Feature, einem Summary-Feature und einem Headline-Generator.“
„Unser Ziel ist es, die Medien- und Contentbranche durch automatisierte, hochwertige Texterstellung und -verarbeitung zu revolutionieren“, sagt Michael Keusgen, CEO von Ella.
„Durch umfassende automatisierte und menschliche Qualitätsüberprüfungen garantieren wir sowohl hinsichtlich der Trainingsdaten als auch des erzeugten Contents eine hohe Qualität nach journalistischen Standards.“
Nutzer:innen haben die volle Kontrolle über ihre Texte – ob Variation, Ursprung der Inhalte oder Überprüfung der faktischen Korrektheit. Sie bekommen damit genau die automatisierte Lösung, die sie im Arbeitsalltag benötigen und die sie tatsächlich entlastet.
„Aktuell evaluieren wir an welchen Stellen für welche Anwendungsfälle GPT-4 einen Mehrwert bietet und an welchen Stellen wir es nutzen wollen”, so Ellas Deep Learning Architect, Michael Janz.
Be the first to comment