„Wollen sichere und positivere Online-Umgebungen schaffen“

Das slowakische Start-up-Unternehmen TrollWall AI hat eine eigene KI entwickelt, mit der Hasskommentare in Social Media erkannt und blockiert werden. ITWELT.at hat zum Start der deutschsprachigen Version Geschäftsführer Tomas Halasz interviewt. [...]

Tomas Halasz, Geschäftsführer von TrollWall AI (c) TrollWall AI
Tomas Halasz, Geschäftsführer von TrollWall AI (c) TrollWall AI

Welches AI-Model verwenden Sie oder ist es eine Eigenentwicklung?

Unsere KI-Systeme werden ausschließlich von unseren eigenen KI-Wissenschaftlern entwickelt. Wir haben eine neurosymbolische Architektur gewählt, die das Beste aus beiden Welten vereint: die enormen Datenverarbeitungsfähigkeiten von Large Language Models und die präzisen Schlussfolgerungsfähigkeiten der symbolischen KI. Dieser Ansatz macht unsere Systeme leistungsfähig bei der Erkennung von Mustern und der Verarbeitung umfangreicher Datensätze und verbessert die Übersichtlichkeit, so dass sie transparenter und leichter zu verstehen sind. Dank dieser Eigenschaften eignen sich unsere Systeme hervorragend für Aufgaben, die ein nuanciertes Verständnis von Sprache und deren Moderation erfordern.

Mit welchen und wievielen Daten haben Sie Ihre Software trainiert?

Wir haben unsere Software anhand einer umfangreichen Datenmenge von mehreren hunderttausend Kommentaren trainiert. Um Genauigkeit und Zuverlässigkeit zu gewährleisten, wurde jeder Kommentar sorgfältig von drei unabhängigen Muttersprachlern mit unterschiedlichem Hintergrund kommentiert, um die Vielfalt und die Beherrschung der jeweiligen Sprache abzubilden und sicherzustellen. Dieser strenge Annotationsprozess gewährleistet die Qualität und Effektivität unserer Software bei der Erkennung und Verwaltung von Hasskommentaren in verschiedenen Sprachen.

Kann das automatisch Blocken von Hasskommentaren durch die Benutzer/Kunden Ihrer Software weiter verfeinert werden?

Unser System wird ständig weiterentwickelt, um das automatische Ausblenden von Hasskommentaren durch Nutzer/Kunden unserer Software zu verbessern. Wir wenden einen systematischen Überprüfungsprozess durch menschliche Kommentatoren an, und stellen so sicher, dass unsere Algorithmen effektiv und aktuell bleiben. Außerdem beziehen wir regelmäßig neue Daten in unseren Trainingsprozess ein, um die Genauigkeit und Präzision unserer Software weiter zu verbessern. Dieser Ansatz ermöglicht uns die Anpassung an die sich entwickelnden Trends und Nuancen in der Online-Kommunikation und stellt sicher, dass unsere Kunden die effektivste Lösung für den Umgang mit Hasskommentaren erhalten.

Ist ein zusätzliches Training mit (unternehmens-)eigenen Daten möglich?

Unser Ziel ist es, unseren Kunden die Möglichkeit zu geben, das Moderationsmodell für ihre Social-Media-Plattformen zu personalisieren. Wir testen diese Funktion derzeit mit ausgewählten Kunden und wollen sie in den kommenden Monaten allgemein verfügbar machen.

Für ein effektives Training von Sprachmodellen ist eine große Menge an hochwertigen Daten erforderlich. Die Sicherstellung der Datenqualität ohne vollständige Kontrolle kann eine Herausforderung sein und die Gesamtqualität des Dienstes beeinträchtigen. Ein wichtiger Aspekt des Dienstes ist die Gewährleistung der Nachvollziehbarkeit. Für unsere Kunden ist es wichtig, die Gründe für die Entscheidungen der KI zu verstehen und jederzeit die volle Transparenz und Kontrolle zu haben.

Werden nur die Hasskommentare blockiert oder auch der jeweilige Absender?

Das Erkennen und Ausblenden von schädlichen Kommentaren ist eine Kernfunktion von TrollWall. Die Nutzer haben jedoch auch die Möglichkeit, bestimmte Trolle mit einer Ein-Klick-Funktion zu blockieren. Das Besondere an dieser Funktion ist, dass sie nicht wie die offizielle Sperrung von Meta funktioniert, bei der der Troll über seine Sperrung benachrichtigt wird. Stattdessen verwendet die Ein-Klick-Funktionalität von TrollWall Shadow Banning. Das bedeutet, dass keiner ihrer Kommentare für andere Besucher der sozialen Seite sichtbar ist, auch wenn der Troll nicht weiß, dass seine Kommentare ausgeblendet sind. Diese Option stellt sicher, dass Trolle keine Aufmerksamkeit oder Plattform erhalten, um ihr störendes Verhalten fortzusetzen.

Wie sieht es mit Kommentaren zu einem Streaming-Event aus? Funktioniert das Blocken in Echtzeit?

Ja, natürlich. Die Echtzeit-Moderationsfähigkeiten unserer Technologie reichen bis hin zum Umgang mit Hasskommentaren bei Streaming-Events. Im Gegensatz zu größeren Modellen wie GPT-4 haben unsere spezialisierten, kleineren Sprachmodelle nicht nur einen deutlich geringeren CO2-Fußabdruck, sondern liefern auch eine viel schnellere Leistung. Diese Effizienz ist für Echtzeitanwendungen wie die Moderation von Livestreams von entscheidender Bedeutung, da wir dadurch anstößige Inhalte schnell erkennen und blockieren können, sobald sie auftauchen. Das Ergebnis ist, dass Streaming-Events sichere und integrative Umgebungen für alle Teilnehmer bleiben. Wir haben unsere Lösung erfolgreich bei hochkarätigen Veranstaltungen eingesetzt, darunter die von vielen mitverfolgte politische Debatte zwischen dem slowakischen und dem tschechischen Präsidenten.

Wo stehen die Server, von denen aus Sie diesen SaaS-Dienst anbieten? Ist die Lösung DSGVO-konform?

Alle unsere Server befinden sich innerhalb der EU und werden auf einer 100 Prozent klimaneutralen Infrastruktur betrieben. Sicherheit hat für TrollWall oberste Priorität, und wir halten uns streng an die DSGVO. Es ist mir wichtig zu betonen, dass wir keine persönlichen Daten verarbeiten oder speichern. Unser Zugriff ist durch die Meta-Richtlinien ausschließlich auf öffentlich zugängliche Kommentare auf den Social-Media-Plattformen unserer Kunden beschränkt. Außerdem ist TrollWall offiziell von Meta zugelassen, wie es für jeden Drittanbieter, der auf Meta-APIs zugreift, erforderlich ist.

Gibt es mehrere Bezahlmodelle und, falls ja, wodurch unterscheiden sich diese?

Wir bieten verschiedene Zahlungsmodelle an, um den unterschiedlichen Bedürfnissen gerecht zu werden. Die Hauptunterschiede zwischen diesen Modellen liegen im Funktionsumfang, im Umfang der bearbeiteten Kommentare und im Umfang des angebotenen Supports.

Unsere Einsteigerpakete beispielsweise sind für kleinere Firmen oder solche mit geringen Anforderungen gedacht. Sie bieten grundlegende Funktionen und Support und sind somit eine kostengünstige Option für den Einstieg in TrollWall AI.

Unsere Premium-Pakete hingegen richten sich an größere Unternehmen mit umfangreichen Anforderungen. Diese Pakete bieten erweiterte Funktionen, höhere Verarbeitungskapazitäten und Premium-Support-Services, um die Anforderungen großer Unternehmen zu erfüllen.

Ein gutes Beispiel für die Unterscheidungsmerkmale zwischen unseren Zahlungsmodellen ist der Schutz von bezahlten Anzeigen vor Hasskommentaren. Da Unternehmen in Werbekampagnen auf Social-Media-Plattformen investieren, ist die Sicherstellung der Integrität und Wirksamkeit dieser Kampagnen von entscheidender Bedeutung.

Insgesamt hängt die Wahl des Zahlungsmodells von Faktoren wie der Größe der Organisation, der benötigten Funktionalität und dem verfügbaren Budget ab. Wir sind bestrebt, flexible Optionen anzubieten, die den unterschiedlichen Bedürfnissen unserer Kunden gerecht werden und sicherstellen, dass sie eine Lösung finden, die ihren spezifischen Anforderungen gerecht wird.

Ihre Lösung richtet sich also sowohl an Großbetriebe als auch an kleine und mittelständische Betriebe…

Ja, TrollWall AI eignet sich sowohl für große Unternehmen als auch für kleine und mittlere Betriebe. Sie richtet sich an Organisationen, denen die Online-Reputation ihrer Marke, der Komfort und die Inklusivität ihrer Online-Communitys sowie die effiziente Verwaltung von sozialen Kommentaren wichtig sind.

Unsere Plattform bietet robuste Funktionen und Skalierbarkeit für größere Unternehmen, Medien- oder Marketingagenturen, um große Mengen an Kommentaren zu verarbeiten und einen umfassenden Markenschutz zu gewährleisten. Sie ermöglicht eine effiziente Moderation und die automatische Entfernung von Hasskommentaren, so dass die Moderatoren der sozialen Medien wertvolle Zeit für den positiven Umgang mit ihrem Publikum gewinnen.

Ebenso profitieren kleine und mittelständische Unternehmen, Influencer und Persönlichkeiten des öffentlichen Lebens von der Zugänglichkeit und Erschwinglichkeit unserer Lösung. Durch die Automatisierung des Moderationsprozesses ermöglicht unsere Plattform den Nutzern, eine positive Online-Präsenz aufrechtzuerhalten, ohne erhebliche Ressourcen in die manuelle Verwaltung von Kommentaren zu investieren.

Unsere Lösung wurde entwickelt, um Organisationen aller Größenordnungen in die Lage zu versetzen, ihre Online-Communities effektiv zu verwalten, ihren Ruf als Marke zu schützen und sich darauf zu konzentrieren, mit ihren Anhängern statt mit ihren Gegnern in Kontakt zu treten.

Wie lange sind Sie mit TrollWall AI bereits in Tschechien, Polen, Rumänien und der Slowakei tätig und wie sind die Kundenerfahrungen?

Wir haben im März unser einjähriges Bestehen gefeiert und damit einen wichtigen Meilenstein für TrollWall AI erreicht. Seit unserer Gründung sind wir erfolgreich in die Slowakei, die Tschechische Republik, Polen, Rumänien und Deutschland expandiert. Wir haben unsere Dienste zunächst in slowakischer und tschechischer Sprache angeboten, da TrollWall AI ursprünglich ein slowakisches Startup ist. Im Jahr 2024 machte TrollWall AI gelang die Erweiterung der Sprachfähigkeiten um Polnisch, Rumänisch und Deutsch, und Englisch ist bereits in Sicht. Unser KI-Team hat eine Dynamik erreicht, die es uns ermöglicht, wöchentlich neue Iterationen unserer Sprachmodelle effizient zu entwickeln und einzusetzen.

Unser Wachstum ist rasant, und wir freuen uns, dass wir von unseren Kunden aus verschiedenen Branchen positives Feedback erhalten haben. Wir hatten das Privileg, mit geschätzten Kunden zusammenzuarbeiten, darunter politische Kampagnen wie die von Präsident Petr Pavel in der Tschechischen Republik und mit dem Stab der slowakischen Präsidentin Zuzana Čaputová. Darüber hinaus haben wir mit landesweiten Medien, PR-Agenturen, Telekommunikationsunternehmen, anderen Unternehmen, NGOs, Sportvereinen und zahlreichen Persönlichkeiten des öffentlichen Lebens zusammengearbeitet.

Insgesamt waren unsere Erfahrungen bei der Zusammenarbeit mit Kunden in diesen Regionen überwältigend positiv, und wir setzen auch weiterhin bei unserer Expansion und Weiterentwicklung auf außergewöhnlichen Service und Mehrwert.

Hintergrundinfo

Info zu Petr Pavel:
Petr Pavel ist ein tschechischer Armeegeneral, der im Jahr 2023 zum Präsidenten der Tschechischen Republik gewählt wurde. Er ist ehemaliger Generalstabschef der tschechischen Streitkräfte und NATO-Kommandeur. Pavel ist eine angesehene Persönlichkeit des tschechischen öffentlichen Lebens, die für ihre Integrität und ihr Engagement für die Demokratie geschätzt wird. 

Info zu Zuzana Čaputová:
Zuzana Čaputová ist die erste Frau, die zur Präsidentin der Slowakei gewählt wurde. Sie ist Juristin und Umweltaktivistin. Čaputová ist für ihre liberalen Ansichten und ihr Engagement für die Menschenrechte bekannt.

Sie sind jetzt in den deutschen, den schweizer und den österreichischen Markt eingestiegen. Welche Märkte werden folgen und wann? Werden Sie weitere Büros/Niederlassungen in diesen Ländern eröffnen?

Wir konzentrieren uns derzeit auf die Erweiterung unserer geografischen Reichweite durch die Einführung neuer Sprachen auf unserer Plattform, die auch unsere folgenden Märkte bestimmen werden. Derzeit freuen wir uns, unsere Dienstleistungen in der Betaversion auf Englisch anbieten zu können, und wir arbeiten fleißig an der Entwicklung weiterer Sprachen gemäß unseren strategischen Markteintrittsplänen.

Als vollständig digitales Unternehmen arbeiten wir nahtlos über Grenzen hinweg und sind stolz auf unsere Fähigkeit, mit Kollegen und Partnern aus über fünf Ländern zusammenzuarbeiten. Da unsere Geschäfte online abgewickelt werden können wir unsere Kunden nahtlos bedienen, ohne einen stationären Standort zu benötigen. Dieser digitale Ansatz ermöglicht es uns, flexibel und kosteneffizient zu arbeiten und für unsere Kunden unabhängig von ihrem geografischen Standort erreichbar zu sein. Wir konzentrieren uns darauf, hochwertige Dienstleistungen effizient und effektiv über unsere digitale Plattform zu erbringen, um unseren Kunden und Partnern einen reibungslosen und optimierten Service zu bieten.

Wie sieht die Weiterentwicklung von TrollWall AI aus – welchen neuen Features sind geplant? Sind weitere Produkte/Lösungen in der Planung? Und falls ja, welche?

TrollWall AI entwickelt ihre Technologie zur Erkennung von Hassreden stetig weiter. Wir wollen bei der Bekämpfung von Hassreden im Internet an vorderster Front bleiben, indem wir unsere Modelle kontinuierlich verbessern. Unser Hauptaugenmerk liegt auf der Verfeinerung der Genauigkeit unserer Erkennungsalgorithmen und der Einführung von zwei neuen Funktionen, um unsere vielfältige Kundschaft besser bedienen zu können.

Erstens wollen wir von einem One-Size-fits-all-Ansatz zu maßgeschneiderten KI-Moderationsmodellen übergehen. Mit diesem Schritt wollen wir unseren Kunden – von denen jeder seine eigene Publikumsdynamik und Moderationsanforderungen hat – die Möglichkeit geben, ihre Moderationstools so fein abzustimmen, als ob sie einen menschlichen Moderator anweisen würden. Diese Anpassung ist unverzichtbar, wenn es darum geht, bestimmte Probleme anzugehen, wie z. B. ungerechtfertigte negative Äußerungen über Produkte oder Dienstleistungen, und ermöglicht eine genauere Kontrolle über die Art der Inhalte, die moderiert werden.

Darüber hinaus stehen wir kurz vor der Einführung unserer KI-Antwortfunktion, mit der wir die Art und Weise, wie unsere Kunden mit ihren Online-Communities interagieren, neu gestalten wollen. Durch den Einsatz von KI zur Erstellung von Antworten auf der Grundlage einer vom Kunden bereitgestellten Wissensdatenbank – von internen Dokumenten bis hin zu FAQs – wird TrollWall menschliche Moderatoren in die Lage versetzen, effektiver und effizienter zu kommunizieren. Diese Funktion soll unseren Kunden dabei helfen, aktive, sinnvolle Interaktionen mit ihrem Publikum zu pflegen und das Engagement in großem Umfang zu fördern.

Diese Entwicklungen unterstreichen das Engagement von TrollWall AI, sicherere und positivere Online-Umgebungen zu schaffen und es gleichzeitig unseren Kunden zu ermöglichen, stärkere Verbindungen mit ihren Followern zu fördern. Unsere laufenden Innovationen und kommenden Produkte zeugen von unserem Engagement für hervorragende KI-gesteuerte Content-Moderation und Community-Engagement.

Weitere Information finden Interessierte hier und unter https://trollwall.ai.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*