Mit Software die Welt verständlicher machen

Totoy ist ein Startup, das eine gleichnamige auf künstlicher Intelligenz basierende App entwickelt hat, mit der abfotografierte Behördenbriefe übersetzt und in einfacher Sprache wiedergegeben werden können. ITWelt.at hat mit Gründer und CEO Francis Rafal gesprochen. [...]

Francis Rafal ist Mitgründer und CEO von Totoy. Er hält auch zahlreiche Vorträge über Totoy. (c) 42 Vienna / Landin Soroko
Francis Rafal ist Mitgründer und CEO von Totoy. Er hält auch zahlreiche Vorträge über Totoy. (c) 42 Vienna / Landin Soroko

Die App Totoy wurde in der seit 2022 in Wien bestehenden gemeinnützigen Programmierschule 42 Vienna entwickelt, wo sich die fünf Unternehmensgründer kennengelernt haben. Sie werden bei 42 in einem neu geschaffenen Bereich demnächst ihr Büro beziehen. 

Ihr habt euch bei 42 Vienna kennengelernt und dann im Rahmen eurer Ausbildung ein Projekt entwickelt und ein Startup gegründet. Wie war das genau?

Wir sind fünf Studierende des ersten Jahrgangs und haben 2022 begonnen. Wir haben alle unterschiedliche Backgrounds, einer ist Mediziner, ein anderer hat eine Lehre als KFZ-Mechaniker gemacht, einer hat im E-Commerce-Bereich und ein weiterer im Customer Support gearbeitet. Ich habe mich schon unternehmerisch betätigt und im Filmbereich gearbeitet. Wir haben uns alle bei 42 Vienna kennengelernt, wo wir Programmieren lernen wollten. Im November 2022 hatte ich ein Gespräch mit einem Wiener Filmkollegen mit serbisch-ungarischen Wurzeln. Wir haben uns darüber unterhalten, wie schwer es oft für unsere Eltern ist, komplizierte Behördenbriefe zu verstehen. Meine Eltern stammen aus den Philippinen. Sie können zwar Deutsch, aber sie haben Probleme mit dem Juristen- oder Amtsdeutsch. Da hatten wir gerade mit der aufkommenden KI die Idee, wie einfach es wäre, wenn man ein Foto von einem Dokument machen könnte und dann wird der Inhalt in der jeweiligen Muttersprache in einfachen Worten erklärt. Wobei es ChatGPT damals noch nicht gab. 

2022/2023 lernte ich programmieren und hatte im März 2023 genug Skills, um einen Prototyp zu bauen. Durch das Studium bei 42 Vienna habe ich gelernt, wie man technische Dokumentationen liest. Denn das ist, was wir bei 42 täglich machen: Wir müssen uns selber Sachen beibringen. Innerhalb von ein, zwei Stunden habe ich zu Hause auf der Apple Shortcuts App – das ist ein No-Code-Builder auf dem iPhone – einen ersten Prototyp gebaut. Es hat funktioniert. Ich habe das meinen Kollegen bei 42 Vienna gezeigt und wir haben zu fünft entschieden, dass wir neben dem Studium an dieser App arbeiten wollen. Im September 2023 haben wir die App unter dem Namen Totoy im App Store gelauncht. Der Name kommt aus dem Filipino. »Totoy, ano ba ‘yan« bedeutet dort »Kleiner Junge, was ist das?«, eine Frage, die ich oft von meinen Eltern hörte, wenn sie etwas in einem Behördenbrief nicht genau verstanden haben. 

Totoy ist ein KI-Assistent, der einem hilft, Dokumente in ein paar Sekunden zu verstehen. Künftig wollen wir einen KI-Assistent für alle offiziellen Dinge daraus entwickeln, der einem helfen kann, Formulare auszufüllen und Behördenbriefe, Arztbriefe etc. zu verstehen.

So funktioniert Totoy: Behördendokument einfach abfotografieren und danach in einfacher Sprache, z. B. auf Deutsch, Englisch oder Filipino, lesen. Für die App wurde Totoy mit dem A1 Startup Award ausgezeichnet. Die App wurde bisher 15.000 mal heruntergeladen und hat 7.000 aktive User.(c) Francis Rafal / Totoy

Die Programmierausbildung bei 42 Vienna basiert auf den Programmiersprachen auf C und C++. Ist Totoy in C programmiert? 

Die App ist in der Programmiersprache Dart geschrieben, denn damit kann man für mehrere Plattformen entwickeln. Da unsere User nicht unbedingt immer die neuesten Handys haben, war von Anfang an klar, dass die App Multiplattform-fähig sein muss, wenn wir die Menschen erreichen wollen, die Probleme mit Behördenbriefen haben. Mit Dart war das machbar.  

Bezieht ihr die Informationen in einfacher Sprache von den Websites der Ministerien oder wandelt ihr das selbst um? 

Wir wandeln das selbst um. Wir verwenden ein Large Language Modul. Anfangs haben wir mit OpenAI gearbeitet, mittlerweile sind wir auf das Modell von Microsoft gewechselt. Das hat dieselbe Funktionalität wie jenes von OpenAI, wird aber in der EU gehostet. 

Ist die App gratis?

Es ist ein Freemium-Modell. In der kostenlosen Version kann man sich pro Monat fünf einseitige Dokumente erklären lassen. Die Bezahlvariante erlaubt die Erklärung mehrseitiger Dokumente bis zu 50 Fotos von einem Dokument, oder bis zu 100 Seiten starken PDFs. Auch kann man sich eine unlimitierte Anzahl an Dokumenten erklären lassen.  Die App ist auch für Unternehmen interessant, die Mitarbeiter beschäftigen, die nicht so gut Deutsch sprechen.  

Wie sieht es mit der Haftung aus?  

Zuallererst versuchen wir das Problem des Halluzinierens der KI, also falscher Informationen, zu beseitigen. Bevor eine Frage beantwortet wird, instruieren wir das Large Language Model, dass es sich ausschließlich auf den Kontext beziehen soll, der ihm zur Verfügung gestellt wird. Und falls es die Antwort nicht weiß, soll die KI auch sagen, dass es eben die Antwort nicht weiß. Dann schreiben wir die Antwort so um, dass sie einfacher verständlich ist. 

Zum zweiten Punkt, ob die generierte Antwort inhaltlich mit dem Originaldokument übereinstimmt oder nicht: In der Entwicklung arbeiten wir mit sogenannten LLM Evals, also Large Language Model Evaluations, um zu überprüfen, ob die Ergebnisse wirklich stimmen. So versuchen wir, die Qualität zu erhöhen. Trotzdem ist es so, dass wir keine Haftung für die Erklärungen übernehmen, da rechtlich immer nur das Original-Dokument gültig ist. Darüber informieren wir natürlich den User bei jeder Anwendung. 

Sind schon andere Produkte in der Pipeline? 

Es sind schon andere Produkte in der Pipeline, aber generell geht es uns immer um das Problem »funktionaler Analphabetismus«, das ist unsere Unternehmensaufgabe. Wir entwickeln Software-Lösungen, die helfen, die Welt für alle verständlicher zu machen und das Problem funktionaler Analphabetismus zu lösen.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*