Mit Software die Welt verständlicher machen

Totoy ist ein Startup, das eine gleichnamige auf künstlicher Intelligenz basierende App entwickelt hat, mit der abfotografierte Behördenbriefe übersetzt und in einfacher Sprache wiedergegeben werden können. ITWelt.at hat mit Gründer und CEO Francis Rafal gesprochen. [...]

Francis Rafal ist Mitgründer und CEO von Totoy. Er hält auch zahlreiche Vorträge über Totoy. (c) 42 Vienna / Landin Soroko
Francis Rafal ist Mitgründer und CEO von Totoy. Er hält auch zahlreiche Vorträge über Totoy. (c) 42 Vienna / Landin Soroko

Die App Totoy wurde in der seit 2022 in Wien bestehenden gemeinnützigen Programmierschule 42 Vienna entwickelt, wo sich die fünf Unternehmensgründer kennengelernt haben. Sie werden bei 42 in einem neu geschaffenen Bereich demnächst ihr Büro beziehen. 

Ihr habt euch bei 42 Vienna kennengelernt und dann im Rahmen eurer Ausbildung ein Projekt entwickelt und ein Startup gegründet. Wie war das genau?

Wir sind fünf Studierende des ersten Jahrgangs und haben 2022 begonnen. Wir haben alle unterschiedliche Backgrounds, einer ist Mediziner, ein anderer hat eine Lehre als KFZ-Mechaniker gemacht, einer hat im E-Commerce-Bereich und ein weiterer im Customer Support gearbeitet. Ich habe mich schon unternehmerisch betätigt und im Filmbereich gearbeitet. Wir haben uns alle bei 42 Vienna kennengelernt, wo wir Programmieren lernen wollten. Im November 2022 hatte ich ein Gespräch mit einem Wiener Filmkollegen mit serbisch-ungarischen Wurzeln. Wir haben uns darüber unterhalten, wie schwer es oft für unsere Eltern ist, komplizierte Behördenbriefe zu verstehen. Meine Eltern stammen aus den Philippinen. Sie können zwar Deutsch, aber sie haben Probleme mit dem Juristen- oder Amtsdeutsch. Da hatten wir gerade mit der aufkommenden KI die Idee, wie einfach es wäre, wenn man ein Foto von einem Dokument machen könnte und dann wird der Inhalt in der jeweiligen Muttersprache in einfachen Worten erklärt. Wobei es ChatGPT damals noch nicht gab. 

2022/2023 lernte ich programmieren und hatte im März 2023 genug Skills, um einen Prototyp zu bauen. Durch das Studium bei 42 Vienna habe ich gelernt, wie man technische Dokumentationen liest. Denn das ist, was wir bei 42 täglich machen: Wir müssen uns selber Sachen beibringen. Innerhalb von ein, zwei Stunden habe ich zu Hause auf der Apple Shortcuts App – das ist ein No-Code-Builder auf dem iPhone – einen ersten Prototyp gebaut. Es hat funktioniert. Ich habe das meinen Kollegen bei 42 Vienna gezeigt und wir haben zu fünft entschieden, dass wir neben dem Studium an dieser App arbeiten wollen. Im September 2023 haben wir die App unter dem Namen Totoy im App Store gelauncht. Der Name kommt aus dem Filipino. »Totoy, ano ba ‘yan« bedeutet dort »Kleiner Junge, was ist das?«, eine Frage, die ich oft von meinen Eltern hörte, wenn sie etwas in einem Behördenbrief nicht genau verstanden haben. 

Totoy ist ein KI-Assistent, der einem hilft, Dokumente in ein paar Sekunden zu verstehen. Künftig wollen wir einen KI-Assistent für alle offiziellen Dinge daraus entwickeln, der einem helfen kann, Formulare auszufüllen und Behördenbriefe, Arztbriefe etc. zu verstehen.

So funktioniert Totoy: Behördendokument einfach abfotografieren und danach in einfacher Sprache, z. B. auf Deutsch, Englisch oder Filipino, lesen. Für die App wurde Totoy mit dem A1 Startup Award ausgezeichnet. Die App wurde bisher 15.000 mal heruntergeladen und hat 7.000 aktive User.(c) Francis Rafal / Totoy

Die Programmierausbildung bei 42 Vienna basiert auf den Programmiersprachen auf C und C++. Ist Totoy in C programmiert? 

Die App ist in der Programmiersprache Dart geschrieben, denn damit kann man für mehrere Plattformen entwickeln. Da unsere User nicht unbedingt immer die neuesten Handys haben, war von Anfang an klar, dass die App Multiplattform-fähig sein muss, wenn wir die Menschen erreichen wollen, die Probleme mit Behördenbriefen haben. Mit Dart war das machbar.  

Bezieht ihr die Informationen in einfacher Sprache von den Websites der Ministerien oder wandelt ihr das selbst um? 

Wir wandeln das selbst um. Wir verwenden ein Large Language Modul. Anfangs haben wir mit OpenAI gearbeitet, mittlerweile sind wir auf das Modell von Microsoft gewechselt. Das hat dieselbe Funktionalität wie jenes von OpenAI, wird aber in der EU gehostet. 

Ist die App gratis?

Es ist ein Freemium-Modell. In der kostenlosen Version kann man sich pro Monat fünf einseitige Dokumente erklären lassen. Die Bezahlvariante erlaubt die Erklärung mehrseitiger Dokumente bis zu 50 Fotos von einem Dokument, oder bis zu 100 Seiten starken PDFs. Auch kann man sich eine unlimitierte Anzahl an Dokumenten erklären lassen.  Die App ist auch für Unternehmen interessant, die Mitarbeiter beschäftigen, die nicht so gut Deutsch sprechen.  

Wie sieht es mit der Haftung aus?  

Zuallererst versuchen wir das Problem des Halluzinierens der KI, also falscher Informationen, zu beseitigen. Bevor eine Frage beantwortet wird, instruieren wir das Large Language Model, dass es sich ausschließlich auf den Kontext beziehen soll, der ihm zur Verfügung gestellt wird. Und falls es die Antwort nicht weiß, soll die KI auch sagen, dass es eben die Antwort nicht weiß. Dann schreiben wir die Antwort so um, dass sie einfacher verständlich ist. 

Zum zweiten Punkt, ob die generierte Antwort inhaltlich mit dem Originaldokument übereinstimmt oder nicht: In der Entwicklung arbeiten wir mit sogenannten LLM Evals, also Large Language Model Evaluations, um zu überprüfen, ob die Ergebnisse wirklich stimmen. So versuchen wir, die Qualität zu erhöhen. Trotzdem ist es so, dass wir keine Haftung für die Erklärungen übernehmen, da rechtlich immer nur das Original-Dokument gültig ist. Darüber informieren wir natürlich den User bei jeder Anwendung. 

Sind schon andere Produkte in der Pipeline? 

Es sind schon andere Produkte in der Pipeline, aber generell geht es uns immer um das Problem »funktionaler Analphabetismus«, das ist unsere Unternehmensaufgabe. Wir entwickeln Software-Lösungen, die helfen, die Welt für alle verständlicher zu machen und das Problem funktionaler Analphabetismus zu lösen.


Mehr Artikel

News

KI ist das neue Lernfach für uns alle

Die Mystifizierung künstlicher Intelligenz treibt mitunter seltsame Blüten. Dabei ist sie weder der Motor einer schönen neuen Welt, noch eine apokalyptische Gefahr. Sie ist schlicht und einfach eine neue, wenn auch höchst anspruchsvolle Technologie, mit der wir alle lernen müssen, sinnvoll umzugehen. Und dafür sind wir selbst verantwortlich. […]

Case-Study

Erfolgreiche Migration auf SAP S/4HANA

Energieschub für die IT-Infrastruktur von Burgenland Energie: Der Energieversorger hat zusammen mit Tietoevry Austria die erste Phase des Umstieges auf SAP S/4HANA abgeschlossen. Das burgenländische Green-Tech-Unternehmen profitiert nun von optimierten Finanz-, Logistik- und HR-Prozessen und schafft damit die Basis für die zukünftige Entflechtung von Energiebereitstellung und Netzbetrieb. […]

FH-Hon.Prof. Ing. Dipl.-Ing. (FH) Dipl.-Ing. Dr. techn. Michael Georg Grasser, MBA MPA CMC, Leiter FA IT-Infrastruktur der Steiermärkischen Krankenanstaltengesellschaft m.b.H. (KAGes). (c) © FH CAMPUS 02
Interview

Krankenanstalten im Jahr 2030

Um sich schon heute auf die Herausforderungen in fünf Jahren vorbereiten zu können, hat die Steiermärkische Krankenanstaltengesellschaft (KAGes) die Strategie 2030 formuliert. transform! sprach mit Michael Georg Grasser, Leiter der Fachabteilung IT-Infrastruktur. […]

News

Risiken beim Einsatz von GenAI in vier Schritten senken

Die Themen Datenschutz und Modellverwaltung sind in der Datenwissenschaft zwar nicht neu, doch GenAI hat ihnen eine neue Dimension der Komplexität verliehen, die Datenschutzbeauftragte vor neue Herausforderungen stellt. Die Data-Science-Spezialisten von KNIME haben die Potenziale und Risiken der KI-Nutzung beim Einsatz bei der Datenarbeit zusammengefasst und empfehlen vier Schritte zur Risikominimierung. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*