Totoy ist ein Startup, das eine gleichnamige auf künstlicher Intelligenz basierende App entwickelt hat, mit der abfotografierte Behördenbriefe übersetzt und in einfacher Sprache wiedergegeben werden können. ITWelt.at hat mit Gründer und CEO Francis Rafal gesprochen. [...]
Die App Totoy wurde in der seit 2022 in Wien bestehenden gemeinnützigen Programmierschule 42 Vienna entwickelt, wo sich die fünf Unternehmensgründer kennengelernt haben. Sie werden bei 42 in einem neu geschaffenen Bereich demnächst ihr Büro beziehen.
Ihr habt euch bei 42 Vienna kennengelernt und dann im Rahmen eurer Ausbildung ein Projekt entwickelt und ein Startup gegründet. Wie war das genau?
Wir sind fünf Studierende des ersten Jahrgangs und haben 2022 begonnen. Wir haben alle unterschiedliche Backgrounds, einer ist Mediziner, ein anderer hat eine Lehre als KFZ-Mechaniker gemacht, einer hat im E-Commerce-Bereich und ein weiterer im Customer Support gearbeitet. Ich habe mich schon unternehmerisch betätigt und im Filmbereich gearbeitet. Wir haben uns alle bei 42 Vienna kennengelernt, wo wir Programmieren lernen wollten. Im November 2022 hatte ich ein Gespräch mit einem Wiener Filmkollegen mit serbisch-ungarischen Wurzeln. Wir haben uns darüber unterhalten, wie schwer es oft für unsere Eltern ist, komplizierte Behördenbriefe zu verstehen. Meine Eltern stammen aus den Philippinen. Sie können zwar Deutsch, aber sie haben Probleme mit dem Juristen- oder Amtsdeutsch. Da hatten wir gerade mit der aufkommenden KI die Idee, wie einfach es wäre, wenn man ein Foto von einem Dokument machen könnte und dann wird der Inhalt in der jeweiligen Muttersprache in einfachen Worten erklärt. Wobei es ChatGPT damals noch nicht gab.
2022/2023 lernte ich programmieren und hatte im März 2023 genug Skills, um einen Prototyp zu bauen. Durch das Studium bei 42 Vienna habe ich gelernt, wie man technische Dokumentationen liest. Denn das ist, was wir bei 42 täglich machen: Wir müssen uns selber Sachen beibringen. Innerhalb von ein, zwei Stunden habe ich zu Hause auf der Apple Shortcuts App – das ist ein No-Code-Builder auf dem iPhone – einen ersten Prototyp gebaut. Es hat funktioniert. Ich habe das meinen Kollegen bei 42 Vienna gezeigt und wir haben zu fünft entschieden, dass wir neben dem Studium an dieser App arbeiten wollen. Im September 2023 haben wir die App unter dem Namen Totoy im App Store gelauncht. Der Name kommt aus dem Filipino. »Totoy, ano ba ‘yan« bedeutet dort »Kleiner Junge, was ist das?«, eine Frage, die ich oft von meinen Eltern hörte, wenn sie etwas in einem Behördenbrief nicht genau verstanden haben.
Totoy ist ein KI-Assistent, der einem hilft, Dokumente in ein paar Sekunden zu verstehen. Künftig wollen wir einen KI-Assistent für alle offiziellen Dinge daraus entwickeln, der einem helfen kann, Formulare auszufüllen und Behördenbriefe, Arztbriefe etc. zu verstehen.
Die Programmierausbildung bei 42 Vienna basiert auf den Programmiersprachen auf C und C++. Ist Totoy in C programmiert?
Die App ist in der Programmiersprache Dart geschrieben, denn damit kann man für mehrere Plattformen entwickeln. Da unsere User nicht unbedingt immer die neuesten Handys haben, war von Anfang an klar, dass die App Multiplattform-fähig sein muss, wenn wir die Menschen erreichen wollen, die Probleme mit Behördenbriefen haben. Mit Dart war das machbar.
Bezieht ihr die Informationen in einfacher Sprache von den Websites der Ministerien oder wandelt ihr das selbst um?
Wir wandeln das selbst um. Wir verwenden ein Large Language Modul. Anfangs haben wir mit OpenAI gearbeitet, mittlerweile sind wir auf das Modell von Microsoft gewechselt. Das hat dieselbe Funktionalität wie jenes von OpenAI, wird aber in der EU gehostet.
Ist die App gratis?
Es ist ein Freemium-Modell. In der kostenlosen Version kann man sich pro Monat fünf einseitige Dokumente erklären lassen. Die Bezahlvariante erlaubt die Erklärung mehrseitiger Dokumente bis zu 50 Fotos von einem Dokument, oder bis zu 100 Seiten starken PDFs. Auch kann man sich eine unlimitierte Anzahl an Dokumenten erklären lassen. Die App ist auch für Unternehmen interessant, die Mitarbeiter beschäftigen, die nicht so gut Deutsch sprechen.
Wie sieht es mit der Haftung aus?
Zuallererst versuchen wir das Problem des Halluzinierens der KI, also falscher Informationen, zu beseitigen. Bevor eine Frage beantwortet wird, instruieren wir das Large Language Model, dass es sich ausschließlich auf den Kontext beziehen soll, der ihm zur Verfügung gestellt wird. Und falls es die Antwort nicht weiß, soll die KI auch sagen, dass es eben die Antwort nicht weiß. Dann schreiben wir die Antwort so um, dass sie einfacher verständlich ist.
Zum zweiten Punkt, ob die generierte Antwort inhaltlich mit dem Originaldokument übereinstimmt oder nicht: In der Entwicklung arbeiten wir mit sogenannten LLM Evals, also Large Language Model Evaluations, um zu überprüfen, ob die Ergebnisse wirklich stimmen. So versuchen wir, die Qualität zu erhöhen. Trotzdem ist es so, dass wir keine Haftung für die Erklärungen übernehmen, da rechtlich immer nur das Original-Dokument gültig ist. Darüber informieren wir natürlich den User bei jeder Anwendung.
Sind schon andere Produkte in der Pipeline?
Es sind schon andere Produkte in der Pipeline, aber generell geht es uns immer um das Problem »funktionaler Analphabetismus«, das ist unsere Unternehmensaufgabe. Wir entwickeln Software-Lösungen, die helfen, die Welt für alle verständlicher zu machen und das Problem funktionaler Analphabetismus zu lösen.
Be the first to comment