Glass-App liefert Untertitel für Schwerhörige

Forscher am Georgia Institute of Technology (Georgia Tech) haben mit "Captioning on Glass" eine App für die Google-Datenbrille veröffentlicht, die Schwerhörigen Hilfe bei Gesprächen verspricht. [...]

Denn sie liefert Untertitel auf die Anzeige von Google Glass. Um Sprecher klar zu hören, setzt die Lösung jedoch auf ein Smartphone als Mikrofon. Mit dem System wird es leichter, alltäglichen Konversationen zu folgen, so der selbst höreingeschränkte Informatikprofessor Jim Foley.

„Das System erlaubt Trägern wie mir, sich auf die Lippen und Mimik des Sprechers zu konzentrieren“, betont Foley. Wenn das schon genügt, um das Gegenüber zu verstehen, muss ein Nutzer gar nicht erst auf Untertitel warten und kann sich ganz normal weiter unterhalten. Bei Bedarf kann der Glass-Träger aber auf die Transkription sehen, um einzelne Worte nachzulesen und den Faden nicht zu verlieren. Möglich macht das eine Spracherkennungs-Software. Wirklich gut funktioniert der Ansatz den Forschern zufolge erst durch das Zusammenspiel von Datenbrille und Smartphone.

Zwar umfasst Google Glass selbst ein Mikro, doch dieses ist für den Träger gedacht und daher für die Untertitel-App nicht ideal. „Das Handy ist ein Mikrofon direkt beim Mund des Sprechenden, was Hintergrundgeräusche reduziert und hilft, Fehler zu vermeiden“, erklärt Thad Starner, Informatikprofessor am Georgia Tech. Zudem haben die Experten die Erfahrung gemacht, dass Sprecher mit Smartphone-Mikro eher klare Sätze übermitteln. Ein dritter Vorteil ist, dass die sprechende Person auf dem Display die von der Spracherkennungs-Software erstellten Untertitel sehen und etwaige Fehler auch korrigieren kann.

Einen Nachteil hat es aber, dass das Handy als Mikrofon dient. „Der Glass-Träger muss sein Smartphone jemand anderem geben, um ein Gespräch zu beginnen“, so Starner. Bei Wildfremden ist das natürlich nicht ideal. Allerdings ist das System auch eher für die Nutzung unter Freunden, mit Kollegen oder beispielsweise an der Kasse beim Einkaufen gedacht. Für Interessenten hierzulande kommt noch einschränkend dazu, dass die App vom US-Team natürlich zunächst für das Englische entwickelt wurde.

Ein anderes Projekt des Georgia-Tech-Teams geht noch einen Schritt weiter. „Translation on Glass“ zeigt nicht einfach nur Untertitel, sondern eine Übersetzung an. Der Glass-Träger kann dann seinerseits in sein Glass-Mikro sprechen und sein Gegenüber bekommt einen übersetzten Text auf dem Smartphone-Display angezeigt. Diese Software unterstützt bislang Englisch, Spanisch, Französisch, Russisch, Koreanisch und Japanisch, wurde allerdings noch nicht für ein breiteres Publikum veröffentlicht. (pte)


Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*