KI-System schlägt Menschen beim Lippenlesen

Forscher der University of Oxford haben eine Maschine entwickelt, die mithilfe von Künstlicher Intelligenz (KI) besser Lippenlesen kann als ein Mensch. [...]

LipNet“ greift auf Algorithmen zurück, die gesprochene Worte einer Person aus einem Video rein über das visuelle Erkennen der Lippenbewegungen erfassen. Nach einem Training mit knapp 29.000 Beispielen hat die Software sogar menschliche Konkurrenten überflügelt und eine Trefferquote von rund 93 Prozent erzielt.

Riesiges Anwendungspotenzial
„Lippenlesen spielt eine wichtige Rolle, wenn es um die menschliche Kommunikation und das gegenseitige Verstehen von Sprache geht“, stellen Yannis Assael, Breendan Shillingford, Shimon Whiteson und Nando de Freitas in ihrem wissenschaftlichen Paper zu LipNet klar. Die Forscher vom Department of Computer Science der University of Oxford betonen aber nicht nur den hohen Stellenwert, sondern auch die enorme Schwierigkeit dieser Tätigkeit für Menschen. „Die Lippenbewegungen können oft sehr latent und schwer zu erkennen sein. Deshalb ist der Grad der erzielbaren Genauigkeit bei menschlichen Lippenlesern auch relativ niedrig“, erklären die Wissenschaftler.

Aufgrund dieses Umstands sei es ein erklärtes Ziel des Teams gewesen, diesen Prozess zu automatisieren und gleichzeitig eine deutliche Steigerung der Genauigkeit zu erreichen. „Maschinelle Lippenleser haben ein riesiges Anwendungspotenzial etwa zur Verbesserung von Hörapparaten, für lautlose Diktate auf öffentlichen Plätzen, verdeckte Gespräche in lauten Umgebungen oder biometrische Identifizierungen“, erläutern die Forscher. Zum jetzigen Zeitpunkt sei allerdings noch kein wirklich ausgereiftes Produkt am Markt erhältlich. „Bislang ist es nur möglich, einzelne Wörter aber keine ganzen Sätze zu erkennen“, so die Experten.

Erstmals ganze Sätze erfassbar
Mit LipNet könnte man aber nun endlich das erste System präsentieren, das die Fähigkeit besitzt, auch ganze Sätze von gesprochenen Wörtern zu erfassen. Und das mit einer bis dahin ungeahnten Genauigkeit. Denn in den jüngsten Praxistests hat die KI-Software menschliche Lippenleser in punkto Genauigkeit bereits deutlich überholt: Erstere schaffte es bei der Analyse der Lippenbewegungen von Personen in verschiedenen kurzen Videoclips auf die beachtliche Trefferquote von 93,4 Prozent. „Erfahrene menschliche Lippenleser kommen lediglich auf eine Quote von 79,6 Prozent“, schildern die Wissenschaftler abschließend.


Mehr Artikel

img-2
Case-Study

Komplexe EDI-Integration in SAP S/4HANA

Der Kärntner Lebensmittelproduzent KARNERTA hat mit Unterstützung von EDITEL eine reibungslose Einbindung von Electronic Data Interchange (EDI) in sein neues SAP S/4HANA-System realisiert. Dabei wurden die Daten von mehr als tausend Kunden während des laufenden Betriebes in die neue IT-Systemlandschaft überführt. […]

img-3
News

Supply Chain bleibt Sorgenkind der Industrie

Mehr als zwei Drittel der Unternehmen in der DACH-Region klagen über Engpässe bei ihren Lieferanten. Weitere Belastungen sind Qualitätsprobleme bei den Lieferanten sowie stark gestiegene Transportkosten, wie die aktuelle Studie „Performance-Treiber 2024“ zeigt. […]

img-6
News

KI als treibende Kraft hinter der Cloud-Strategie

Laut einer aktuellen Red-Hat-Studie stehen Investitionen in die Cloud als Geschäftspriorität für 2025 ganz oben auf der Liste der befragten IT-Manager, wobei KI für 82 Prozent eine treibende Kraft ist und gleichzeitig bei 88 Prozent ein erhebliches Qualifikationsdefizit im Bereich KI besteht. […]

img-7
News

Cybersicherheit und Compliance im Fokus

Trend Micro stellt die neueste Ausgabe seines juristischen Leitfadens zur Cybersicherheit und IT-Compliance für Österreich vor. Der Leitfaden wurde im Zuge von NIS2 und DORA überarbeitet. Außerdem beantwortet der Ratgeber Fragen zur DSGVO-Compliance beim Einsatz von Cybersicherheitslösungen und zu den Sicherheitsanforderungen an Cloud-Dienste. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*