Stimmgewirr: Neuer Sensor hilft Technik beim Hören

Bislang haben technische Lösungen wie Hörgeräte oder Apples Sprachassistent Siri im Klanggewirr einer Party Probleme, eine einzelne relevante Stimme herauszufiltern. Doch eine Entwicklung von Forschern der Duke University verspricht Abhilfe. Denn ihr Sensor kann effektiv erkennen, aus welcher Richtung Geräusche kommen und sie dadurch klar voneinander unterscheiden. Der Prototyp ist zwar noch recht groß. Doch gelingt eine Miniaturisierung, wäre die die Technologie interessant für Anwendungen von der Sprachsteuerung bis hin zu Cochlea-Implantaten. [...]

Auf einer lauten Party bekommen Hörgerät-Träger oft wenig mit, da sie keinen einzelnen Sprecher deutlich verstehen, während iPhone-Besitzer fast schon ins Gerät beißen müssen, um Siri zu nutzen. Entsprechend attraktiv wären Sensoren, die wie das menschliche Gehör eine einzelne Stimme sauber herausfiltern können. Eben das stellen die Duke-Forscher mit einem Gerät in Aussicht, das einer Torte mit dutzenden Stücken und Wabenstruktur an der Oberfläche gleicht. Eben diese Struktur ist es, die es letztlich ermöglicht, Schall aus unterschiedlichen Richtungen zu unterscheiden.

Die Wabenstruktur besteht nämlich aus unterschiedlich starken Vertiefungen, die ähnlich wie eine teilweise gefüllte Flasche, über deren Hals man bläst, einen Ton abgeben. „Die Tiefe der Löcher bestimmt die Tonhöhe, was eintreffenden Schall leicht, aber messbar verändert“, sagt Steve Cummer, Professor für Elektro- und Computertechnik an der Duke University. Diese Verzerrung von außen kommender Klänge ist dabei für jedes „Tortenstück“ des Sensors etwas anders. Wenn Schall auf das Mikrofon in der Mitte der Konstruktion trifft, ist daher ermittelbar, woher er gekommen ist.

In Experimenten haben die Wissenschaftler drei Kopien des exakt gleichen Schallsignals aus unterschiedlichen Richtungen auf den Sensor fallen lassen. Dabei war der Prototyp mit 96,7 Prozent Genauigkeit in der Lage, die drei Geräusche korrekt auseinanderzuhalten. Allerdings hat das Gerät noch gut 15 Zentimeter Durchmesser, was für portable Elektronik zu viel ist. Die ausreichende Miniaturisierung sei eine wesentliche, aber bewältigbare Herausforderung, so die Forscher. Da der Waben-Torte aus Kunststoff besteht und keine beweglichen Teile hat, sei der Sensor jedenfalls sehr effizient und zuverlässig.

Das Potenzial der Entwicklung ist den Forschern zufolge sehr groß. „Wir sind der Ansicht, dass das die Leistung von sprachgesteuerten Geräten wie Smartphones und Spielkonsolen verbessern kann und dabei zugleich die Komplexität der Systeme reduziert“, sagt Duke-Doktorand Abel Xie. Auch elektronische Hörhilfen, ob nun externe Geräte oder Implantate, könnten profitieren. Zudem könnte das Konzept neue Möglichkeiten eröffnen. „Ich denke, dass es mit medizinischen bildgebenden Verfahren wie Ultraschall kombiniert werden könnte, um nicht nur aktuelle Verfahren zu verbessern, sondern völlig neue zu schaffen“, meint Xie. (pte)


Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*