KI-Algorithmus erkennt Emotionen in der Stimme

Forscher haben einen Algorithmus entwickelt, der auf Basis Künstlicher Intelligenz (KI) acht verschiedene Basisemotionen nur anhand der Stimme erkennt. [...]

Das neuronale Netzwerk ist von Wissenschaftlern der National Research University Higher School of Economics getestet worden und hatte eine Trefferquote von 71 Prozent. Dennoch bleibt die Emotion Freude aufgrund der Verwechslung mit Ärger ein Rätsel für den KI-Algorithmus.
Ähnelt Bilderkennung
„Die Unterscheidung von acht Basisemotionen angesichts des vielseitigen Ausdrucksspektrums erscheint willkürlich. Zudem gibt es viele verschiedene Modelle, die hier einen Versuch der Klassifizierung vornehmen“, erläutert Peter Purgathofer vom Institut für Gestaltungs- und Wirkungsforschung der TU Wien. Eine Unterscheidung zwischen Freude und Ärger sei deshalb schwierig, da beide Emotionen eine starke Erregung gemein haben. „Zudem ist eine Reduktion auf die Stimme als einzigem Indikator für einen Gemütszustand ein schwieriges Unterfangen“, resümiert Purgathofer.
Zu den in der Studie eingeschlossenen Emotionen zählen Gleichgültigkeit, Gemütsruhe, Freude, Trauer, Ärger, Angst, Ekel sowie Überraschung. Die Forscher haben Sprachaufzeichnungen von 24 Schauspielern, die Phrasen in verschiedenen Stimmungen vorlesen, in Bilder, sogenannte Spektrogramme, transformiert. Dies gab ihnen die Möglichkeit, den Computer – ähnlich wie bei Bilderkennung – mit den Stimmen zu füttern.
Starke Emotionen schwierig
Während das neuronale Netzwerk die Gemütszustände Gleichgültigkeit, Gemütsruhe, Trauer, Ärger, Ekel und Angst präzise aus der Stimme erkannt hat, ist es bei Freude zu Schwierigkeiten gekommen. Freude konnte nur zu 45 Prozent richtig interpretiert werden, da diese Emotion häufig mit Ärger sowie Angst verwechselt wurde. Unterdessen ist Überraschung des Öfteren als Ekel missverstanden worden.
„Unglücklicherweise hat unser neuronales Netzwerk Probleme damit, Freude und Ärger auseinanderzuhalten. Dies liegt daran, dass es sich hierbei um die stärksten Emotionen handelt, die sich auf den Spektrogrammen leicht ähneln“, schildert Studienleiterin Anastasiya Popova. Die Wissenschaftler sind überzeugt, dass der KI-Algorithmus nach einer Überarbeitung zur Verbesserung von Smart Assistants beiträgt.

Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*