Lyrebird: Algorithmus klaut jede Stimme

Das kanadische Start-up Lyrebird hat einen Algorithmus vorgestellt, der laut den Machern jede Stimme nachmachen kann. [...]

Als Grundlage reichen dem Unternehmen zufolge Aufnahmen des Originals von etwa einer Minute Länge. Dann kann das System in der jeweiligen Stimme sagen, was einem beliebt – und das auch mit unterschiedlichem Ausdruck. Als Beispiele dafür müssen Donald Trump, Barack Obama und Hillary Clinton herhalten.
KI lernt nachzuahmen
Lyrebird setzt auf Methoden selbstlernender KI, damit sein System aus einem kompakten Audio-Sample in kurzer Zeit die „Stimm-DNA“ eines Sprechers lernt zu ermitteln. Damit ist es dann möglich, diese Stimme beliebige Text mit einem gewünschten emotionalen Ausdruck vortragen zu lassen. Wirklich perfekt sind die veröffentlichten Beispiele zwar noch nicht. Doch ist der Aufwand wirklich so gering wie vom Start-up behauptet, sind die Ergebnisse beeindruckend – und es scheint durchaus plausibel, dass die Stimmsynthese in nächster Zeit noch besser wird.
Laut dem Hersteller erlaubt das System auch, völlig neue Stimmen von Null weg zu entwickeln. Potenzielle Anwendungen umfassen demnach digitale Assistenten mit personalisierter Stimme, das automatisierte Erstellen von Audiobüchern mit bekannten Sprechern oder Stimmen für Animationsfilme und Videospiele. Das Unternehmen wirft zudem die Frage auf, ob Sprachaufnahmen denn noch als Beweismittel geeignet sind. Offen bleibt dabei, ob und wie Lyrebird selbst Missbrauch verhindern will – immerhin scheint auch denkbar, mit einer ausreichend guten Synthese fremder Stimmen Sicherheitssysteme hereinzulegen, die auf Stimmerkennung basieren.
Beeindruckender Vogel
Lyrebird ist nicht das einzige Unternehmen, das an digitaler Stimmsynthese arbeitet. Beispielsweise hat Adobe im November 2016 mit „Project VoCo“ ein ähnliches System vorgestellt. Dieses braucht aber 20 Minuten an Sample-Dateien, um eine Stimme nachzubilden. Die Kanadier kommen also mit entscheidend weniger Vorlage aus.
Das Unternehmen selbst ist übrigens nach einem Meister der Nachahmung benannt. Lyrebird ist der englische Name der Leierschwänze. Das sind zwei Arten bodenlebender Waldvögel in Australien. Sie sind dafür bekannt, diverse Geräusch in ihr Gesangsrepertoire aufzunehmen, die sie hören. Nachgeahmt wird dabei so ziemlich alles, vom Gesang anderer Vögel über Musikinstrumente und Motorsägen bis hin zu menschlichen Stimmen.

Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*