Meta stellt KI-Sprachgenerator Voicebox vor

Mit «Voicebox» stellt der Social-Media-Konzern Meta einen KI-Sprachgenerator vor. Der lässt sich in nahezu alle Metaverse-eigenen Plattformen wie Facebook, Instagram, WhatsApp oder auch Meta Quest einsetzen. Noch ist die Handbremse angezogen. [...]

(Quelle: Meta)

Meta Platforms hat am Wochenende einen von künstlicher Intelligenz gesteuerten Sprachgenerator namens Voicebox vorgestellt. Der Konzern selbst spricht dabei von einem «hochmodernen KI-Modell, das Aufgaben der Spracherzeugung wie Bearbeitung, Aufnahme bis hin zur Darstellung eines bestimmten Stiles/Aspektes übernehmen kann, für die es nicht speziell durch kontextbezogenes Lernen trainiert wurde».

Metas CEO Mark Zuckerberg erklärt dazu: «Wir glauben, dass dies wahrscheinlich das vielseitigste sprachgenerative Modell ist, das es gibt. Es handelt sich zwar noch um ein Forschungsprojekt, aber ich glaube, dass wir mit Tools wie diesem eine Menge interessanter Dinge bauen werden».

Das geht konkret mit «Voicebox»

Laut Meta kann Voicebox geschriebenen Text mit verschiedenen Stimmen und Stilen vorlesen und Hintergrundgeräusche in Audioclips beseitigen.

Die Funktion unterstützt derzeit Englisch, Französisch, Deutsch, Spanisch, Polnisch und Portugiesisch und kann, so die Social-Media-Unternehmen», eine Lesung des Textes in jeder dieser Sprachen erzeugen, auch wenn die Sprachprobe und der Text in unterschiedlichen Sprachen vorliegen.

Hier (https://voicebox.metademolab.com/) gibt es Details inklusive abspielbarer Demos, um sich von dem Einsatzgebiet des Sprachgenerators selbst ein Bild zu machen.

Metaverse jetzt KI-gesteuert: So funktioniert «Voicebox»
Quelle: Meta

Ethische Erklärung: Interessant ist das Meta-Statement am Schluss der Webseite.

Hier die Übersetzung der «Ethischen Erklärung»: «Wie bei anderen leistungsstarken neuen KI-Innovationen sind wir uns (=Meta) bewusst, dass diese Technologie das Potenzial für Missbrauch und unbeabsichtigten Schaden birgt.

In diesem Beitrag beschreiben wir, wie wir einen hocheffektiven Klassifikator entwickelt haben, der zwischen authentischer Sprache und mit Voicebox generierten Audiodaten unterscheiden kann, um diese möglichen zukünftigen Risiken zu minimieren. Es gibt viele interessante Anwendungsfälle für generative Sprachmodelle, aber wegen der Risiken des Missbrauchs machen wir das Voicebox-Modell oder den Code derzeit nicht öffentlich zugänglich.

Wir sind der Meinung, dass es wichtig ist, offen mit der KI-Gemeinschaft umzugehen und unsere Forschungsergebnisse zu teilen, um den Stand der Technik in der KI voranzubringen, aber es ist auch notwendig, die richtige Balance zwischen Offenheit und Verantwortung zu finden.»

PCtipp meint: Der Erklärung ist nichts hinzuzufügen. Aber natürlich muss und wird sich Meta daran messen lassen müssen, wann und wie das Unternehmen den Sprachgenerator einsetzt.

Die Strategie ist klar: Erstmal abwarten, Vorsicht ist hier Gold wert. Und immer drauf schauen, was die Konkurrenz mit entsprechenden KI-Modulen macht. Das dürfte jedenfalls zum Großteil das Handeln aller entsprechender Unternehmen, die auf KI-Hard- und Software setzen, bestimmen.

*Daniel Bader: Spezialist für Drucker, Netzwerke, TVs und Heimkino. Aber auch PCs, Smart Home, coole Haushaltsgeräte und alles, was nachhaltig ist, begeistern mich. 


Mehr Artikel

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

News

KI ist das neue Lernfach für uns alle

Die Mystifizierung künstlicher Intelligenz treibt mitunter seltsame Blüten. Dabei ist sie weder der Motor einer schönen neuen Welt, noch eine apokalyptische Gefahr. Sie ist schlicht und einfach eine neue, wenn auch höchst anspruchsvolle Technologie, mit der wir alle lernen müssen, sinnvoll umzugehen. Und dafür sind wir selbst verantwortlich. […]

Case-Study

Erfolgreiche Migration auf SAP S/4HANA

Energieschub für die IT-Infrastruktur von Burgenland Energie: Der Energieversorger hat zusammen mit Tietoevry Austria die erste Phase des Umstieges auf SAP S/4HANA abgeschlossen. Das burgenländische Green-Tech-Unternehmen profitiert nun von optimierten Finanz-, Logistik- und HR-Prozessen und schafft damit die Basis für die zukünftige Entflechtung von Energiebereitstellung und Netzbetrieb. […]

FH-Hon.Prof. Ing. Dipl.-Ing. (FH) Dipl.-Ing. Dr. techn. Michael Georg Grasser, MBA MPA CMC, Leiter FA IT-Infrastruktur der Steiermärkischen Krankenanstaltengesellschaft m.b.H. (KAGes). (c) © FH CAMPUS 02
Interview

Krankenanstalten im Jahr 2030

Um sich schon heute auf die Herausforderungen in fünf Jahren vorbereiten zu können, hat die Steiermärkische Krankenanstaltengesellschaft (KAGes) die Strategie 2030 formuliert. transform! sprach mit Michael Georg Grasser, Leiter der Fachabteilung IT-Infrastruktur. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*