22. Dezember 2024

Meta stellt KI-Sprachgenerator Voicebox vor

Mit «Voicebox» stellt der Social-Media-Konzern Meta einen KI-Sprachgenerator vor. Der lässt sich in nahezu alle Metaverse-eigenen Plattformen wie Facebook, Instagram, WhatsApp oder auch Meta Quest einsetzen. Noch ist die Handbremse angezogen. [...]

slider_zuckerberg.facebookjpg_w960_h637 — (Quelle: Meta)

Meta Platforms hat am Wochenende einen von künstlicher Intelligenz gesteuerten Sprachgenerator namens Voicebox vorgestellt. Der Konzern selbst spricht dabei von einem «hochmodernen KI-Modell, das Aufgaben der Spracherzeugung wie Bearbeitung, Aufnahme bis hin zur Darstellung eines bestimmten Stiles/Aspektes übernehmen kann, für die es nicht speziell durch kontextbezogenes Lernen trainiert wurde».

Metas CEO Mark Zuckerberg erklärt dazu: «Wir glauben, dass dies wahrscheinlich das vielseitigste sprachgenerative Modell ist, das es gibt. Es handelt sich zwar noch um ein Forschungsprojekt, aber ich glaube, dass wir mit Tools wie diesem eine Menge interessanter Dinge bauen werden».

Das geht konkret mit «Voicebox»

Laut Meta kann Voicebox geschriebenen Text mit verschiedenen Stimmen und Stilen vorlesen und Hintergrundgeräusche in Audioclips beseitigen.

Die Funktion unterstützt derzeit Englisch, Französisch, Deutsch, Spanisch, Polnisch und Portugiesisch und kann, so die Social-Media-Unternehmen», eine Lesung des Textes in jeder dieser Sprachen erzeugen, auch wenn die Sprachprobe und der Text in unterschiedlichen Sprachen vorliegen.

Hier (https://voicebox.metademolab.com/) gibt es Details inklusive abspielbarer Demos, um sich von dem Einsatzgebiet des Sprachgenerators selbst ein Bild zu machen.

Metaverse jetzt KI-gesteuert: So funktioniert «Voicebox»
Quelle: Meta

Ethische Erklärung: Interessant ist das Meta-Statement am Schluss der Webseite.

Hier die Übersetzung der «Ethischen Erklärung»: «Wie bei anderen leistungsstarken neuen KI-Innovationen sind wir uns (=Meta) bewusst, dass diese Technologie das Potenzial für Missbrauch und unbeabsichtigten Schaden birgt.

In diesem Beitrag beschreiben wir, wie wir einen hocheffektiven Klassifikator entwickelt haben, der zwischen authentischer Sprache und mit Voicebox generierten Audiodaten unterscheiden kann, um diese möglichen zukünftigen Risiken zu minimieren. Es gibt viele interessante Anwendungsfälle für generative Sprachmodelle, aber wegen der Risiken des Missbrauchs machen wir das Voicebox-Modell oder den Code derzeit nicht öffentlich zugänglich.

Wir sind der Meinung, dass es wichtig ist, offen mit der KI-Gemeinschaft umzugehen und unsere Forschungsergebnisse zu teilen, um den Stand der Technik in der KI voranzubringen, aber es ist auch notwendig, die richtige Balance zwischen Offenheit und Verantwortung zu finden.»

PCtipp meint: Der Erklärung ist nichts hinzuzufügen. Aber natürlich muss und wird sich Meta daran messen lassen müssen, wann und wie das Unternehmen den Sprachgenerator einsetzt.

Die Strategie ist klar: Erstmal abwarten, Vorsicht ist hier Gold wert. Und immer drauf schauen, was die Konkurrenz mit entsprechenden KI-Modulen macht. Das dürfte jedenfalls zum Großteil das Handeln aller entsprechender Unternehmen, die auf KI-Hard- und Software setzen, bestimmen.

*Daniel Bader: Spezialist für Drucker, Netzwerke, TVs und Heimkino. Aber auch PCs, Smart Home, coole Haushaltsgeräte und alles, was nachhaltig ist, begeistern mich.

Franz Pichler ist Gründer und Geschäftsführer von spusu. (c) spusu

spusu gewinnt 2024 150.000 Neukunden

20. Dezember 2024 pi/cb

Der Mobilfunkanbieter spusu hat 2024 mit einem Zuwachs von 150.000 Neukunden und einem Umsatzplus von 19,4 Prozent ein Rekordjahr hingelegt. […]

Damir Leko, Country General Manager bei Nexi in Österreich (c) Nexi Austria GmbH

E-Commerce in Österreich: Vielfalt beim Bezahlen als Schlüssel zum Erfolg

20. Dezember 2024 pi/cb

Der österreichische Online-Handel verzeichnet einen bemerkenswerten Aufschwung: Die digitalen Ausgaben stiegen 2023 auf über 14 Milliarden Euro. Flexible Zahlungsmethoden und innovative Technologien wie „Tap to Pay“ prägen die Einkaufswelt. […]

v.l.n.r.: Daniela Drakulic, Helene Baumgartner, Nadia Tor, Nicol Weghofer, Marcel Aberle, Tatjana Lulevic-Heyny (c) 42 Vienna

42 Vienna: Top-Experten und Epertinnen beim CorporateMeetsStudents Event

20. Dezember 2024 pi/kdl

Über 150 Teilnehmer und Teilnehmernnen aus Wirtschaft, IT und Bildung kamen zum CorporateMeetsStudents Event am Campus 42 Vienna zusammen. Im Mittelpunkt der Diskussionen stand die zentrale Rolle von Software-Kompetenz nicht nur für das Wirtschaftswachstum, sondern auch für die gesamtgesellschaftliche Entwicklung Österreichs. […]

Digital wie im echten Leben: Ballast abzuwerfen, Räume reinigen und entrümpeln, um sich auf das kommende Jahr vorzubereiten. (c) Pixabay

Aufgeräumt ins neue Jahr: Wie Sie Ihre digitalen Altlasten loswerden

20. Dezember 2024 pi/kdl

Nutzen Sie die die ruhigen Tage rund um den Jahreswechsel, um Ihre Daten zu ordnen, Platz für Neues zu schaffen und Ihren Arbeitsplatz klarer und nachhaltiger zu gestalten. Iphos IT hat folgende Tipps zusammengestellt, wie das digitale Ausfegen mit den richtigen Tools, Techniken und speziellen Enterprise-Search-Lösungen auf Knopfdruck gelingt. […]

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl

„Die Zukunft ist modular, flexibel und KI-gestützt“

20. Dezember 2024 Klaus Lorbeer

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

Richtlinien für sichere KI-Entwicklung

20. Dezember 2024

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

Soundspektakel dank diesen Audio-Geräten

20. Dezember 2024 Daniel Bader *

Kopfhörer, Lautsprecher und Soundbars sind die drei wichtigsten Audioklassen – alle mit ganz individuellen Besonderheiten. Dieser Audio-Guide zeigt, welches Gerät sich für wen lohnt und was es beim Kauf zu beachten gilt. […]

Kosteneffizienz in der Cloud: So vermeiden Unternehmen unnötige Ausgaben

20. Dezember 2024 Simon Müller *

Cloud Computing bietet unschlagbare Vorteile wie Skalierbarkeit und Flexibilität, bringt jedoch auch Herausforderungen mit sich. Vor allem die Kosteneffizienz in der Cloud wird für Unternehmen immer wichtiger, da die Ausgaben für Cloud-Dienste stetig steigen. […]

Datensilos blockieren Abwehrkräfte von generativer KI