8. April 2025

Kann Google Duplex Telefonate führen?

Google hat eine Erweiterung zu seinem digitalen Assistenten veröffentlicht, der im Namen des Nutzers telefonieren und mit Personen sprechen kann. Und das erstaunlich gut. [...]

Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay

Die Frage nach dem besten digitalen Assistenten hat neue Nahrung erhalten, nachdem Google Duplex angekündigt hatte. Anstatt Fragen über das Wetter, die Verkehrslage oder den Standort der nächsten Coffeeshops zu beantworten – wie es der Assistent gerade tut –, macht Google Duplex etwas ganz anderes: Es telefoniert und bucht Termine für den User.

Macht Google Duplex tatsächlich Telefonanrufe?

Ja. Und es scheint es ziemlich gut zu machen. Google Duplex ist eine Erweiterung der Google Assistant-App, die auf Android– oder iOS-Geräten läuft. Der Nutzer kann den Assistenten bitten, eine einfache Aufgabe zu erledigen, bei der beispielsweise ein Geschäft oder ein Restaurant angerufen wird. Dies könnte dazu dienen, einen Termin zu vereinbaren oder einfach die Öffnungszeiten herauszufinden. Sobald der Auftrag erteilt wurde, tätigt Duplex den Anruf und führt eine echte Live-Unterhaltung mit demjenigen, der abgehoben hat.

Auch wenn dies ein bisschen wie nach Star Trek klingt, scheint Google sehr zuversichtlich zu sein, dass die Technologie die menschliche Sprache bis zu dem Punkt imitieren kann, an dem die Person am anderen Ende niemals herausfinden wird, dass er mit Software und nicht mit einem Menschen gesprochen hat.

Bei der jüngsten Google I/O-Entwicklerveranstaltung demonstrierte der CEO des Unternehmens, Sundar Pichai, Duplex in Aktion, indem er Aufnahmen von tatsächlichen Anrufen des Assistenten abspielte. Im ersten Beispiel rief Duplex einen Friseur an und buchte einen Termin an einem bestimmten Tag und zu einer bestimmten Uhrzeit. Die Sprache, die es dafür verwendete, erschien natürlich und umfasste sogar Pausen, Änderungen der Betonung und gelegentlich ein „Äh“ oder „Ah“, um authentisch zu wirken. Duplex fragte und beantwortete Fragen wie man es von einer normalen Konversation gewohnt ist und erledigte die Aufgabe, ohne den nicht-menschlichen Status zu verraten.

Pichai spielte ein zweites Beispiel ab, das noch beeindruckender war, da eine Person in einem Restaurant mit einem starken Akzent beteiligt war, die Fragen eher unbeholfen beantwortete. Der Assistent konnte nicht nur die notwendigen Informationen herausfiltern, sondern tat dies mit einer Leichtigkeit, die vielleicht einige Menschen nicht hätten aufbringen können.

Wie funktioniert Google Duplex?

Google hat Duplex für spezielle Aufgaben angelegt, damit sich die Lösung nicht in den unendlichen Weiten der menschlichen Sprache verirrt. Der Hauptaufgabenbereich sind Service-orientierte Gespräche. In einem Blogpost, in dem die Technologie angekündigt wurde, machte Google die Gründe dafür klar.

„Die Technologie ist darauf ausgerichtet, bestimmte Aufgaben zu erledigen, z. B. die Fixierung bestimmter Arten von Terminen … Eine der wichtigsten Erkenntnisse der Forschung bestand darin, Duplex auf geschlossene Bereiche zu beschränken, die eng genug sind, um umfassend untersucht werden zu können. Duplex kann nur natürliche Gespräche führen, wenn es zuvor in diesen Bereichen ausreichend trainiert wurde. Es kann keine allgemeinen Gespräche führen.“

Während Sie also Duplex bitten können, einen Tisch für das Abendessen zu reservieren, sollten Sie nicht erwarten, dass es Ihre Versicherungsgesellschaft telefonisch bezirzt, damit diese für den Laptop bezahlt, den Sie mit Kaffee übergossen haben.

Im Innern von Duplex werkt etwas, das Google Recurrent Neural Network (RNN) nennt, das nicht nur die gesprochenen Wörter, sondern auch den Kontext, in dem sie verwendet werden, auswertet. „Um eine hohe Präzision zu erreichen, haben wir Duplex RNN mit anonymisierten Telefongesprächsdaten geschult“, berichtete Google in seinem Blog. „Das Netzwerk nutzt die automatische Spracherkennungstechnologie von Google sowie Funktionen aus dem Bereich Audio, die Gesprächshistorie, die Parameter der Konversation (z. B. den gewünschten Service für einen Termin oder die aktuelle Uhrzeit) ) und mehr. Wir haben unser Verständnismodell für jede Aufgabe getrennt trainiert, aber den Datensatz für alle Aufgaben gemeinsam genutzt. “

Bisher wurde Duplex nur auf der Eventbühne von Google I/O gezeigt. Aber das Unternehmen sagt, dass es im Sommer damit beginnen wird, einige Nutzer mit der Technologie experimentieren zu lassen.

Ist das nicht ein wenig gruselig?

Während die Qualität der Demonstrationen, ehrlich gesagt, erstaunlich war, gab es bereits viele Diskussionen darüber, ob eine Software, die vorgibt, ein Mensch zu sein, eine Sache der Ethik ist.

Soll der Assistent zu Beginn einer Unterhaltung mitteilen, was es ist? Erniedrigt es den Menschen, der an dem Gespräch beteiligt ist? Wer ist verantwortlich, wenn ein Buchungsfehler vorliegt?

Da Duplex auf die Terminplanung beschränkt ist, scheint es, dass das Unternehmen auf der sicheren Seite ist. Sicher könnten hier oder da Fehler passieren, aber wahrscheinlich wäre das nichts Tragisches. Da sich die Technologie noch in einem frühen Entwicklungsstadium befindet, bleibt zweifelsfrei genug Zeit, um die ethischen Fragen in der Öffentlichkeit zu diskutieren und in den Entwicklungslaboren von Google entsprechend zu agieren.

Die Technologie öffnet die Tür zu einem Tag, an dem Sie Ihr Telefon bitten werden, Tickets für die 25. Ausgabe von Avengers zu reservieren, und am anderen Ende der Leitung werkt ebenfalls Google Duplex. Douglas Adams hat einmal geschrieben, dass die Menschen, die vom Fernsehen gelangweilt sind, ein Gerät erfinden, das Sendungen für sie stellvertretend ansieht. Es scheint, dass wir uns sehr bald auch von langweiligen Telefongesprächen verabschieden können.

*Martyn Casserly ist Redakteur des UK-Magazins PC Advisor.

Andrew O’Dower, Vice President, Product Management für Voice und Voice AI bei Twilio (c) Twilio

Klein, spezialisiert, effizient: Small Language Modelle gewinnen an Bedeutung

7. April 2025 Andrew O'Dower*

Neben den Large Language Models (LLM), die einen regelrechten KI-Boom ausgelöst haben, rücken nun vermehrt Small Language Models (SLM) vor allem für Unternehmen in den Fokus. Andrew O’Dower, Leiter des Bereichs Product Management für Voice und Voice AI bei Twilio, erklärt was es damit auf sich hat. […]

Christina Decker, Director Strategic Channels Europe bei Trend Micro (c) Trend Micro

Wie der Channel die tickende Zeitbombe „Compliance-Risiko“ entschärfen kann

7. April 2025 Christina Decker*

Cybersicherheitsregulatoren hatten ein geschäftiges Jahr 2024. Zuerst kam die NIS2-Richtlinie, deren Umsetzungsfrist Mitte Oktober ablief. Nur wenige Monate später trat in der gesamten EU der lang erwartete Digital Operational Resilience Act (DORA) in Kraft. Beide Regelwerke wurden dringend benötigt, haben aber auch enormen Druck auf Unternehmen in der Region ausgeübt. Besonders KMU spüren diesen Druck. […]

Bjørn Toonen, Managing Director von Randstad Österreich (c) Randstad

Randstad-Arbeitsmarktstudie mit Schwerpunkt auf KI

7. April 2025 pi/kdl

Laut EU AI-Act müssen seit 2. Februar 2025 alle Mitarbeitenden, die Künstliche Intelligenz (KI) nutzen, entwickeln oder betreiben, über ausreichende KI-Kompetenzen verfügen. Das hat die „Employer Brand Research 2025“ des internationalen Personaldienstleisters Randstad als Schwerpunktthema untersucht. […]

Cyber Dominance: Digitale Abhängigkeit ist das neue Geschäftsrisiko

7. April 2025

Bei Cyber Dominance geht es um die Fähigkeit von Herstellern digitaler Produkte, auch nach dem Kauf dauerhaft Zugriff auf Systeme und Informationen ihrer Kunden zu behalten. Eine Form der Kontrolle, die tief in technische Infrastrukturen eingreift – oft unbemerkt und ungefragt. Diese Art der digitalen Abhängigkeit ist längst Realität – und sie ist eines der größten unterschätzten Geschäftsrisiken unserer Zeit. […]

Daten in modernen KI-Umgebung brauchen Leitplanken und keine Schranken

7. April 2025 Benjamin Bohne *

Um KI-Daten wirksam zu schützen, müssen Unternehmen von reaktiver Sicherheit zu proaktiver Governance übergehen. Sicherheitsmaßnahmen müssen von Anfang an in KI-Workflows eingebettet sein. […]

Zurückhaltung gegenüber KI im Kundenservice

7. April 2025

Wie können Unternehmen die Bedenken von Kunden gegenüber KI-Tools ausräumen und gleichzeitig in einer Welt, die zunehmend auf technologische Innovationen wie KI setzt, wettbewerbsfähig bleiben? […]

Mit Cloud License Management Cloud-Einsparungen realisieren

7. April 2025

Flexera, Anbieter für Software-Lizenzmanagement und Technology Intelligence, stellt die Lösung Cloud License Management vor. Das neue Managementtool baut auf der Technology Intelligence Platform von Flexera auf und erlaubt eine umfassende Sicht und tiefe Einblicke in die Ausgaben für Cloud-Software. […]

Aufbau einer zukunftsfähigen Daten- und KI-Plattform

7. April 2025

Das weltweit tätige Lebensmittel- und Getränkeunternehmen Danone nutzt alle Funktionen der Databricks Data Intelligence Platform, um die Datengenauigkeit zu verbessern. Außerdem wird die Zeit von der Datenerfassung bis zur Entscheidungsfindung um bis zu 30 Prozent reduziert. […]

Textgenerierung ist aktuell der dominierende Anwendungsbereich generativer KI. (c) Pexels

Generative KI auf dem Vormarsch: Unternehmen gestalten sich neu

7. April 2025 Wolfgang Franz

Laut einer aktuellen Studie von McKinsey beginnen Unternehmen weltweit, ihre Strukturen und Prozesse gezielt umzugestalten, um den potenziellen Nutzen generativer KI (GenAI) besser auszuschöpfen. ITWelt.at hat sich die Studie angesehen. […]

Kann Google Duplex Telefonate führen?

Google hat eine Erweiterung zu seinem digitalen Assistenten veröffentlicht, der im Namen des Nutzers telefonieren und mit Personen sprechen kann. Und das erstaunlich gut. [...]

Macht Google Duplex tatsächlich Telefonanrufe?

Wie funktioniert Google Duplex?

Ist das nicht ein wenig gruselig?

Mehr Artikel

Klein, spezialisiert, effizient: Small Language Modelle gewinnen an Bedeutung

Wie der Channel die tickende Zeitbombe „Compliance-Risiko“ entschärfen kann

Randstad-Arbeitsmarktstudie mit Schwerpunkt auf KI

Cyber Dominance: Digitale Abhängigkeit ist das neue Geschäftsrisiko

Daten in modernen KI-Umgebung brauchen Leitplanken und keine Schranken

Zurückhaltung gegenüber KI im Kundenservice

Mit Cloud License Management Cloud-Einsparungen realisieren

Aufbau einer zukunftsfähigen Daten- und KI-Plattform

Generative KI auf dem Vormarsch: Unternehmen gestalten sich neu

Be the first to comment

Leave a Reply Antworten abbrechen