Kann Google Duplex Telefonate führen?

Google hat eine Erweiterung zu seinem digitalen Assistenten veröffentlicht, der im Namen des Nutzers telefonieren und mit Personen sprechen kann. Und das erstaunlich gut. [...]

Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay
Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay

Die Frage nach dem besten digitalen Assistenten hat neue Nahrung erhalten, nachdem Google Duplex angekündigt hatte. Anstatt Fragen über das Wetter, die Verkehrslage oder den Standort der nächsten Coffeeshops zu beantworten – wie es der Assistent gerade tut –, macht Google Duplex etwas ganz anderes: Es telefoniert und bucht Termine für den User.

Macht Google Duplex tatsächlich Telefonanrufe?

Ja. Und es scheint es ziemlich gut zu machen. Google Duplex ist eine Erweiterung der Google Assistant-App, die auf Android– oder iOS-Geräten läuft. Der Nutzer kann den Assistenten bitten, eine einfache Aufgabe zu erledigen, bei der beispielsweise ein Geschäft oder ein Restaurant angerufen wird. Dies könnte dazu dienen, einen Termin zu vereinbaren oder einfach die Öffnungszeiten herauszufinden. Sobald der Auftrag erteilt wurde, tätigt Duplex den Anruf und führt eine echte Live-Unterhaltung mit demjenigen, der abgehoben hat.

Auch wenn dies ein bisschen wie nach Star Trek klingt, scheint Google sehr zuversichtlich zu sein, dass die Technologie die menschliche Sprache bis zu dem Punkt imitieren kann, an dem die Person am anderen Ende niemals herausfinden wird, dass er mit Software und nicht mit einem Menschen gesprochen hat.

Bei der jüngsten Google I/O-Entwicklerveranstaltung demonstrierte der CEO des Unternehmens, Sundar Pichai, Duplex in Aktion, indem er Aufnahmen von tatsächlichen Anrufen des Assistenten abspielte. Im ersten Beispiel rief Duplex einen Friseur an und buchte einen Termin an einem bestimmten Tag und zu einer bestimmten Uhrzeit. Die Sprache, die es dafür verwendete, erschien natürlich und umfasste sogar Pausen, Änderungen der Betonung und gelegentlich ein „Äh“ oder „Ah“, um authentisch zu wirken. Duplex fragte und beantwortete Fragen wie man es von einer normalen Konversation gewohnt ist und erledigte die Aufgabe, ohne den nicht-menschlichen Status zu verraten.

Pichai spielte ein zweites Beispiel ab, das noch beeindruckender war, da eine Person in einem Restaurant mit einem starken Akzent beteiligt war, die Fragen eher unbeholfen beantwortete. Der Assistent konnte nicht nur die notwendigen Informationen herausfiltern, sondern tat dies mit einer Leichtigkeit, die vielleicht einige Menschen nicht hätten aufbringen können.

Wie funktioniert Google Duplex?

Google hat Duplex für spezielle Aufgaben angelegt, damit sich die Lösung nicht in den unendlichen Weiten der menschlichen Sprache verirrt. Der Hauptaufgabenbereich sind Service-orientierte Gespräche. In einem Blogpost, in dem die Technologie angekündigt wurde, machte Google die Gründe dafür klar.

„Die Technologie ist darauf ausgerichtet, bestimmte Aufgaben zu erledigen, z. B. die Fixierung bestimmter Arten von Terminen … Eine der wichtigsten Erkenntnisse der Forschung bestand darin, Duplex auf geschlossene Bereiche zu beschränken, die eng genug sind, um umfassend untersucht werden zu können. Duplex kann nur natürliche Gespräche führen, wenn es zuvor in diesen Bereichen ausreichend trainiert wurde. Es kann keine allgemeinen Gespräche führen.“

Während Sie also Duplex bitten können, einen Tisch für das Abendessen zu reservieren, sollten Sie nicht erwarten, dass es Ihre Versicherungsgesellschaft telefonisch bezirzt, damit diese für den Laptop bezahlt, den Sie mit Kaffee übergossen haben.

Im Innern von Duplex werkt etwas, das Google Recurrent Neural Network (RNN) nennt, das nicht nur die gesprochenen Wörter, sondern auch den Kontext, in dem sie verwendet werden, auswertet. „Um eine hohe Präzision zu erreichen, haben wir Duplex RNN mit anonymisierten Telefongesprächsdaten geschult“, berichtete Google in seinem Blog. „Das Netzwerk nutzt die automatische Spracherkennungstechnologie von Google sowie Funktionen aus dem Bereich Audio, die Gesprächshistorie, die Parameter der Konversation (z. B. den gewünschten Service für einen Termin oder die aktuelle Uhrzeit) ) und mehr. Wir haben unser Verständnismodell für jede Aufgabe getrennt trainiert, aber den Datensatz für alle Aufgaben gemeinsam genutzt. “

Bisher wurde Duplex nur auf der Eventbühne von Google I/O gezeigt. Aber das Unternehmen sagt, dass es im Sommer damit beginnen wird, einige Nutzer mit der Technologie experimentieren zu lassen.

Ist das nicht ein wenig gruselig?

Während die Qualität der Demonstrationen, ehrlich gesagt, erstaunlich war, gab es bereits viele Diskussionen darüber, ob eine Software, die vorgibt, ein Mensch zu sein, eine Sache der Ethik ist.

Soll der Assistent zu Beginn einer Unterhaltung mitteilen, was es ist? Erniedrigt es den Menschen, der an dem Gespräch beteiligt ist? Wer ist verantwortlich, wenn ein Buchungsfehler vorliegt?

Da Duplex auf die Terminplanung beschränkt ist, scheint es, dass das Unternehmen auf der sicheren Seite ist. Sicher könnten hier oder da Fehler passieren, aber wahrscheinlich wäre das nichts Tragisches. Da sich die Technologie noch in einem frühen Entwicklungsstadium befindet, bleibt zweifelsfrei genug Zeit, um die ethischen Fragen in der Öffentlichkeit zu diskutieren und in den Entwicklungslaboren von Google entsprechend zu agieren.

Die Technologie öffnet die Tür zu einem Tag, an dem Sie Ihr Telefon bitten werden, Tickets für die 25. Ausgabe von Avengers zu reservieren, und am anderen Ende der Leitung werkt ebenfalls Google Duplex. Douglas Adams hat einmal geschrieben, dass die Menschen, die vom Fernsehen gelangweilt sind, ein Gerät erfinden, das Sendungen für sie stellvertretend ansieht. Es scheint, dass wir uns sehr bald auch von langweiligen Telefongesprächen verabschieden können.

*Martyn Casserly ist Redakteur des UK-Magazins PC Advisor.


Mehr Artikel

Christina Decker, Director Strategic Channels Europe bei Trend Micro (c) Trend Micro
Kommentar

Wie der Channel die tickende Zeitbombe „Compliance-Risiko“ entschärfen kann

Cybersicherheitsregulatoren hatten ein geschäftiges Jahr 2024. Zuerst kam die NIS2-Richtlinie, deren Umsetzungsfrist Mitte Oktober ablief. Nur wenige Monate später trat in der gesamten EU der lang erwartete Digital Operational Resilience Act (DORA) in Kraft. Beide Regelwerke wurden dringend benötigt, haben aber auch enormen Druck auf Unternehmen in der Region ausgeübt. Besonders KMU spüren diesen Druck. […]

Bjørn Toonen, Managing Director von Randstad Österreich (c) Randstad
News

Randstad-Arbeitsmarktstudie mit Schwerpunkt auf KI

Laut EU AI-Act müssen seit 2. Februar 2025 alle Mitarbeitenden, die Künstliche Intelligenz (KI) nutzen, entwickeln oder betreiben, über ausreichende KI-Kompetenzen verfügen. Das hat die „Employer Brand Research 2025“ des internationalen Personaldienstleisters Randstad als Schwerpunktthema untersucht. […]

Kommentar

Cyber Dominance: Digitale Abhängigkeit ist das neue Geschäftsrisiko

Bei Cyber Dominance geht es um die Fähigkeit von Herstellern digitaler Produkte, auch nach dem Kauf dauerhaft Zugriff auf Systeme und Informationen ihrer Kunden zu behalten. Eine Form der Kontrolle, die tief in technische Infrastrukturen eingreift – oft unbemerkt und ungefragt. Diese Art der digitalen Abhängigkeit ist längst Realität – und sie ist eines der größten unterschätzten Geschäftsrisiken unserer Zeit. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*