Kann Google Duplex Telefonate führen?

Google hat eine Erweiterung zu seinem digitalen Assistenten veröffentlicht, der im Namen des Nutzers telefonieren und mit Personen sprechen kann. Und das erstaunlich gut. [...]

Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay
Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay

Die Frage nach dem besten digitalen Assistenten hat neue Nahrung erhalten, nachdem Google Duplex angekündigt hatte. Anstatt Fragen über das Wetter, die Verkehrslage oder den Standort der nächsten Coffeeshops zu beantworten – wie es der Assistent gerade tut –, macht Google Duplex etwas ganz anderes: Es telefoniert und bucht Termine für den User.

Macht Google Duplex tatsächlich Telefonanrufe?

Ja. Und es scheint es ziemlich gut zu machen. Google Duplex ist eine Erweiterung der Google Assistant-App, die auf Android– oder iOS-Geräten läuft. Der Nutzer kann den Assistenten bitten, eine einfache Aufgabe zu erledigen, bei der beispielsweise ein Geschäft oder ein Restaurant angerufen wird. Dies könnte dazu dienen, einen Termin zu vereinbaren oder einfach die Öffnungszeiten herauszufinden. Sobald der Auftrag erteilt wurde, tätigt Duplex den Anruf und führt eine echte Live-Unterhaltung mit demjenigen, der abgehoben hat.

Auch wenn dies ein bisschen wie nach Star Trek klingt, scheint Google sehr zuversichtlich zu sein, dass die Technologie die menschliche Sprache bis zu dem Punkt imitieren kann, an dem die Person am anderen Ende niemals herausfinden wird, dass er mit Software und nicht mit einem Menschen gesprochen hat.

Bei der jüngsten Google I/O-Entwicklerveranstaltung demonstrierte der CEO des Unternehmens, Sundar Pichai, Duplex in Aktion, indem er Aufnahmen von tatsächlichen Anrufen des Assistenten abspielte. Im ersten Beispiel rief Duplex einen Friseur an und buchte einen Termin an einem bestimmten Tag und zu einer bestimmten Uhrzeit. Die Sprache, die es dafür verwendete, erschien natürlich und umfasste sogar Pausen, Änderungen der Betonung und gelegentlich ein „Äh“ oder „Ah“, um authentisch zu wirken. Duplex fragte und beantwortete Fragen wie man es von einer normalen Konversation gewohnt ist und erledigte die Aufgabe, ohne den nicht-menschlichen Status zu verraten.

Pichai spielte ein zweites Beispiel ab, das noch beeindruckender war, da eine Person in einem Restaurant mit einem starken Akzent beteiligt war, die Fragen eher unbeholfen beantwortete. Der Assistent konnte nicht nur die notwendigen Informationen herausfiltern, sondern tat dies mit einer Leichtigkeit, die vielleicht einige Menschen nicht hätten aufbringen können.

Wie funktioniert Google Duplex?

Google hat Duplex für spezielle Aufgaben angelegt, damit sich die Lösung nicht in den unendlichen Weiten der menschlichen Sprache verirrt. Der Hauptaufgabenbereich sind Service-orientierte Gespräche. In einem Blogpost, in dem die Technologie angekündigt wurde, machte Google die Gründe dafür klar.

„Die Technologie ist darauf ausgerichtet, bestimmte Aufgaben zu erledigen, z. B. die Fixierung bestimmter Arten von Terminen … Eine der wichtigsten Erkenntnisse der Forschung bestand darin, Duplex auf geschlossene Bereiche zu beschränken, die eng genug sind, um umfassend untersucht werden zu können. Duplex kann nur natürliche Gespräche führen, wenn es zuvor in diesen Bereichen ausreichend trainiert wurde. Es kann keine allgemeinen Gespräche führen.“

Während Sie also Duplex bitten können, einen Tisch für das Abendessen zu reservieren, sollten Sie nicht erwarten, dass es Ihre Versicherungsgesellschaft telefonisch bezirzt, damit diese für den Laptop bezahlt, den Sie mit Kaffee übergossen haben.

Im Innern von Duplex werkt etwas, das Google Recurrent Neural Network (RNN) nennt, das nicht nur die gesprochenen Wörter, sondern auch den Kontext, in dem sie verwendet werden, auswertet. „Um eine hohe Präzision zu erreichen, haben wir Duplex RNN mit anonymisierten Telefongesprächsdaten geschult“, berichtete Google in seinem Blog. „Das Netzwerk nutzt die automatische Spracherkennungstechnologie von Google sowie Funktionen aus dem Bereich Audio, die Gesprächshistorie, die Parameter der Konversation (z. B. den gewünschten Service für einen Termin oder die aktuelle Uhrzeit) ) und mehr. Wir haben unser Verständnismodell für jede Aufgabe getrennt trainiert, aber den Datensatz für alle Aufgaben gemeinsam genutzt. “

Bisher wurde Duplex nur auf der Eventbühne von Google I/O gezeigt. Aber das Unternehmen sagt, dass es im Sommer damit beginnen wird, einige Nutzer mit der Technologie experimentieren zu lassen.

Ist das nicht ein wenig gruselig?

Während die Qualität der Demonstrationen, ehrlich gesagt, erstaunlich war, gab es bereits viele Diskussionen darüber, ob eine Software, die vorgibt, ein Mensch zu sein, eine Sache der Ethik ist.

Soll der Assistent zu Beginn einer Unterhaltung mitteilen, was es ist? Erniedrigt es den Menschen, der an dem Gespräch beteiligt ist? Wer ist verantwortlich, wenn ein Buchungsfehler vorliegt?

Da Duplex auf die Terminplanung beschränkt ist, scheint es, dass das Unternehmen auf der sicheren Seite ist. Sicher könnten hier oder da Fehler passieren, aber wahrscheinlich wäre das nichts Tragisches. Da sich die Technologie noch in einem frühen Entwicklungsstadium befindet, bleibt zweifelsfrei genug Zeit, um die ethischen Fragen in der Öffentlichkeit zu diskutieren und in den Entwicklungslaboren von Google entsprechend zu agieren.

Die Technologie öffnet die Tür zu einem Tag, an dem Sie Ihr Telefon bitten werden, Tickets für die 25. Ausgabe von Avengers zu reservieren, und am anderen Ende der Leitung werkt ebenfalls Google Duplex. Douglas Adams hat einmal geschrieben, dass die Menschen, die vom Fernsehen gelangweilt sind, ein Gerät erfinden, das Sendungen für sie stellvertretend ansieht. Es scheint, dass wir uns sehr bald auch von langweiligen Telefongesprächen verabschieden können.

*Martyn Casserly ist Redakteur des UK-Magazins PC Advisor.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*