Kann Google Duplex Telefonate führen?

Google hat eine Erweiterung zu seinem digitalen Assistenten veröffentlicht, der im Namen des Nutzers telefonieren und mit Personen sprechen kann. Und das erstaunlich gut. [...]

Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay
Google Duplex wird nicht als Software erkennbar sein. (c) schiffdirk - Pixabay

Die Frage nach dem besten digitalen Assistenten hat neue Nahrung erhalten, nachdem Google Duplex angekündigt hatte. Anstatt Fragen über das Wetter, die Verkehrslage oder den Standort der nächsten Coffeeshops zu beantworten – wie es der Assistent gerade tut –, macht Google Duplex etwas ganz anderes: Es telefoniert und bucht Termine für den User.

Macht Google Duplex tatsächlich Telefonanrufe?

Ja. Und es scheint es ziemlich gut zu machen. Google Duplex ist eine Erweiterung der Google Assistant-App, die auf Android– oder iOS-Geräten läuft. Der Nutzer kann den Assistenten bitten, eine einfache Aufgabe zu erledigen, bei der beispielsweise ein Geschäft oder ein Restaurant angerufen wird. Dies könnte dazu dienen, einen Termin zu vereinbaren oder einfach die Öffnungszeiten herauszufinden. Sobald der Auftrag erteilt wurde, tätigt Duplex den Anruf und führt eine echte Live-Unterhaltung mit demjenigen, der abgehoben hat.

Auch wenn dies ein bisschen wie nach Star Trek klingt, scheint Google sehr zuversichtlich zu sein, dass die Technologie die menschliche Sprache bis zu dem Punkt imitieren kann, an dem die Person am anderen Ende niemals herausfinden wird, dass er mit Software und nicht mit einem Menschen gesprochen hat.

Bei der jüngsten Google I/O-Entwicklerveranstaltung demonstrierte der CEO des Unternehmens, Sundar Pichai, Duplex in Aktion, indem er Aufnahmen von tatsächlichen Anrufen des Assistenten abspielte. Im ersten Beispiel rief Duplex einen Friseur an und buchte einen Termin an einem bestimmten Tag und zu einer bestimmten Uhrzeit. Die Sprache, die es dafür verwendete, erschien natürlich und umfasste sogar Pausen, Änderungen der Betonung und gelegentlich ein „Äh“ oder „Ah“, um authentisch zu wirken. Duplex fragte und beantwortete Fragen wie man es von einer normalen Konversation gewohnt ist und erledigte die Aufgabe, ohne den nicht-menschlichen Status zu verraten.

Pichai spielte ein zweites Beispiel ab, das noch beeindruckender war, da eine Person in einem Restaurant mit einem starken Akzent beteiligt war, die Fragen eher unbeholfen beantwortete. Der Assistent konnte nicht nur die notwendigen Informationen herausfiltern, sondern tat dies mit einer Leichtigkeit, die vielleicht einige Menschen nicht hätten aufbringen können.

Wie funktioniert Google Duplex?

Google hat Duplex für spezielle Aufgaben angelegt, damit sich die Lösung nicht in den unendlichen Weiten der menschlichen Sprache verirrt. Der Hauptaufgabenbereich sind Service-orientierte Gespräche. In einem Blogpost, in dem die Technologie angekündigt wurde, machte Google die Gründe dafür klar.

„Die Technologie ist darauf ausgerichtet, bestimmte Aufgaben zu erledigen, z. B. die Fixierung bestimmter Arten von Terminen … Eine der wichtigsten Erkenntnisse der Forschung bestand darin, Duplex auf geschlossene Bereiche zu beschränken, die eng genug sind, um umfassend untersucht werden zu können. Duplex kann nur natürliche Gespräche führen, wenn es zuvor in diesen Bereichen ausreichend trainiert wurde. Es kann keine allgemeinen Gespräche führen.“

Während Sie also Duplex bitten können, einen Tisch für das Abendessen zu reservieren, sollten Sie nicht erwarten, dass es Ihre Versicherungsgesellschaft telefonisch bezirzt, damit diese für den Laptop bezahlt, den Sie mit Kaffee übergossen haben.

Im Innern von Duplex werkt etwas, das Google Recurrent Neural Network (RNN) nennt, das nicht nur die gesprochenen Wörter, sondern auch den Kontext, in dem sie verwendet werden, auswertet. „Um eine hohe Präzision zu erreichen, haben wir Duplex RNN mit anonymisierten Telefongesprächsdaten geschult“, berichtete Google in seinem Blog. „Das Netzwerk nutzt die automatische Spracherkennungstechnologie von Google sowie Funktionen aus dem Bereich Audio, die Gesprächshistorie, die Parameter der Konversation (z. B. den gewünschten Service für einen Termin oder die aktuelle Uhrzeit) ) und mehr. Wir haben unser Verständnismodell für jede Aufgabe getrennt trainiert, aber den Datensatz für alle Aufgaben gemeinsam genutzt. “

Bisher wurde Duplex nur auf der Eventbühne von Google I/O gezeigt. Aber das Unternehmen sagt, dass es im Sommer damit beginnen wird, einige Nutzer mit der Technologie experimentieren zu lassen.

Ist das nicht ein wenig gruselig?

Während die Qualität der Demonstrationen, ehrlich gesagt, erstaunlich war, gab es bereits viele Diskussionen darüber, ob eine Software, die vorgibt, ein Mensch zu sein, eine Sache der Ethik ist.

Soll der Assistent zu Beginn einer Unterhaltung mitteilen, was es ist? Erniedrigt es den Menschen, der an dem Gespräch beteiligt ist? Wer ist verantwortlich, wenn ein Buchungsfehler vorliegt?

Da Duplex auf die Terminplanung beschränkt ist, scheint es, dass das Unternehmen auf der sicheren Seite ist. Sicher könnten hier oder da Fehler passieren, aber wahrscheinlich wäre das nichts Tragisches. Da sich die Technologie noch in einem frühen Entwicklungsstadium befindet, bleibt zweifelsfrei genug Zeit, um die ethischen Fragen in der Öffentlichkeit zu diskutieren und in den Entwicklungslaboren von Google entsprechend zu agieren.

Die Technologie öffnet die Tür zu einem Tag, an dem Sie Ihr Telefon bitten werden, Tickets für die 25. Ausgabe von Avengers zu reservieren, und am anderen Ende der Leitung werkt ebenfalls Google Duplex. Douglas Adams hat einmal geschrieben, dass die Menschen, die vom Fernsehen gelangweilt sind, ein Gerät erfinden, das Sendungen für sie stellvertretend ansieht. Es scheint, dass wir uns sehr bald auch von langweiligen Telefongesprächen verabschieden können.

*Martyn Casserly ist Redakteur des UK-Magazins PC Advisor.


Mehr Artikel

News

Public Key Infrastructure: Best Practices für einen erfolgreichen Zertifikats-Widerruf

Um die Sicherheit ihrer Public Key Infrastructure (PKI) aufrecht zu erhalten, müssen PKI-Teams, sobald bei einer Zertifizierungsstelle eine Sicherheitslücke entdeckt worden ist, sämtliche betroffenen Zertifikate widerrufen. Ein wichtiger Vorgang, der zwar nicht regelmäßig, aber doch so häufig auftritt, dass es sich lohnt, PKI-Teams einige Best Practices für einen effektiven und effizienten Zertifikatswiderruf an die Hand zu geben. […]

News

UBIT Security-Talk: Cyberkriminalität wächst unaufhaltsam

Jedes Unternehmen, das IT-Systeme nutzt, ist potenziell gefährdet Opfer von Cyberkriminalität zu werden, denn die Bedrohung und die Anzahl der Hackerangriffe in Österreich nimmt stetig zu. Die Experts Group IT-Security der Wirtschaftskammer Salzburg lädt am 11. November 2024 zum „UBIT Security-Talk Cyber Defense“ ein, um Unternehmen in Salzburg zu unterstützen, sich besser gegen diese Bedrohungen zu wappnen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*