7. Juni 2018

Google Duplex: Die überaus menschliche Sprach-KI für Assistant

Kategorie: Innovation

Stellen wir uns folgendes Szenario vor: Wir arbeiten als Servicekraft in einem Restaurant, das Telefon klingelt, wir nehmen ab und es meldet sich am anderen Ende der Leitung ein Gesprächspartner mit nett klingender Stimme und bestellt ein Tisch für vier. Soweit so gewöhnlich und daher nicht der Rede wert, wäre da nicht eine Besonderheit an diesem beschriebenen Szenario: Den Tisch hat kein menschlicher Gesprächspartner bestellt, sondern eine KI – und das so überzeugend, dass man den Unterschied kaum bis gar nicht wahrgenommen hat. Genau das hat Google Duplex in einem Test vollbringen können.

Was ist Google Duplex?

Auf der von Google initiierten, jährlichen Entwicklerkonferenz Google I/O stellte Google-CEO Sundar Pichai im Mai dieses Jahres die Sprach-KI Google Duplex vor, ein Modul für den Google Assistant zum Ausführen von Sprachanrufen. Dieses wirkte in dem oben beschriebenen Test-Szenario überraschend menschlich. Der vorliegende Clip verdeutlicht, wie Duplex kontextabhängig und mit präzise getimten Antworten sowie Füllwörtern so auf seine Gesprächspartnerin reagiert, dass ein möglichst menschlicher Eindruck entsteht. Das Ergebnis ist beeindruckend, was auch daran liegt, dass Duplex dafür konzipiert und „trainiert“ wurde, in einem bis dato sehr eng abgesteckten Rahmen zu agieren. In diesem zeigt sich die Google Duplex KI sicher in der Interaktion, hakt bei Unklarheiten nach und kann auch mit Doppeldeutigkeiten umgehen.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Kontext, Kontext, Kontext

Mitunter kann der Eindruck einer freien Konversation entstehen, aber in Wahrheit agiert Duplex in einem engen Kontextrahmen, der durch die entsprechende Situation vorgegeben ist. Im Falle der Aufgabe ein Tisch zu reservieren, ist beispielsweise der kontextuelle Rahmen vorbestimmt und der zu erwartende Gesprächsverlauf abschätzbar. Verlässt ein Gespräch aber die vordefinierten Parameter, schaltet sich ein menschlicher Google-Mitarbeiter ein und springt für Duplex ein. Nichtsdestotrotz ist diese Verfeinerung der Computersprachausgabe mittels künstlicher Intelligenz eine beeindruckende, technische Leistung, weckt aber auch Bedenken, da die menschliche Stimme als eindeutiges Identifizierungsmerkmal mit fortschreitender Entwicklung zunehmend schwinden wird. Um hier mögliche Bedenken im Keim zu ersticken, versprach Google, dass sich Duplex vor Gesprächsbeginn als Maschine zu erkennen geben wird.

Google plant noch dieses Jahr Duplex testweise in den Google Assistant zu integrieren und dessen Funktionalität zunächst bezogen auf eine Handvoll Einsatzgebiete und in englischer Sprache auszutesten. Eine überaus spannende Entwicklung, die wir weiter verfolgen werden.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert