Trendthema Sprachsteuerung: Warum Siri und Co. die Zukunft gehört

Computer per Sprache zu steuern gehörte für die meisten Experten bisher ins Reich der Science-Fiction. Doch mit stärkerer Hardware und neuen Techniken könnten die Visionen bald wahr werden. [...]

Neben Apple und Google hat auch Microsoft integrierte Sprachfunktionen im Angebot. So ermöglichen die Betriebssysteme nicht erst seit „Windows Phone“ Zugriffe auf Mails oder Kontakte via Sprachbefehl. Bereits seit Windows Vista ist das Betriebssystem – genau wie der Konkurrent Mac OS X – mit Funktionen für Spracherkennung ausgestattet. Ein Blick in den Systemordner „Erleichterte Bedienung – Spracherkennung“ in der Windows-Systemsteuerung dürfte viele Nutzer überraschen. So lassen sich Programme innerhalb von Windows 7 per Sprachbefehl starten und schließen. Mit Sprach-Makros sind zudem auch komplexere Aufgaben möglich.
Die Vorstellung der „Xbox One“ letzte Woche war zudem ein Beleg dafür, welchen Stellenwert Sprachsteuerung für Microsoft hat. Die neue Spielkonsole ist auch ein Home-Entertainment-Gerät – inklusive Sprachkommandos (siehe Seite 50). Nach Angaben von Microsoft lassen sich zum Beispiel das TV-Programm („Xbox play TV“), Apps und Spiele („Xbox play Game“) per Sprachsteuerung öffnen.
LÄUFT GERADE DIE TAGESSCHAU?
Doch nicht nur Mobilgeräte und Notebooks werden mit Sprachfunktionen ausgestattet. Telematiksysteme und Navigationsgeräte treten genauso in den Mensch-Maschine-Dialog wie Lichtsysteme oder Rasensprenger. Das Bedienverhalten der Nutzer nachhaltig verändern könnten Home-Entertainment und Hausautomation. Nuance Communications entwickelt bereits seit einigen Jahren Software für die Spracherkennung. Das Unternehmen wurde vor allem durch die Software „Dragon Naturally Speaking“ bekannt. Die Weiterentwicklung dieser Plattform mit „Dragon TV“ steht exemplarisch dafür, wie sich der Sprachdialog zwischen Mensch und Geräten in verschiedene Lebensbereiche ausdehnen kann.
Bei Dragon TV „hört“ das Fernsehgerät den umliegenden Raum kontinuierlich nach Befehlen ab. Der Anwender muss nicht kompliziert in ein spezielles Mikrofon sprechen. Hintergrundgeräusche soll die Technik laut Hersteller ausblenden können. Der Sprachbefehl „Dragon TV“ weckt die Anwendung aus dem Dornröschenschlaf. Die Bedienung funktioniert mit natürlicher Sprache, das heißt, abgehackte Kommandos sind grundsätzlich kein Problem.
Die Liste an Sprachbefehlen ist lang: So wird nicht nur das Kommando „Dragon TV, schalte um auf ARD“ ausgeführt. Es lassen sich auch verknüpfte Fragen stellen: „Läuft gerade die Tagesschau?“ oder „Gibt es heute Abend einen Film mit Bruce Willis?“ Die Plattform reagiert darauf, indem sie das aktuelle Programm scannt und auf die Frage antwortet. Ist es gerade 20 Uhr, dann erhält der Zuschauer, der nach der Tagesschau gefragt hat, eine positive Antwort und kann per Sprachbefehl zur ARD zappen. Daneben arbeit Nuance seit März mit der Deutschen Telekom zusammen. Die Entertainment-Remote-Control-App für das TV-Angebot des Telekommunikationsanbieters hat seit kurzer Zeit die Sprachsteuerung von Nuance integriert.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*