Effizienter arbeiten mit Spracherkennung

Eine aktuelle Studie zeigt Herausforderungen und mögliche Vorteile von Spracherkennung und -verarbeitung in der heutigen Arbeitswelt. Richtig eingesetzt bietet die Technologie viel Potenzial, dennoch nutzen – abgesehen von speziellen Branchen – noch relativ wenige Unternehmen Hard- und Software für Spracherkennung und vor allem Sprachverarbeitung. [...]

Mit dem in Wien entwickelten Headset SpeechOne kann die Spracherkennungsrate verbessert werden. (c) Philips

Für die von Philips Speech Processing Solutions in Auftrag gegebene und von der Techconsult GmbH durchgeführte Studie – sie trägt den profanen Namen »Spracherkennung und-verarbeitung in deutschen Unternehmen« – wurde im Oktober 2021 eine Stichprobe von 200 Personen aus allen Branchen und Unternehmensgrößen befragt. Die Situation in Österreich ist wohl mit jener in Deutschland vergleichbar.

Protokolle von Meetings, Mitschriften, aber auch Angebotserstellung sowie Stammdatenpflege – der Einsatz von Spracherkennungstechnologie ist groß. Inbesondere im Rechtswesen und in der Medizin wird die Technik schon seit längerem erfolgreich eingesetzt. Die vielen Standardsätze und das (eintrainierte) Fachvokabular sorgen hier für ein besonders leichte Nutzung und gute Erkennung. Deswegen lassen sich hier vermutlich auch die besten Effizienzsteigerungen mit Sprachtechnologie erzielen. 

Zurück zur Studie: Als Probleme oder Herausforderungen beim Umgang mit sprachlicher Information nannten 38 Prozent der Befragten eine schlechte Akustik, gefolgt von 33 Prozent, die »zu viele sprachliche Informationen, um schnell mitzuschreiben« angaben. 25 Prozent sagten, dass sie sich durch das Mitschreiben nicht auf die eigentlichen Inhalte konzentrieren können – 22 Prozent hatten keines dieser Probleme.

Die richtigen Voraussetzungen

Um für eine gute Akustik und eine dementsprechende gute Erkennungsrate zu sorgen, ist natürlich die verfügbare Internetverbindung sowie die eingesetzte Hard- und Software entscheidend. Ein gutes und funktionierendes Headset ist beispielsweise besser als das im Laptop integrierte Mikrofon. Wer mit Sprachdateien arbeitet, die später von einer Software transkribiert werden sollen, ist gut beraten, ein hochwertiges Aufnahme- beziehungsweise Diktiergerät zu verwenden und so für möglichst wenige Umgebungsgeräusche zu sorgen.

Effizienzsteigerung mit Software

Neben der Hardware und einer guten Qualität des Audiomaterials bedarf es einer entsprechenden Software, die die Sprachdateien in editierbaren Text umwandelt, man spricht hier von »Speech-to-Text«. Hier können entsprechende Effizienzsteigerungen und Mehrwerte erzielt werden, sei es bereits beim Diktieren oder auch bei der nachträglichen Transkription einer Audiodatei. Als Vorteile nennen die Autoren der Studie, dass die Kunden davon profitieren, wenn die ganze Konzentration auf das Gespräch gelenkt ist. Dies wirke sich positiv auf die Kundenbindung aus und gebe dem Unternehmen ein besseres Image. 

Im Bereich der Stammdatenpflege gibt eine Soft- und Hardware der Spracherkennung bzw. -verarbeitung zum Beispiel Sicherheit. Das eigenständige Zuhören und gleichzeitige Mitschreiben ist fehleranfällig und kann so vermieden werden. Auch im Bereich der Schreibtätigkeiten bringen die Tools einen Mehrwert. Prozesse, bei denen vorher mühevoll diktiert und geschrieben wurde, können nun automatisiert ablaufen. Das erhöht die Produktivität und bringt Kosteneinsparungen mit sich: Laut Studie gehen 35 Prozent der Befragten davon aus, dass die richtige Soft- und Hardware im Bereich der Spracherkennung bzw. -verarbeitung ihnen 10 bis 24 Prozent des Aufwands ersparen würde. 23 Prozent würden sogar eine Aufwandsersparnis von 25 bis 49 Prozent erwarten. Immerhin noch 9 Prozent sehen eine 50- bis 74-prozentige und 3 Prozent der Befragten gar eine 75- bis 100-prozentige Aufwandsersparnis

Dennoch: 62 Prozent der befragten Unternehmen nutzen keine entsprechende Hard- oder Software zur Spracherkennung und -verarbeitung. Am meisten Interesse (64 Prozent) erntet »Speech-to-Text« zur Unterstützung. 59 Prozent der Befragten sehen Gesprächs- und Meetingaufzeichnungen als Erleichterung an. Lösungen wie die Spracherkennung direkt in Programmen (z.B. innerhalb von Word, 55 Prozent), ein Schreibservice durch geschulte Spezialisten (47 Prozent) und die interne Transkription (44 Prozent) sind weitere Möglichkeiten der Unterstützung. Spracherkennung und -verarbeitung wird also durchaus als hilfreiche Technologie betrachtet, jedoch noch wenig genutzt. Hier ist also ein großes Potenzial vorhanden.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*