Effizienter arbeiten mit Spracherkennung

Eine aktuelle Studie zeigt Herausforderungen und mögliche Vorteile von Spracherkennung und -verarbeitung in der heutigen Arbeitswelt. Richtig eingesetzt bietet die Technologie viel Potenzial, dennoch nutzen – abgesehen von speziellen Branchen – noch relativ wenige Unternehmen Hard- und Software für Spracherkennung und vor allem Sprachverarbeitung. [...]

Mit dem in Wien entwickelten Headset SpeechOne kann die Spracherkennungsrate verbessert werden. (c) Philips

Für die von Philips Speech Processing Solutions in Auftrag gegebene und von der Techconsult GmbH durchgeführte Studie – sie trägt den profanen Namen »Spracherkennung und-verarbeitung in deutschen Unternehmen« – wurde im Oktober 2021 eine Stichprobe von 200 Personen aus allen Branchen und Unternehmensgrößen befragt. Die Situation in Österreich ist wohl mit jener in Deutschland vergleichbar.

Protokolle von Meetings, Mitschriften, aber auch Angebotserstellung sowie Stammdatenpflege – der Einsatz von Spracherkennungstechnologie ist groß. Inbesondere im Rechtswesen und in der Medizin wird die Technik schon seit längerem erfolgreich eingesetzt. Die vielen Standardsätze und das (eintrainierte) Fachvokabular sorgen hier für ein besonders leichte Nutzung und gute Erkennung. Deswegen lassen sich hier vermutlich auch die besten Effizienzsteigerungen mit Sprachtechnologie erzielen. 

Zurück zur Studie: Als Probleme oder Herausforderungen beim Umgang mit sprachlicher Information nannten 38 Prozent der Befragten eine schlechte Akustik, gefolgt von 33 Prozent, die »zu viele sprachliche Informationen, um schnell mitzuschreiben« angaben. 25 Prozent sagten, dass sie sich durch das Mitschreiben nicht auf die eigentlichen Inhalte konzentrieren können – 22 Prozent hatten keines dieser Probleme.

Die richtigen Voraussetzungen

Um für eine gute Akustik und eine dementsprechende gute Erkennungsrate zu sorgen, ist natürlich die verfügbare Internetverbindung sowie die eingesetzte Hard- und Software entscheidend. Ein gutes und funktionierendes Headset ist beispielsweise besser als das im Laptop integrierte Mikrofon. Wer mit Sprachdateien arbeitet, die später von einer Software transkribiert werden sollen, ist gut beraten, ein hochwertiges Aufnahme- beziehungsweise Diktiergerät zu verwenden und so für möglichst wenige Umgebungsgeräusche zu sorgen.

Effizienzsteigerung mit Software

Neben der Hardware und einer guten Qualität des Audiomaterials bedarf es einer entsprechenden Software, die die Sprachdateien in editierbaren Text umwandelt, man spricht hier von »Speech-to-Text«. Hier können entsprechende Effizienzsteigerungen und Mehrwerte erzielt werden, sei es bereits beim Diktieren oder auch bei der nachträglichen Transkription einer Audiodatei. Als Vorteile nennen die Autoren der Studie, dass die Kunden davon profitieren, wenn die ganze Konzentration auf das Gespräch gelenkt ist. Dies wirke sich positiv auf die Kundenbindung aus und gebe dem Unternehmen ein besseres Image. 

Im Bereich der Stammdatenpflege gibt eine Soft- und Hardware der Spracherkennung bzw. -verarbeitung zum Beispiel Sicherheit. Das eigenständige Zuhören und gleichzeitige Mitschreiben ist fehleranfällig und kann so vermieden werden. Auch im Bereich der Schreibtätigkeiten bringen die Tools einen Mehrwert. Prozesse, bei denen vorher mühevoll diktiert und geschrieben wurde, können nun automatisiert ablaufen. Das erhöht die Produktivität und bringt Kosteneinsparungen mit sich: Laut Studie gehen 35 Prozent der Befragten davon aus, dass die richtige Soft- und Hardware im Bereich der Spracherkennung bzw. -verarbeitung ihnen 10 bis 24 Prozent des Aufwands ersparen würde. 23 Prozent würden sogar eine Aufwandsersparnis von 25 bis 49 Prozent erwarten. Immerhin noch 9 Prozent sehen eine 50- bis 74-prozentige und 3 Prozent der Befragten gar eine 75- bis 100-prozentige Aufwandsersparnis

Dennoch: 62 Prozent der befragten Unternehmen nutzen keine entsprechende Hard- oder Software zur Spracherkennung und -verarbeitung. Am meisten Interesse (64 Prozent) erntet »Speech-to-Text« zur Unterstützung. 59 Prozent der Befragten sehen Gesprächs- und Meetingaufzeichnungen als Erleichterung an. Lösungen wie die Spracherkennung direkt in Programmen (z.B. innerhalb von Word, 55 Prozent), ein Schreibservice durch geschulte Spezialisten (47 Prozent) und die interne Transkription (44 Prozent) sind weitere Möglichkeiten der Unterstützung. Spracherkennung und -verarbeitung wird also durchaus als hilfreiche Technologie betrachtet, jedoch noch wenig genutzt. Hier ist also ein großes Potenzial vorhanden.


Mehr Artikel

News

Ransomware-Erpresser setzen auf Kryptowährungen

Die Ransomware-Landschaft erlebte 2024 erhebliche Veränderungen, wobei Kryptowährungen weiterhin eine zentrale Rolle bei Erpressungen spielen. Das Gesamtvolumen der Lösegeldzahlungen ging im Jahresvergleich um etwa 35 Prozent zurück, was auf verstärkte Strafverfolgungsmaßnahmen, verbesserte internationale Zusammenarbeit und eine zunehmende Zahlungsverweigerung der Opfer zurückzuführen ist. […]

Reinhard Schröckner, Managing Director bei MannundMouse (c) timeline / Rudi Handl
Interview

„Resilienz als dynamischen Prozess begreifen, der ständig angepasst werden muss“

Unterbrochene Lieferketten, gestiegene Energiekosten, Inflation, immer besser ausgeführte Cyberangriffe nicht zuletzt dank des Einsatzes von Künstlicher Intelligenz sind Herausforderungen, die sich Unternehmen gegenwärtig stellen müssen. Wie man sein Unternehmen resilienter machen und im Fall eines Falles die Ausfallzeiten so gering wie möglich halten kann, erklärt Reinhard Schröckner, Managing Director bei MannundMouse, im ITWELT.at-Interview. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*