Eine aktuelle Studie zeigt Herausforderungen und mögliche Vorteile von Spracherkennung und -verarbeitung in der heutigen Arbeitswelt. Richtig eingesetzt bietet die Technologie viel Potenzial, dennoch nutzen – abgesehen von speziellen Branchen – noch relativ wenige Unternehmen Hard- und Software für Spracherkennung und vor allem Sprachverarbeitung. [...]
Für die von Philips Speech Processing Solutions in Auftrag gegebene und von der Techconsult GmbH durchgeführte Studie – sie trägt den profanen Namen »Spracherkennung und-verarbeitung in deutschen Unternehmen« – wurde im Oktober 2021 eine Stichprobe von 200 Personen aus allen Branchen und Unternehmensgrößen befragt. Die Situation in Österreich ist wohl mit jener in Deutschland vergleichbar.
Protokolle von Meetings, Mitschriften, aber auch Angebotserstellung sowie Stammdatenpflege – der Einsatz von Spracherkennungstechnologie ist groß. Inbesondere im Rechtswesen und in der Medizin wird die Technik schon seit längerem erfolgreich eingesetzt. Die vielen Standardsätze und das (eintrainierte) Fachvokabular sorgen hier für ein besonders leichte Nutzung und gute Erkennung. Deswegen lassen sich hier vermutlich auch die besten Effizienzsteigerungen mit Sprachtechnologie erzielen.
Zurück zur Studie: Als Probleme oder Herausforderungen beim Umgang mit sprachlicher Information nannten 38 Prozent der Befragten eine schlechte Akustik, gefolgt von 33 Prozent, die »zu viele sprachliche Informationen, um schnell mitzuschreiben« angaben. 25 Prozent sagten, dass sie sich durch das Mitschreiben nicht auf die eigentlichen Inhalte konzentrieren können – 22 Prozent hatten keines dieser Probleme.
Die richtigen Voraussetzungen
Um für eine gute Akustik und eine dementsprechende gute Erkennungsrate zu sorgen, ist natürlich die verfügbare Internetverbindung sowie die eingesetzte Hard- und Software entscheidend. Ein gutes und funktionierendes Headset ist beispielsweise besser als das im Laptop integrierte Mikrofon. Wer mit Sprachdateien arbeitet, die später von einer Software transkribiert werden sollen, ist gut beraten, ein hochwertiges Aufnahme- beziehungsweise Diktiergerät zu verwenden und so für möglichst wenige Umgebungsgeräusche zu sorgen.
Effizienzsteigerung mit Software
Neben der Hardware und einer guten Qualität des Audiomaterials bedarf es einer entsprechenden Software, die die Sprachdateien in editierbaren Text umwandelt, man spricht hier von »Speech-to-Text«. Hier können entsprechende Effizienzsteigerungen und Mehrwerte erzielt werden, sei es bereits beim Diktieren oder auch bei der nachträglichen Transkription einer Audiodatei. Als Vorteile nennen die Autoren der Studie, dass die Kunden davon profitieren, wenn die ganze Konzentration auf das Gespräch gelenkt ist. Dies wirke sich positiv auf die Kundenbindung aus und gebe dem Unternehmen ein besseres Image.
Im Bereich der Stammdatenpflege gibt eine Soft- und Hardware der Spracherkennung bzw. -verarbeitung zum Beispiel Sicherheit. Das eigenständige Zuhören und gleichzeitige Mitschreiben ist fehleranfällig und kann so vermieden werden. Auch im Bereich der Schreibtätigkeiten bringen die Tools einen Mehrwert. Prozesse, bei denen vorher mühevoll diktiert und geschrieben wurde, können nun automatisiert ablaufen. Das erhöht die Produktivität und bringt Kosteneinsparungen mit sich: Laut Studie gehen 35 Prozent der Befragten davon aus, dass die richtige Soft- und Hardware im Bereich der Spracherkennung bzw. -verarbeitung ihnen 10 bis 24 Prozent des Aufwands ersparen würde. 23 Prozent würden sogar eine Aufwandsersparnis von 25 bis 49 Prozent erwarten. Immerhin noch 9 Prozent sehen eine 50- bis 74-prozentige und 3 Prozent der Befragten gar eine 75- bis 100-prozentige Aufwandsersparnis
Dennoch: 62 Prozent der befragten Unternehmen nutzen keine entsprechende Hard- oder Software zur Spracherkennung und -verarbeitung. Am meisten Interesse (64 Prozent) erntet »Speech-to-Text« zur Unterstützung. 59 Prozent der Befragten sehen Gesprächs- und Meetingaufzeichnungen als Erleichterung an. Lösungen wie die Spracherkennung direkt in Programmen (z.B. innerhalb von Word, 55 Prozent), ein Schreibservice durch geschulte Spezialisten (47 Prozent) und die interne Transkription (44 Prozent) sind weitere Möglichkeiten der Unterstützung. Spracherkennung und -verarbeitung wird also durchaus als hilfreiche Technologie betrachtet, jedoch noch wenig genutzt. Hier ist also ein großes Potenzial vorhanden.
Be the first to comment