Effizienter arbeiten mit Spracherkennung

Eine aktuelle Studie zeigt Herausforderungen und mögliche Vorteile von Spracherkennung und -verarbeitung in der heutigen Arbeitswelt. Richtig eingesetzt bietet die Technologie viel Potenzial, dennoch nutzen – abgesehen von speziellen Branchen – noch relativ wenige Unternehmen Hard- und Software für Spracherkennung und vor allem Sprachverarbeitung. [...]

Mit dem in Wien entwickelten Headset SpeechOne kann die Spracherkennungsrate verbessert werden. (c) Philips

Für die von Philips Speech Processing Solutions in Auftrag gegebene und von der Techconsult GmbH durchgeführte Studie – sie trägt den profanen Namen »Spracherkennung und-verarbeitung in deutschen Unternehmen« – wurde im Oktober 2021 eine Stichprobe von 200 Personen aus allen Branchen und Unternehmensgrößen befragt. Die Situation in Österreich ist wohl mit jener in Deutschland vergleichbar.

Protokolle von Meetings, Mitschriften, aber auch Angebotserstellung sowie Stammdatenpflege – der Einsatz von Spracherkennungstechnologie ist groß. Inbesondere im Rechtswesen und in der Medizin wird die Technik schon seit längerem erfolgreich eingesetzt. Die vielen Standardsätze und das (eintrainierte) Fachvokabular sorgen hier für ein besonders leichte Nutzung und gute Erkennung. Deswegen lassen sich hier vermutlich auch die besten Effizienzsteigerungen mit Sprachtechnologie erzielen. 

Zurück zur Studie: Als Probleme oder Herausforderungen beim Umgang mit sprachlicher Information nannten 38 Prozent der Befragten eine schlechte Akustik, gefolgt von 33 Prozent, die »zu viele sprachliche Informationen, um schnell mitzuschreiben« angaben. 25 Prozent sagten, dass sie sich durch das Mitschreiben nicht auf die eigentlichen Inhalte konzentrieren können – 22 Prozent hatten keines dieser Probleme.

Die richtigen Voraussetzungen

Um für eine gute Akustik und eine dementsprechende gute Erkennungsrate zu sorgen, ist natürlich die verfügbare Internetverbindung sowie die eingesetzte Hard- und Software entscheidend. Ein gutes und funktionierendes Headset ist beispielsweise besser als das im Laptop integrierte Mikrofon. Wer mit Sprachdateien arbeitet, die später von einer Software transkribiert werden sollen, ist gut beraten, ein hochwertiges Aufnahme- beziehungsweise Diktiergerät zu verwenden und so für möglichst wenige Umgebungsgeräusche zu sorgen.

Effizienzsteigerung mit Software

Neben der Hardware und einer guten Qualität des Audiomaterials bedarf es einer entsprechenden Software, die die Sprachdateien in editierbaren Text umwandelt, man spricht hier von »Speech-to-Text«. Hier können entsprechende Effizienzsteigerungen und Mehrwerte erzielt werden, sei es bereits beim Diktieren oder auch bei der nachträglichen Transkription einer Audiodatei. Als Vorteile nennen die Autoren der Studie, dass die Kunden davon profitieren, wenn die ganze Konzentration auf das Gespräch gelenkt ist. Dies wirke sich positiv auf die Kundenbindung aus und gebe dem Unternehmen ein besseres Image. 

Im Bereich der Stammdatenpflege gibt eine Soft- und Hardware der Spracherkennung bzw. -verarbeitung zum Beispiel Sicherheit. Das eigenständige Zuhören und gleichzeitige Mitschreiben ist fehleranfällig und kann so vermieden werden. Auch im Bereich der Schreibtätigkeiten bringen die Tools einen Mehrwert. Prozesse, bei denen vorher mühevoll diktiert und geschrieben wurde, können nun automatisiert ablaufen. Das erhöht die Produktivität und bringt Kosteneinsparungen mit sich: Laut Studie gehen 35 Prozent der Befragten davon aus, dass die richtige Soft- und Hardware im Bereich der Spracherkennung bzw. -verarbeitung ihnen 10 bis 24 Prozent des Aufwands ersparen würde. 23 Prozent würden sogar eine Aufwandsersparnis von 25 bis 49 Prozent erwarten. Immerhin noch 9 Prozent sehen eine 50- bis 74-prozentige und 3 Prozent der Befragten gar eine 75- bis 100-prozentige Aufwandsersparnis

Dennoch: 62 Prozent der befragten Unternehmen nutzen keine entsprechende Hard- oder Software zur Spracherkennung und -verarbeitung. Am meisten Interesse (64 Prozent) erntet »Speech-to-Text« zur Unterstützung. 59 Prozent der Befragten sehen Gesprächs- und Meetingaufzeichnungen als Erleichterung an. Lösungen wie die Spracherkennung direkt in Programmen (z.B. innerhalb von Word, 55 Prozent), ein Schreibservice durch geschulte Spezialisten (47 Prozent) und die interne Transkription (44 Prozent) sind weitere Möglichkeiten der Unterstützung. Spracherkennung und -verarbeitung wird also durchaus als hilfreiche Technologie betrachtet, jedoch noch wenig genutzt. Hier ist also ein großes Potenzial vorhanden.


Mehr Artikel

News

So werden Unternehmen autonom und resilient

Ein Unternehmen, in dem viele Prozesse automatisiert ablaufen, ohne menschliche Aufsicht, und das sich dabei kontinuierlich selbst optimiert? Fortgeschrittene KI und Automatisierungswerkzeuge liefern die dafür notwendige technische Grundlage, doch die Umsetzung ist in der Regel mit einigen Herausforderungen verbunden. […]

News

Grundlegende Metriken der Datenwiederherstellung: RPO und RTO verständlich gemacht

Wenn es um die Geschäftskontinuität geht, stechen zwei Schlüsselmetriken hervor: Recovery Point Objective (RPO) und Recovery Time Objective (RTO). Oft werden diese verwechselt oder die Diskussion dreht sich um RPO versus RTO. Beide Metriken sind jedoch für die Entwicklung effektiver Datenschutzstrategien und die Minimierung von Unterbrechungen und Datenverlusten unerlässlich. […]

Drohnen, die autonom und ohne GPS navigieren können, wären in der Lage kritische Infrastruktur wie Brücken oder Strommasten selbstständig zu inspizieren. (c) Fikri Rasyid / unsplash
News

Wie Drohnen autonom fliegen lernen 

Von wirklich selbstständigen Robotern, die durch eine komplexe und sich verändernde Umwelt navigieren können, sind wir noch weit entfernt. Neue Ansätze mit KI bieten eine Chance, diese Vorstellung ein Stück weit Realität werden zu lassen. Jan Steinbrener experimentiert an der Universität Klagenfurt mit Drohnen, die genau das versuchen. […]

Christina Decker, Director Strategic Channels Europe bei Trend Micro (c) Trend Micro
Kommentar

Wie der Channel die tickende Zeitbombe „Compliance-Risiko“ entschärfen kann

Cybersicherheitsregulatoren hatten ein geschäftiges Jahr 2024. Zuerst kam die NIS2-Richtlinie, deren Umsetzungsfrist Mitte Oktober ablief. Nur wenige Monate später trat in der gesamten EU der lang erwartete Digital Operational Resilience Act (DORA) in Kraft. Beide Regelwerke wurden dringend benötigt, haben aber auch enormen Druck auf Unternehmen in der Region ausgeübt. Besonders KMU spüren diesen Druck. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*