Sprachtechnologie aus Österreich

Die Mensch-Maschine-Kommunitkation via Sprache ist wohl die beste Kommunikationsvariante. Nachfolgend ein kurzer Ausflug in die Geschichte der Sprachtechnologie sowie vier Präsentationen von österreichischen Entwicklungen mit enormen Potenzial. [...]

Sprachtechnologie hat ein enormes Potenzial. (c) Pixabay

Dank Alexa, Siri oder Cortana ist Sprachtechnologie heute in der Gesellschaft angekommen. Dennoch ist diese Technoloige wie auch die Computertechnologie, auf der sie fußt, relativ jung. Nach ersten Versuche in den 1950er Jahren sowie die DARPA-Spracherkennungsforschungen in den 1970er Jahren, liegt der Beginn einer Sprachtechnologie mit praktischem Nutzen in den 1980er Jahren als IBM 1984 an einem Spracherkennungssystem zu arbeiten begann.

Daraus entwickelte sich 1993 das für den Massenmarkt konzipierte IBM Personal Dictation System, das 1994 zu Voice Type und 1997 zu ViaVoice mutierte. 1997 erschien erstmals Dragon NaturallySpeaking und 1998 brachte Philips Speech Recognition Systems ihr FreeSpeech 98 auf den Markt. Hier ist zu anzumerken, dass die Philips-Sprachentwicklung ihren Sitz in Wien hatte. 2008 wurde dies für 65 Millionen Euro an Nuance verkauft, die die Abteilung weiterhin in Wien beließ. Wer ist Nuance? In den 1990er Jahren war eine der erfolgreichsten Spracherkennungsfirmen das belgische Unternehmen Lernout & Hauspie (L&H), das 1997 Kurzweil Applied Intelligence und 2000 Dragon System übernommen hatte. Die L&H-Technik fand sogar Eingang in Windows XP.

Nach einem Buchhaltungsskandal wurde L&H von ScanSoft übernommen, die sich 2005 in Nuance umbenannten. Ihre Technologie wurde u.a. von Apple lizenziert. um den Sprachassistenten Siri zu schaffen. Mit der Nuance-Entwicklung in Wien kommt Österreich in der Sprachtechnologie internationale Bedeutung zu. Auch die hiesige Forschung spielt ganz vorne mit, vor allem das Austrian Research Institute of Artificial Intelligence (OFAI) ist hier zu nennen. Es betreibt seit 35 Jahren zwar hauptsächich KI-Forschung, aber ist auch stark im Bereich NLP (Natural Language Processing) tätig. Wie innovativ die Startup-Szene im Bereich Sprachtechnologie hierzulande ist, zeigen die vier Beispiele auf den folgenden Seiten.

thinkers.ai: KI-Suchmaschine findet relevante Information

Die Wiener thinkers GmbH entwickelt ihre Suchmaschinentechnologie mit dem Fokus darauf, Nutzern mit relevanten Informationen einen echten Durchblick im Netz zu verschaffen – und das bei höchstmöglichem Komfort. Die eingesetzte Technik automatisiert manuelle Internetrecherchen zu komplexen Themen mit Hilfe von Machine Learning und Text Mining, worauf Analytics- und Predictive-Analytics-Tools aufsetzen und automatisierte Auswertungen von Suchergebnissen ermöglichen.

Das Unternehmen verwendet hauptsächlich Eigenentwicklungen, und greift, wo es sinnvoll ist, auf Open-Source-Lösungen zurück. Wichtig sei das gesamtheitliche »Kochrezept«, das letztlich die Qualität ausmache, die der Kunde bekommt, betont Isabell Claus, Managing Director bei der thinkers GmbH. Hierfür braucht es viel Erfahrung, die vor allem Wolfgang Ecker-Lala mit 25 Jahren Praxis in der Anwendung von Technischer Mathematik und in der Bearbeitung von Big-Data-Problemstellungen aus sämtlichen Branchen mitbringt. »Gepaart mit auf Text Mining hochspezialisierten Data Scientists haben wir ein wirklich schwer kopierbares Knowhow«, beschreitb Claus den USP ihres Unternehmens.

Man lerne stetig viel Neues in Sachen Technologie und Kundenanforderungen, so Claus, die hier insbesondere in Europa Handlungsbedarf sieht: »Wir sehen in Europa zu oft, dass tolle Technologien entwickelt werden, aber erst viel zu spät auf Marktbedarf, tatsächliche Nutzerbedürfnisse und daraus resultierende Geschäftsmodelle geschaut wird.« Dabei seien die Möglichkeiten der Digitalisierung und im Speziellen der Bereich Sprachtechnologie hochspannend und würden laut Claus viel verändern, was heute noch nicht möglich oder vorstellbar erscheine. Gegenwärtig zählt thinkers.ai vor allem Großunternehmen zu seinen Kunden. Künftig will man auch kleineren Firmen Zugang zu den für sie relevanten Informationen verschaffen.

Letzlich will thinkers.ai seine Kunden in die Lage versetzen, wesentliche Informationen mit ihrer Technologie viel besser zu erkennen und dann mit den hervorragenden Fähigkeiten des menschlichen Gehirns in den Bereichen Analytik und des Schlüsseziehens verknüpfen. Dadurch sollen bessere Entscheidungen getroffen und die Unternehmen international wettbewerbsfähiger werden.

uugot.it: Lern- und Lehr-App für den Spracherwerb

uugot.it ist eine österreichische Applikation für PC, Tablet und Smartphone, die das Lehren und Lernen der deutschen Sprache mit audiovisuellen Medien und Smart-Subtitles (»intelligente Untertitel«) zum Ziel hat. Durch diese Technologie wird österreichisches Fernsehen für Menschen mit nichtdeutscher Erstsprache bereits ab sehr frühen Sprachniveaus verständlich gemacht und fördert den Integrationsprozess. uugot.it ist an Mediatheken von Fernsehgesellschaften angebunden und fügt zu jeder Sendung interaktive intralinguale Untertitel hinzu. Es handelt sich um aktuelle Sendungen, die mit der Originaltonspur in deutscher Sprache und deutschen Untertiteln angezeigt werden. Wird ein Wort nicht verstanden, bekommt der Nutzer simultan per Mausklick oder Touch die Übersetzung des Wortes in seiner Erst- oder einer Brückensprache eingeblendet. Dieses wird außerdem automatisiert für späteres Lernen in seinem persönlichen Lernbereich gespeichert.

»Die interaktiven Untertitel sind das Herzstück unseres Produkts«, erklärt Klemens Zleptnig, CTO bei uugot.it. Als Basissprache wird vorerst Deutsch unterstützt, und die Wörter werden von uugot.it automatisiert in derzeit elf Sprachen übersetzt. Die maschinengestützte Übersetzung steht dabei im Mittelpunkt. Hier setzt das Unternehmen Natural-Language-Processing-Technologien ein, um Texte und Wörter besser zu analysieren und die Übersetzungen in einem Pre- und Postprocessing zu verbessern. »Wir nutzen verschiedene bestehende Sprachtechnologien, kombinieren diese, und reichern sie mit unseren eigenen Algorithmen an. Dabei setzen wir primär auf Open-Source-Tools, aber auch auf Services und APIs, wo es Sinn macht«, beschreibt der CTO die verwendete Sprachtechnologie. In den vergangenen Jahren habe man an Erwachsenbildungsinstituten zahlreiche Pilotphasen abgewickelt, 2021 wolle man uugot.it an Bildungsinstituten institutionalisieren, blickt Zleptnig in die Zukunft.

webLyzard: Mit automatisierten Analysen besser entscheiden

Das Technologieunternehmen webLyzard wurde 2008 gegründet und bietet eine international führende Big-Data-Plattform zur automatisierten Analyse und Visualisierung digitaler Inhalte. Die semantischen Verfahren von webLyzard beruhen auf einer zwanzigjährigen Forschungs- und Entwicklungsarbeit und liefern wertvolle Indikatoren für die Messung von Kommunikationserfolg sowie die Entscheidungsunterstützung und strategische Positionierung einer Organisation. Bedeutende Referenzkunden in Europa und den Vereinigten Staaten unterstreichen die Leistungsfähigkeit des Systems – unter anderem wurde die webLyzard-Plattform bereits für Projekte der Vereinten Nationen und der US-Klimabehörde NOAA eingesetzt (Infos unter www.weblyzard.com/showcases).

Bei webLyzard wird Sprachtechnologie eingesetzt, um Erkenntnisse aus der öffentlichen Debatte zu erzielen und Entscheidungen zu unterstützen – etwa durch die Analyse der Nachrichtenberichterstattung, sozialer Medien sowie Community-Foren. Arno Scharl, Managing Partner bei webLyzard konkretiert: »Die zur Anwendung kommenden Methoden reichen von der Sentiment-Analyse (diese ermittelt, ob Themen in einem positiven oder negativen Licht dargestellt werden) und Bestimmung menschlicher Emotionen bis hin zur geografischen Verortung oder der Vorhersage künftiger Themen.« Solche Analysen lieferten wichtige Kennzahlen und leistungsfähige Werkzeuge, um die Wirkung von Öffentlichkeitsarbeit und Marketing-Maßnahmen beurteilen zu können, so Scharl.

Bei der Sprachtechnoogie, die bei webLyzard zum Einsatz kommt, nutzt man für Standard-Prozesse, wie Spracherkennung, Wortsegmentierung oder Part-of-Speech-Annotation, allgemein verfügbare Werkzeuge, wie jene der Stanford NLP-Gruppe. »Die gesamte darüber hinausgehende Verarbeitungskette wurde allerdings in-house entwickelt«, bestätigt Scharl. Dies umfasst die Berechnung syntaktischer Informationen und Integration der Daten, die Wissensextraktion und Anreicherung der erfassten Inhalte mit den generierten Metadaten sowie die interaktive Visualisierung dieser Metadaten. Dabei setzt webLyzard laut Scharl sowohl auf lexikalische Verfahren als auch auf maschinelles Lernen in Kombination mit statistischen Sprachmodellen und Wissensgraphen.

Taxtastic: Sprachtechnologie in der Steuerberatung

Das Ziel von taxtastic ist, mit Hilfe digitaler Tools, die Zusammenarbeit zwischen Steuerberatern und Klienten zu automatisieren und die Kommunikationskanäle in eine einzige Anwendung zu bringen. Hierbei spielt Sprachtechnologie eine Rolle, wie CTO Alexander Zehetmaier erklärt: »Das in-house entwickelte Natural-Language-Processing-System bietet die Möglichkeit, Produkte in Kontext zu setzen, diese zu verstehen und steuerrechtlich zu beurteilen und ordnet diese dann automatisch den etwaigen Steuerklassen zu. Diese Zuordnung wird visualisiert und übersichtlich und verständlich für Steuerberater und Steuerberaterinnen aufbereitet, die diese nur mehr freigeben müssen. Was früher mühsam vom Steuerberater erledigt wurde, wird automatisiert und der Steuerberater kann sich auf sein Kerngeschäft – die bestmögliche Beratung seiner Kunden und Kundinnen – konzentrieren.«

Das NLP System ist eine Kombination aus bereits existierenden APIs und verschiedensten Machine Learning Algorithmen. Simple Algorithmen wie Naive Bayes aber auch neueste Transformer-Technologien werden dabei zum Einsatz gebracht. Zusätzlich setzt taxtastic auf sogenanntes Meta Learning, bei dem der Output der Durchschnitt von mehreren Algorithmen ist. Man könne sich das wie eine demokratische Abstimmung unter Algorithmen vorstellen, nur dass gewisse moderne Algorithmen Vorrang und mehr Stimmrecht zugeschrieben werde, erklärt Zehetmaier die Funktionsweise der Technologie.

Die Technik von taxtastic befindet sich noch in der Entwicklungsphase, man arbeite gegenwärtig an einem Proof-of-Concept, so Zehetmaier und fügt hinzu: »Der Umstand, dass wir bereits vor Projektstart Pilotkunden und Partner für das Projekt gewinnen konnten, spiegelt die Akzeptanz der Branche wieder.«

taxtastic positioniert sich als State-of-the-art-Machine-Learning-Unternehmen und verfolgt genau die neuesten technologischen Entwicklungen, um so möglichst viel Mehrwert für die Branche der Steuerberatung bieten zu können. Für das taxtastic-Team ist das Potenzial von Natural Language Processing jedenfalls längst noch nicht ausgereizt.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*