Mustererkennung

Die Fähigkeit, in Chaos und Zufall Struktur zu erkennen, macht den Unterschied zwischen Erfolg und Misserfolg. Big Data und Enterprise Search liefern genau jene Werkzeuge, die zum Aufspüren von Mustern führen. [...]

Die Experten des Suchmaschinen-Spezialisten ließen das System nach Korrelationen zwischen der Häufigkeit bestimmter Suchbegriffe und der Ausbreitung von Grippewellen über Zeit und Raum untersuchen. Insgesamt haben sie 450 Millionen unterschiedliche mathematische Modelle auf ihre Tauglichkeit geprüft. Unterm Strich erhielten die Data Scientists eine Liste von 45 Suchbegriffen, die eine starke Korrelation zwischen der Grippevorhersage und den amtlichen Zahlen zur Verbreitung der Epidemie aufwiesen. Damit war das Muster erkannt und eine Vorhersage in Echtzeit möglich.

ENTERPRISE SEARCH
Suchmaschinen, vor allem in der Form von Enterprise Search, nehmen in der heutigen Big-Data-Welt eine wichtige Rolle ein, da sie nicht nur mit großen Datenbeständen umgehen können, sondern auch quasi am Herzschlag von Big Data agieren. Enterprise Search ist, auf den Punkt gebracht, die Kunst, unstrukturierte Daten in strukturierte zu verwandeln. Mit anderen Worten: Sie erkennen im vermeintlichen Chaos Muster. Daniel Fallmann, Gründer und Geschäftsführer des Linzer Enterprise-Search-Anbieters Mindbreeze beschreibt im Gespräch mit der COMPUTERWELT, wo im Geschäftsalltag dieses Prinzip Vorteile bringt.

Beispiel 1: Ein Versicherungsunternehmen und das Problem, mit unterschiedlichsten Datenquellen und Formaten umgehen zu müssen. „Früher haben die Sachbearbeiter Briefe, zum Beispiel Schadensmeldungen, bekommen, die einem gewissen Standard entsprochen haben. Heute sind es neben Briefen auch E-Mails, Tweets, Word-Dokumente, Fotos etc., die meist unstrukturiert und zudem fehlerhaft sind. Viele E-Mails werden abgeschickt, ohne den Inhalt nochmals zu überprüfen“, sagt Fallmann.

Aus diesem Grund brauche es ein System, das dem Versicherer hilft, den Posteingang – egal in welchem Format oder in welcher Qualität – automatisch vorzuklassifizieren. Enterprise-Search-Lösungen machen dies etwa mit Entity Extraction, wo bestimmte Muster erkannt werden, beispielsweise Polizzennummern, Kfz-Kennzeichen, ein Datum oder Personen – und Firmennamen. Ist eine Polizzennummer falsch geschrieben, kann das System auf Basis semantischer Suche Korrekturvorschläge machen: Da die Bestandskundendatenbank indiziert ist, stellt die Lösung automatisiert die Verbindung von Person und Polizzennummern her und kann daher Fehler aufspüren. Und: Das System ist selbstlernend und kann gelernte Inhalte auf neue Inhalte anwenden. „Damit wird das Monkey Business, wie wir es nennen, in den Hintergrund gedrängt, und die Sachbearbeiter können sich auf die wirklich wichtigen und anspruchsvollen Themen konzentrieren, anstatt den ganzen Tag Schadensmeldungen zu klassifizieren und zu korrigieren.“

GEBALLTES KNOWHOW
Im zweiten Beispiel, das Daniel Fallmann beschreibt, ist die Service-Abteilung, die gerne mit Kundenanfragen bzw. mit Beschwerden konfrontiert ist, Zielgruppe für Enterprise-Search-Lösungen. Hier gilt es, das Wissen, das im Unternehmen verteilt ist, möglichst automatisiert und kostengünstig zusammenzuführen. Während klassische Wissensmanagement-Systeme stark in die Datenstruktur eingreifen und damit die Budgets deutlich belasten, bleiben bei Enterprise Search die Daten dort, wo sie produziert werden. Intelligente Suchanwendungen finden damit über alle Abteilungsgrenzen hinweg und innerhalb der gewohnten Applikationen statt. Mit diesem dank Enterprise Search geballten Wissen können viele Anfragen bereits auf der Unternehmens-Website abgefangen werden. „Damit entlastet man deutlich das Call Center“, so Fallmann. Hilft die Website einmal nicht weiter, können Call-Center-Mitarbeiter, die nur selten Spezialisten in dem gefragten Fachbereich sind, rasch mit Hilfe von Suchanwendungen den Wissensschatz des Unternehmens durchforsten.

HEALTH CARE
„Das Gesundheitswesen ist prädestiniert für Enterprise Search, weil Inhalte, die dort gespeichert werden, zu einem großen Teil unstrukturiert sind“, sagt Fallmann über das dritte Beispiel Health Care. Das Besondere an diesem Business Case ist, dass es im deutschsprachigen Raum mit ICD-10 eine medizinische Klassifikation gibt, die den Einsatz von Enterprise Search in Spitälern tatkräftig unterstützt. „Diese Ausgangsbasis ist ideal, um einer Suchmaschine die Sinnzusammenhänge mitzugeben.“

Auf Basis von Thesaurus,
Semantik und selbstlernender Methodik ist die Enterprise-Search-Lösung in der Lage, diverse Inhalte wie Laborbefunde oder Medikation zu verknüpfen und bestimmte Krankheitsbilder und Behandlungsmethoden zuzuordnen. „Das hilft vor allem dem behandelnden Arzt, dem Qualitätsmanagement, aber auch der Forschung, da so Muster erkannt werden“, so der Mindbreeze-Chef.

Mustererkennung hilft, wie eingangs beschrieben, in einem komplexen Spiel wie Schach, die Nase vorne zu haben. Die gleichen Prinzipien werden jedoch auch schlagend, wenn es darum geht, Leben zu retten. (wf)

Dieser Artikel ist aus dem COMPUTERWELT-Special „Top 1001 2014“. Sie finden dieses Sonderheft, und viele andere Ausgaben, hier als PDF.


Mehr Artikel

News

Bad Bots werden immer menschenähnlicher

Bei Bad Bots handelt es sich um automatisierte Softwareprogramme, die für die Durchführung von Online-Aktivitäten im großen Maßstab entwickelt werden. Bad Bots sind für entsprechend schädliche Online-Aktivitäten konzipiert und können gegen viele verschiedene Ziele eingesetzt werden, darunter Websites, Server, APIs und andere Endpunkte. […]

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*