Mustererkennung

Die Fähigkeit, in Chaos und Zufall Struktur zu erkennen, macht den Unterschied zwischen Erfolg und Misserfolg. Big Data und Enterprise Search liefern genau jene Werkzeuge, die zum Aufspüren von Mustern führen. [...]

Die Experten des Suchmaschinen-Spezialisten ließen das System nach Korrelationen zwischen der Häufigkeit bestimmter Suchbegriffe und der Ausbreitung von Grippewellen über Zeit und Raum untersuchen. Insgesamt haben sie 450 Millionen unterschiedliche mathematische Modelle auf ihre Tauglichkeit geprüft. Unterm Strich erhielten die Data Scientists eine Liste von 45 Suchbegriffen, die eine starke Korrelation zwischen der Grippevorhersage und den amtlichen Zahlen zur Verbreitung der Epidemie aufwiesen. Damit war das Muster erkannt und eine Vorhersage in Echtzeit möglich.

ENTERPRISE SEARCH
Suchmaschinen, vor allem in der Form von Enterprise Search, nehmen in der heutigen Big-Data-Welt eine wichtige Rolle ein, da sie nicht nur mit großen Datenbeständen umgehen können, sondern auch quasi am Herzschlag von Big Data agieren. Enterprise Search ist, auf den Punkt gebracht, die Kunst, unstrukturierte Daten in strukturierte zu verwandeln. Mit anderen Worten: Sie erkennen im vermeintlichen Chaos Muster. Daniel Fallmann, Gründer und Geschäftsführer des Linzer Enterprise-Search-Anbieters Mindbreeze beschreibt im Gespräch mit der COMPUTERWELT, wo im Geschäftsalltag dieses Prinzip Vorteile bringt.

Beispiel 1: Ein Versicherungsunternehmen und das Problem, mit unterschiedlichsten Datenquellen und Formaten umgehen zu müssen. „Früher haben die Sachbearbeiter Briefe, zum Beispiel Schadensmeldungen, bekommen, die einem gewissen Standard entsprochen haben. Heute sind es neben Briefen auch E-Mails, Tweets, Word-Dokumente, Fotos etc., die meist unstrukturiert und zudem fehlerhaft sind. Viele E-Mails werden abgeschickt, ohne den Inhalt nochmals zu überprüfen“, sagt Fallmann.

Aus diesem Grund brauche es ein System, das dem Versicherer hilft, den Posteingang – egal in welchem Format oder in welcher Qualität – automatisch vorzuklassifizieren. Enterprise-Search-Lösungen machen dies etwa mit Entity Extraction, wo bestimmte Muster erkannt werden, beispielsweise Polizzennummern, Kfz-Kennzeichen, ein Datum oder Personen – und Firmennamen. Ist eine Polizzennummer falsch geschrieben, kann das System auf Basis semantischer Suche Korrekturvorschläge machen: Da die Bestandskundendatenbank indiziert ist, stellt die Lösung automatisiert die Verbindung von Person und Polizzennummern her und kann daher Fehler aufspüren. Und: Das System ist selbstlernend und kann gelernte Inhalte auf neue Inhalte anwenden. „Damit wird das Monkey Business, wie wir es nennen, in den Hintergrund gedrängt, und die Sachbearbeiter können sich auf die wirklich wichtigen und anspruchsvollen Themen konzentrieren, anstatt den ganzen Tag Schadensmeldungen zu klassifizieren und zu korrigieren.“

GEBALLTES KNOWHOW
Im zweiten Beispiel, das Daniel Fallmann beschreibt, ist die Service-Abteilung, die gerne mit Kundenanfragen bzw. mit Beschwerden konfrontiert ist, Zielgruppe für Enterprise-Search-Lösungen. Hier gilt es, das Wissen, das im Unternehmen verteilt ist, möglichst automatisiert und kostengünstig zusammenzuführen. Während klassische Wissensmanagement-Systeme stark in die Datenstruktur eingreifen und damit die Budgets deutlich belasten, bleiben bei Enterprise Search die Daten dort, wo sie produziert werden. Intelligente Suchanwendungen finden damit über alle Abteilungsgrenzen hinweg und innerhalb der gewohnten Applikationen statt. Mit diesem dank Enterprise Search geballten Wissen können viele Anfragen bereits auf der Unternehmens-Website abgefangen werden. „Damit entlastet man deutlich das Call Center“, so Fallmann. Hilft die Website einmal nicht weiter, können Call-Center-Mitarbeiter, die nur selten Spezialisten in dem gefragten Fachbereich sind, rasch mit Hilfe von Suchanwendungen den Wissensschatz des Unternehmens durchforsten.

HEALTH CARE
„Das Gesundheitswesen ist prädestiniert für Enterprise Search, weil Inhalte, die dort gespeichert werden, zu einem großen Teil unstrukturiert sind“, sagt Fallmann über das dritte Beispiel Health Care. Das Besondere an diesem Business Case ist, dass es im deutschsprachigen Raum mit ICD-10 eine medizinische Klassifikation gibt, die den Einsatz von Enterprise Search in Spitälern tatkräftig unterstützt. „Diese Ausgangsbasis ist ideal, um einer Suchmaschine die Sinnzusammenhänge mitzugeben.“

Auf Basis von Thesaurus,
Semantik und selbstlernender Methodik ist die Enterprise-Search-Lösung in der Lage, diverse Inhalte wie Laborbefunde oder Medikation zu verknüpfen und bestimmte Krankheitsbilder und Behandlungsmethoden zuzuordnen. „Das hilft vor allem dem behandelnden Arzt, dem Qualitätsmanagement, aber auch der Forschung, da so Muster erkannt werden“, so der Mindbreeze-Chef.

Mustererkennung hilft, wie eingangs beschrieben, in einem komplexen Spiel wie Schach, die Nase vorne zu haben. Die gleichen Prinzipien werden jedoch auch schlagend, wenn es darum geht, Leben zu retten. (wf)

Dieser Artikel ist aus dem COMPUTERWELT-Special „Top 1001 2014“. Sie finden dieses Sonderheft, und viele andere Ausgaben, hier als PDF.


Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*