Was Sie über Maschinelles Lernen wissen müssen

Das Thema Machine Learning ist in aller Munde. Doch was verbirgt sich hinter dem Begriff - und welche Chancen bieten sich für Unternehmen? [...]

WELCHE VERFAHREN WERDEN BEIM MACHINE LEARNING VERWENDET?
Maschinelles Lernen nutzt mathematische und statistische Modelle, um aus Datenbeständen zu lernen. Im Detail gibt es Dutzende unterschiedlicher Verfahren. Prinzipiell unterscheidet man beim maschinellen Lernen zwischen zwei Systemen: Erstens symbolische Ansätze wie aussagenlogische Systeme, in denen das Wissen – sowohl die Beispiele als auch die induzierten Regeln – explizit repräsentiert ist. Zweitens subsymbolische Systeme wie Künstliche Neuronale Netze, die nach dem Vorbild des menschlichen Gehirns funktionieren und in denen das Wissen implizit repräsentiert ist.
Die algorithmische Umsetzung von Machine Learning geschieht mit überwachtem oder unüberwachtem Lernen. Beim überwachten Lernen lernt das System aus gegebenen Paaren von Ein- und Ausgaben. Dabei stellt ein „Lehrer“ während des Lernens den passenden bzw. korrekten Wert zu einer Eingabe bereit. Ziel beim überwachten Lernen ist, dass dem Netz nach mehreren Rechengängen mit unterschiedlichen Ein- und Ausgaben die Fähigkeit antrainiert wird, Verbindungen herzustellen. Beim unüberwachten Lernen erzeugt ein Algorithmus ein Modell, das die Eingaben beschreibt und Vorhersagen ermöglicht. Das Netz erstellt dann selbständig Klassifikatoren, nach denen es die Eingabemuster einteilt.
WIE FUNKTIONIERT EIN KÜNSTLICHES NEURONALES NETZ?
Künstliche Neuronale Netze simulieren nach dem Vorbild des Gehirns ein Netzwerk aus miteinander verbundenen Neuronen. Sie lernen aus Erfahrung, indem sie die Verbindungsstärke der simulierten Neuronenverbindungen verändern. Auf diese Art und Weise können sich Maschinen Fähigkeiten wie Sehen, Hören, Sprechen, Lesen und Schreiben aneignen. Um sie für diese Fähigkeiten zu trainieren, werden Methoden des überwachten Lernens angewendet.
Der Lernprozess läuft grob gesagt wie folgt ab: Zunächst lernt das Netz in der Trainingsphase anhand des vorgegebenen Materials. Der „Trainer“ gibt dem Netz eine Reihe von Beispielen und wiederholt das Ganze. Für jedes Beispiel ist bekannt, was die gewünschte Ausgabe sein soll. Stimmt die Ausgabe des Netzes für ein Beispiel mit dem gewünschten Output überein, dann braucht nichts weiter getan zu werden. Weichen tatsächliche und gewünschte Ausgabe voneinander ab, dann müssen die Verbindungsstärken bzw. Gewichte im Netz so verändert werden, dass sich der Fehler bei der Ausgabe verringert.
Je größer der Betrag des Gewichtes ist, desto größer ist der Einfluss eines Neurons auf ein anderes Neuron. Ein positives Gewicht übt auf ein anderes Neuron einen erregenden, verstärkenden Einfluss auf, ein negatives einen hemmenden. Das Gewicht der Verbindung bestimmt also maßgeblich, ob ein Neuron von einem anderen beeinflusst wird. Es ist einer der entscheidenden Faktoren für Lernvorgänge, man kann sagen: Das Wissen eines neuronalen Netzes ist in den Gewichten gespeichert. Dieser Trainings-Prozess erfolgt im Idealfall so lange, bis alle Beispiele richtig berechnet werden. Der ganze Lernprozess ist also ein iterativer Vorgang bei dem ein spezieller Algorithmus die Gewichte so einstellt, dass der Output möglichst genau dem bekannten Ergebnis entspricht.
WAS IST DEEP LEARNING?
Deep Learning ist die derzeit erfolgreichste Implementierung eines Künstlichen Neuronalen Netzes. Zugleich ist Deep Learning inzwischen auch das am weitesten verbreitete maschinelle Lernverfahren und wird von großen IT-Unternehmen wie Google, Apple oder Facebook eingesetzt. Die Spracherkennung von iPhone „Siri“ basiert beispielsweise auf Deep Learning. Eines der wichtigsten Einsatzgebiete für Deep Learning ist neben der Sprachverarbeitung das Erkennen von Objekten in Bildern.
Das Verfahren macht viele Arbeitsschritte klassischer Neuronaler Netze überflüssig, weil der Computer alle Zwischenschritte übernimmt. Der Forscher muss dem Neuronalen Netzwerk lediglich Daten wie zum Beispiel Bilder präsentieren; wie diese zu identifizieren sind, findet das Netz dann ganz von allein heraus.
Deep Learning verwendet den analogen Mechanismus, wie ein Kleinkind beispielweise den Begriff „Hund“ lernt: Zunächst werden dem Computerprogramm Trainingsdaten zur Verfügung gestellt, beispielsweise eine Reihe von Bildern, von denen ein Mensch jedes mit den Meta-Tags „Hund“ oder „nicht Hund“ markiert hat. Das Programm verwendet die Informationen, die es aus den Trainingsdaten erhält, um ein Feature-Set für Hunde zu erzeugen und ein Vorhersagemodell zu bauen.
Die Einheiten der ersten Ebene registrierten lediglich Helligkeitswerte der Pixel. Die nächste Ebene würde erkennen, dass einige der Pixel zu Linien verbunden sind, woraufhin die darauffolgende zwischen horizontalen und vertikalen Linien unterscheidet. Dies geht so weiter bis schließlich eine Ebene erreicht wird, in der Beine unterschieden werden können.
In einem weiteren Modell würde der Computer vielleicht vorhersagen, dass alles in einem Bild, das vier Beine hat, ein Hund ist, bis er schließlich soweit ist, Hunde von Nicht-Hunden unterscheiden zu können. Bei jeder Iteration wird das Vorhersagemodell, das der Computer erstellt, immer komplexer und genauer.
Deep Learning Verfahren lernen erst Low-Level Elemente wie Helligkeitswerte, dann Elemente auf mittlerer Ebene und schließlich High-Level Elemente wie ganze Gesichter. (c) Nvidia
KANN MACHINE LEARNING MIT MENSCHLICHEN LERNEN MITHALTEN?
Ja. Das beweisen immer wieder Mensch-Maschine-Wettkämpfe, die höchste kognitive Fähigkeiten erfordern. So hat IBMs kognitives lernbasiertes System Watson in einem TV-Wissensquiz schon im Jahr 2011 die menschlichen Kandidaten klar geschlagen. Im letzten aufsehenerregenden Mensch-Maschine Wettkampf besiegte Googles AlphaGo Machine-Learning-System Anfang 2016 den amtierenden Go-Weltmeister in einem Spiel über fünf Runden deutlich mit 4:1. AlphaGo nutzte eine Variante des Deep-Learning-Verfahrens.
Das asiatische Strategiespiel galt bisher aufgrund seiner Komplexität als zu kompliziert für Computer, weil es eine nahezu unbegrenzte Zahl möglicher Positionen gibt. Die Spieler müssen sich daher meist auf ihre Intuition verlassen. Der entwickelte AlphaGo-Algorithmus hilft Google nun unter anderem beim Stromsparen. Mithilfe des Algorithmus konnte in Googles Rechenzentren der Energieverbrauch um 15 Prozent verringert werden.
Maschine schlägt Mensch: 2016 besiegte Googles Machine Learning System AlphaGo den Weltmeister im Spiel Go. (c) Google
WAS SIND DIE POPULÄRSTEN ANWENDUNGEN MASCHINELLEN LERNENS?
Maschinelles Lernen findet man bei den Empfehlungsdiensten von Amazon und Netflix ebenso wie bei der Gesichtserkennung von Facebook. Die Möglichkeit, einzelne Mitglieder mit ihren Namen auf Bildern zu markieren, hat bei Facebook zur weltweit größten Sammlung von Gesichtern in einer Datenbank geführt. Diese Daten kann Facebook nutzen, um Maschinen gezielt auf visuelle Erkennung zu schulen.
Auch hinter E-Mail-Anwendungen, die automatisch Spam erkennen, stecken maschinelle Lernverfahren. Der Computer analysiert die Daten, die in der E-Mail enthalten sind, und kategorisiert diese gemäß den erkannten Mustern als Spam oder Nicht-Spam. Wird eine Nachricht als Junk markiert, lernt der Rechner und kann dadurch Junk-Nachrichten noch besser identifizieren. Ebenfalls angewendet werden Lernverfahren bei der Abwehr von Computerattacken, der Bekämpfung von Internet-Kriminalität und dem Suchmaschinen-Ranking.
WIE LÄSST SICH MACHINE LEARNING KOMMERZIELL ANWENDEN?
Maschinelles Lernen verwandelt Business-Daten in bare Münze. Unternehmen, die maschinelle Lernverfahren nutzen, können sowohl ihren Umsatz als auch die Kundenzufriedenheit steigern und gleichzeitig Kosten reduzieren. So hilft Machine Learning beispielsweise, die Bedürfnisse von Kunden genauer zu erkennen. Werbemaßnahmen können personalisiert werden. Das verbessert nicht nur das Kundenerlebnis, sondern erhöht auch die Kundenbindung.
Maschinelles Lernen hilft auch, zu erkennen, dass Kunden möglicherweise in nächster Zeit abwandern. Dafür werden zum Beispiel Supportanfragen von Kunden automatisch ausgewertet. Oder man extrahiert aus bereits abgewanderten Kunden diejenigen Merkmale, die sie gemeinsam haben. Selektiert man auf Basis dieser Merkmale Kunden des aktuellen Kundenbestands, erhält man die aktuell abwanderungsgefährdeten Kunden. Diese können dann gezielt „umsorgt“ werden.
Im telefonischen Kundenservice werden schon heute immer mehr Chat-Bots eingesetzt – automatisierte Programme, die mit dem Kunden kommunizieren. Durch die Sammlung von Stimmdaten in verschiedenen Situationen kann der Chat-Bot seine kognitive Fähigkeit zur Interpretation des Umgangstons verbessern. Und noch viel wichtiger: Der Bot kann den Anruf an einen Call-Center-Mitarbeiter weiterleiten, wenn ein komplexeres Problem vorliegt.
Durch den automatischen Abgleich von Lebensläufen kann maschinelles Lernen helfen, schneller die besten Kandidaten für eine Stelle zu finden. Sie können strukturierte und unstrukturierte Kontextinformationen analysieren und automatisch Berichte generieren. Statt in der Versicherungsbranche jede Forderung manuell von einem Mitarbeiter prüfen zu lassen, können Versicherungsunternehmen Maschinen einsetzen, um in simplen Versicherungsfällen eine Vorentscheidung zu treffen und ein Antwortschreiben aufzusetzen.
Maschinelles Lernen ist auch eine Schlüsseltechnologie für die Entwicklung autonomer Systeme: kollaborative Roboter, die mit ihren menschlichen Kollegen Hand in Hand arbeiten, gehören ebenso dazu wie selbstfahrende Autos.Auch jenseits rein kommerzieller Anwendungen sind die Einsatzgebiete fast unendlich: Automatisierte Diagnoseverfahren, Erkennung von Kreditkartenbetrug und Aktienmarktanalysen sind häufige Anwendungen. Selbstlernende Programme können sogar helfen, Leben zu retten. Forscher der University of Liverpool trainierten beispielsweise ein Programm erfolgreich darauf, die Muster von Landminen in den Daten von Radar- und Akustiksensoren zu erfassen.
WELCHE ANBIETER SIND DIE TECHNOLOGIEFÜHRER BEIM MASCHINELLEN LERNEN?
Die großen Internet- und Technologiekonzerne IBM, Google, Microsoft, Facebook, Amazon und Apple investieren viele Millionen in Machine Learning und nutzen es sehr intensiv. IBMs Supercomputer Watson ist die populärste Appliance für maschinelles Lernen, die zum Beispiel im Finanz- und Gesundheitswesen eingesetzt wird und die wirksamsten Therapien für Patienten findet. Apple nutzt maschinelles Lernen bei seinem Spracherkennungssystem Siri, Microsoft bei Cortana, Facebook bei der Bilderkennung und Google bei vielen seiner Dienste wie im Suchmaschinen-Ranking oder den Bilddiensten.
Alle diese Hersteller bieten viele unterschiedliche Services, die maschinelle Lernverfahren einsetzen und aquirieren immer wieder kleinere Machine-Learning-Startups. In Deutschland hat sich SAP dazu verpflichtet, zukünftig alle Unternehmensanwendungen intelligent zu gestalten und auf breiter Basis zur Verfügung zu stellen. So soll man künftig auf der SAP HANA Cloud Platform auch maschinelles Lernen nutzen können.
IBM Watson integriert mehrere Artificial Intelligence Methoden: Neben maschinellem Lernen sind das Algorithmen der natürlichen Sprachverarbeitung und des Information Retrieval, der Wissensrepräsentation und der automatischen Inferenz. (c) IBM
WIE KANN MAN MACHINE-LEARNING-ANWENDUNGEN ENTWICKELN?
Cloud-Anbieter wie Microsoft, IBM, Google und Amazons Webservice-Sparte haben inzwischen eigene Services für maschinelles Lernen geschaffen. Damit können Entwickler ohne spezielles Machine-Learning Know-how intelligente Anwendungen bauen, die aus einem frei wählbaren Datenbestand lernen. Bei IBM heißt diese Plattform Watson, bei Microsoft ist es das Azure ML Studio, bei Amazon ist es Amazon Machine Learning und bei Google Tensorflow und andere Plattformen.
Zudem gibt es inzwischen ein großes Spektrum an freier, qualitativ hochwertiger Open-Source-Software, die maschinelles Lernen für ein breites Publikum von Datenspezialisten und Entwicklern zugänglich macht. Auf Programmiersprachenebene wird besonders Pyhton favorisiert, Weka ist eine auf Java basierende Open-Source-Software mit zahlreichen Lernalgorithmen. Deeplearning4j ist eine in Java programmierte Open-Source-Software, die ein künstliches neuronales Netz implementiert. Apache Spark schließlich bietet ebenfalls ein bekanntes Machine-Learning-Framework auf Open-Source Basis. Sein umfangreiches Angebot an Algorithmen wird ständig überarbeitet und erweitert.
*Dr. Klaus Manhart ist seit 1999 freier Fachautor für IT und Wissenschaft