Wenn eine Technologie so gehypt wird, wie es seit einiger Zeit bei Machine Learning der Fall ist, sind Missverständnisse und Irrglaube vorprogrammiert. [...]
Maschinelles Lernen erweist sich als ziemlich nützlich. Deswegen ist die Versuchung groß, anzunehmen, dass Machine Learning (ML) im Stande ist, einfach jede Problemstellung zufriedenstellend zu lösen. Wie das bei technologischen Werkzeugen nun mal so ist, ist aber auch maschinelles Lernen nur in bestimmten Aufgabengebieten zur Lösungsfindung geeignet. Im Regelfall sind das genau die Probleme, die schon ewig bestehen, für die Sie aber nie genug Leute einstellen konnten. Oder solche, die zwar eine klare Zielsetzung aufweisen, bis jetzt aber einen Lösungsweg vermissen lassen.
Dennoch ist es wahrscheinlich, dass so gute wie jedes Unternehmen in Zukunft Vorteile aus dem Einsatz von Machine Learning ziehen will: In einer Umfrage von Accenture zeigten sich 42 Prozent der befragten IT-Entscheider davon überzeugt, dass bis zum Jahr 2021 jede ihrer Innovationen KI-getrieben sein wird.
Wenn auch Sie den Einsatz von maschinellem Lernen planen, sollten Sie über den Hype-Tellerrand hinausblicken und gängige Mythen meiden. Nur wenn Sie darüber Bescheid wissen, was Machine Learning kann und was nicht, können Sie bezüglich Ihrer ML-Bemühungen auch mit Erfolg rechnen.
„MACHINE LEARNING GLEICH KÜNSTLICHE INTELLIGENZ“
Machine Learning und Künstliche Intelligenz (KI) werden inzwischen quasi durchgängig synonym gebraucht. Allerdings bezeichnet ML die KI-Technik, die bislang am erfolgreichsten den Weg aus den Forschungslaboren in die echte Welt gefunden hat. Künstliche Intelligenz hingegen umfasst neben maschinellem Lernen auch noch ganz andere Forschungsgebiete wie Robotik, Computer Vision und Natural Language Procession.
Was ist TrensorFlow? Googles Open-Source-Bibliothek für maschinelles Lernen im Fokus.
Hüten Sie sich vor Buzzwords und seien Sie präzise: Bei Machine Learning geht es um Mustererkennung und Vorhersagen für große Datensets. Die Ergebnisse sehen vielleicht „intelligent“ aus, haben aber nichts mit KI zu tun. Stattdessen geht es im Grunde darum, Statistiken in bisher nicht dagewesener Schnelligkeit und Skalierung anzuwenden.
„ALLE DATEN SIND VERWERTBAR“
Für maschinelles Lernen brauchen Sie Daten. Aber nicht alle Daten sind für Machine Learning auch brauchbar. Um Ihr ML-System „trainieren“ zu können, brauchen Sie repräsentative Daten, die die Muster und Ergebnisse abbilden, mit denen es Ihr System zu tun bekommt. Die zur Verfügung stehenden Daten müssen also frei von irrelevanten Mustern sein, weil das System anderenfalls diese spezifischen Muster auch auf den Rest der Daten anwendet und diese dahingehend durchforstet.
Alle Daten, die Sie zum Trainieren eines Machine-Learning-Systemsverwenden, müssen zudem ausreichend gekennzeichnet werden – und zwar mit den Features, die zu den Fragen passen, die Sie dem System anschließend stellen wollen. Das klingt nicht nur nach einer Menge Arbeit, sondern ist es auch. Dennoch sollten Sie nicht den Fehler begehen, davon auszugehen, dass Ihre Daten sauber, strukturiert, repräsentativ oder einfach zu kennzeichnen sind.
„MAN BRAUCHT IMMER JEDE MENGE DATEN“
Díe kürzlich bei der Bild-, Text- und Kontexterkennung erzielten Fortschritte sind in erster Linie der Existenz neuer, besserer Tools und Hardware zu verdanken. Diese machen es nun möglich, riesige Datenmengen (parallel) zu verarbeiten.
Dank einer trickreichen Methode namens „transfer learning“ brauchen Sie aber nicht immer notwendigerweise ein großes Datenset, um in einem speziellen Bereich gute Machine-Learning-Ergebnisse zu erzielen. Sattdessen bringen Sie Ihrem ML-System einmal bei, ein solches Datenset zu benutzen und transferieren diese Lernleistung anschließend auf ihr eigenes, kleineres Daten-Trainings-Set. So funktionieren auch die „custom vision“-APIs von Salesforce und Microsoft Azure: Diese Systeme brauchen nur zwischen 30 und 50 Bildern, um zu lernen was klassifiziert werden soll.
„Transfer learning“ versetzt Sie also in die Lage, ein (trainiertes) System zum maschinellen Lernen auf Ihre ganz eigene Problemstellung auszurichten – mit einer vergleichsweise geringen Menge an Daten.
Be the first to comment