Welches Machine Learning Framework passt zu meinem Use Case? Die Antwort auf diese Frage beschäftigt viele Unternehmen, die bei der Auswahl häufig an einen Punkt gelangen, an dem sie nicht mehr weiterkommen. [...]
Unterstützung hierbei bietet die Machine Learning Framework Entscheidungsmatrix, die verschiedene Frameworks vergleicht. Deep Learning eignet sich perfekt für die Untersuchung komplexer Daten, wie Bild- und Audiodaten. In der Praxis wird es von vielen Unternehmen aber für Use Cases genutzt, für die andere Frameworks wesentlich besser geeignet wären. Die Erfahrung zeigt, dass die Auswahl des falschen Frameworks der Grund für viele gescheiterte Projekte ist.
Machine Learning Framework Entscheidungsmatrix
Die Entscheidungsmatrix ist eine schnell erfassbare Orientierungshilfe bei der Auswahl eines geeigneten Machine Learning Frameworks für unterschiedliche Use Cases. Sie ist das visuelle Konzentrat von Praxiserfahrungen und Forschungen. Mit ihr ist auf einen Blick erkennbar, welches Framework für einen geplanten Use Case am besten geeignet ist, ohne dass der Verantwortliche sich durch viele Seiten Papier kämpfen muss.
Bei der Erstellung der Matrix wurde berücksichtigt, dass sich die meisten Probleme, die in der Praxis auftreten, in zwei Kategorien unterteilen lassen: Entweder werden Algorithmen benutzt, die für den Use Case nicht oder kaum geeignet sind oder das gewählte Framework kann die aufkommenden Datenmengen nicht bewältigen. Das erste Problem wurde angepackt, indem die verbreitetsten Machine Learning Use Cases in sinnvolle Kategorien unterteilt wurden, für die eine ähnliche Auswahl von Algorithmen und Verfahren zielführend ist. Bei der Auswahl der Frameworks wurden die verbreitetsten Frameworks herangezogen. Auf Basis der Praxisexpertise und von Recherchen wurde bewertet, wie geeignet jedes dieser Frameworks für die einzelnen Use Cases ist. In diesem Zusammenhang wurden Frameworks mit gleichen Eignungen gruppiert.
Small, big und complex data
Eine Unterteilung der Frameworks in small data, big data und complex data ist zwar plakativ, soll aber bei der Auswahl der Frameworks nach Art und Volumen der Daten helfen. Die Grenze zwischen big data zu small data ist dabei dort zu ziehen, wo die Datenmengen so groß sind, dass sie nicht mehr auf einem einzelnen Computer, sondern in einem verteilten Cluster ausgewertet werden müssen. Wenn von complex data die Rede ist, sind ich vor allem unstrukturierte Daten, wie Bild- und Audiodateien, gemeint, bei denen Deep Learning Frameworks bestens geeignet sind.
Fünf Expertentipps, wie Sie Ihr Machine Learning-Projekt richtig anfangen:
- Klären Sie, ob Sie Machine Learning überhaupt benötigen
Machine Learning Development lohnt sich, wenn Sie Ihr Unternehmen in diese Richtungen verbessern wollen: Vorhersagen treffen, Informationen zusammenfassen und extrahieren, Entscheidungsprozesse unterstützen.
- Wählen Sie das am besten geeignete Modell
Machine Learning-Modelle lassen sich grob nach Supervised und Unsupervised unterteilen. Supervised Learning eignet sich z. B. für Churn Prediction, Kredit-Scoring und Marketing Channel Optimierung. Unsupervised Learning hilft, Muster in Daten zu finden. Use Cases sind Marketing Clustering, Anomalie-/Betrugserkennung und Textklassifizierung. Deep Learning können Sie sowohl für Supervised als auch Unsupervised Learning einsetzen. Die Techniken eignen sich vor allem für komplexere Daten wie Bilder, Video und Sprache.
- Unterschätzen Sie nicht die Datenvorbereitung und -bereinigung
Im Schnitt werden Sie fast 80 % der Zeit eines Machine Learning-Projekts in die Datenaufbereitung investieren. Hier ist nur wenig Automation möglich und viel Know-how gefragt. Durch Entfernen von „noisy“ Daten, Ergänzung fehlender Informationen und Anreicherung der Daten ermöglichen Sie dem Algorithmus, die besten Ergebnisse zu liefern.
- Entscheiden Sie sich zwischen Machine Learning APIs (Cloud) oder Eigenentwicklung
Die Wahl des richtigen Modells ist eine der Voraussetzungen für den Erfolg eines maschinellen Lernprojekts. Daher sollten Unternehmen das maschinelle Lernen nur dann in die Cloud auslagern, wenn sie sehr spezifische und einfache Aufgaben haben.
- Finden Sie die richtigen Experten für Ihr Projekt
Wenn Sie sich für eine eigene Machine Learning-Entwicklung entscheiden, müssen Sie die Experten finden, die zu Ihrem Projekt passen: Data Scientists zur Bereitstellung der Algorithmen. Data Engineers, um Big Data-Architekturen für das Projekt zu erstellen. Und je nach Anwendungsschwerpunkt zusätzlich Engineers für Bild- oder Spracherkennungsmodelle.
Hier finden Sie eine Entscheidungsmatrix der Top Machine Learning Frameworks für Ihr Development: https://go.it-novum.com/l/483691/2018-11-30/ctqyq
*Der Autor David James ist Data Scientist bei it-novum.
Be the first to comment