Machine Learning-Projekte scheitern am falschen Framework

Welches Machine Learning Framework passt zu meinem Use Case? Die Antwort auf diese Frage beschäftigt viele Unternehmen, die bei der Auswahl häufig an einen Punkt gelangen, an dem sie nicht mehr weiterkommen. [...]

Die Top Machine Learning Frameworks (c) Pixabay
Die Top Machine Learning Frameworks (c) Pixabay

Unterstützung hierbei bietet die Machine Learning Framework Entscheidungsmatrix, die verschiedene Frameworks vergleicht. Deep Learning eignet sich perfekt für die Untersuchung komplexer Daten, wie Bild- und Audiodaten. In der Praxis wird es von vielen Unternehmen aber für Use Cases genutzt, für die andere Frameworks wesentlich besser geeignet wären. Die Erfahrung zeigt, dass die Auswahl des falschen Frameworks der Grund für viele gescheiterte Projekte ist.

Machine Learning Framework Entscheidungsmatrix

Die Entscheidungsmatrix ist eine schnell erfassbare Orientierungshilfe bei der Auswahl eines geeigneten Machine Learning Frameworks für unterschiedliche Use Cases. Sie ist das visuelle Konzentrat von Praxiserfahrungen und Forschungen. Mit ihr ist auf einen Blick erkennbar, welches Framework für einen geplanten Use Case am besten geeignet ist, ohne dass der Verantwortliche sich durch viele Seiten Papier kämpfen muss.

Bei der Erstellung der Matrix wurde berücksichtigt, dass sich die meisten Probleme, die in der Praxis auftreten, in zwei Kategorien unterteilen lassen: Entweder werden Algorithmen benutzt, die für den Use Case nicht oder kaum geeignet sind oder das gewählte Framework kann die aufkommenden Datenmengen nicht bewältigen. Das erste Problem wurde angepackt, indem die verbreitetsten Machine Learning Use Cases in sinnvolle Kategorien unterteilt wurden, für die eine ähnliche Auswahl von Algorithmen und Verfahren zielführend ist. Bei der Auswahl der Frameworks wurden die verbreitetsten Frameworks herangezogen. Auf Basis der Praxisexpertise und von Recherchen wurde bewertet, wie geeignet jedes dieser Frameworks für die einzelnen Use Cases ist. In diesem Zusammenhang wurden Frameworks mit gleichen Eignungen gruppiert.

Small, big und complex data

Eine Unterteilung der Frameworks in small data, big data und complex data ist zwar plakativ, soll aber bei der Auswahl der Frameworks nach Art und Volumen der Daten helfen. Die Grenze zwischen big data zu small data ist dabei dort zu ziehen, wo die Datenmengen so groß sind, dass sie nicht mehr auf einem einzelnen Computer, sondern in einem verteilten Cluster ausgewertet werden müssen. Wenn von complex data die Rede ist, sind ich vor allem unstrukturierte Daten, wie Bild- und Audiodateien, gemeint, bei denen Deep Learning Frameworks bestens geeignet sind.

Fünf Expertentipps, wie Sie Ihr Machine Learning-Projekt richtig anfangen:

  1. Klären Sie, ob Sie Machine Learning überhaupt benötigen

Machine Learning Development lohnt sich, wenn Sie Ihr Unternehmen in diese Richtungen verbessern wollen: Vorhersagen treffen, Informationen zusammenfassen und extrahieren, Entscheidungsprozesse unterstützen.

  1. Wählen Sie das am besten geeignete Modell

Machine Learning-Modelle lassen sich grob nach Supervised und Unsupervised unterteilen. Supervised Learning eignet sich z. B. für Churn Prediction, Kredit-Scoring und Marketing Channel Optimierung. Unsupervised Learning hilft, Muster in Daten zu finden. Use Cases sind Marketing Clustering, Anomalie-/Betrugserkennung und Textklassifizierung. Deep Learning können Sie sowohl für Supervised als auch Unsupervised Learning einsetzen. Die Techniken eignen sich vor allem für komplexere Daten wie Bilder, Video und Sprache.

  1. Unterschätzen Sie nicht die Datenvorbereitung und -bereinigung

Im Schnitt werden Sie fast 80 % der Zeit eines Machine Learning-Projekts in die Datenaufbereitung investieren. Hier ist nur wenig Automation möglich und viel Know-how gefragt. Durch Entfernen von „noisy“ Daten, Ergänzung fehlender Informationen und Anreicherung der Daten ermöglichen Sie dem Algorithmus, die besten Ergebnisse zu liefern.

  1. Entscheiden Sie sich zwischen Machine Learning APIs (Cloud) oder Eigenentwicklung

Die Wahl des richtigen Modells ist eine der Voraussetzungen für den Erfolg eines maschinellen Lernprojekts. Daher sollten Unternehmen das maschinelle Lernen nur dann in die Cloud auslagern, wenn sie sehr spezifische und einfache Aufgaben haben.

  1. Finden Sie die richtigen Experten für Ihr Projekt

Wenn Sie sich für eine eigene Machine Learning-Entwicklung entscheiden, müssen Sie die Experten finden, die zu Ihrem Projekt passen: Data Scientists zur Bereitstellung der Algorithmen. Data Engineers, um Big Data-Architekturen für das Projekt zu erstellen. Und je nach Anwendungsschwerpunkt zusätzlich Engineers für Bild- oder Spracherkennungsmodelle.

Hier finden Sie eine Entscheidungsmatrix der Top Machine Learning Frameworks für Ihr Development: https://go.it-novum.com/l/483691/2018-11-30/ctqyq

*Der Autor David James ist Data Scientist bei it-novum.

 


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*