Der CRM-Anbieter stellt die Machine-Learning-Technologie seiner Einstein-Plattform öffentlich zur Verfügung. [...]
TransmogrifAI, die AutoML-Bibliothek, enthält weniger als 10 Zeilen Scala-Code auf Apache Spark und kann von Entwicklern verwendet werden, die Maschinenlernmodelle trainieren, um Kundenverhalten vorherzusagen, ohne einen großen Datensatz für das Training verwenden zu müssen.
„Es wurde mit dem Fokus entwickelt, die Produktivität von Entwicklern durch Machine Learning–Automatisierung zu erhöhen und eine API zu implementieren, die etwa Modularität und Wiederverwendung sicherstellt. Durch Automatisierung erreicht das System eine Genauigkeit, die an manuelle Modelle heranreicht, aber mit fast hundertfacher Zeiteinsparung“, heißt es auf der Website von Salesforce.
In einem Beitrag von letzter Woche schrieb Shubha Nabar, leitender Direktor für Data Science beim Salesforce Einstein-Team: „Vor drei Jahren, als wir begannen, Machine Learning-Funktionen in die Salesforce-Plattform zu integrieren, mussten wir erfahren, dass Machine Learning-Systeme im großen Maßstab sehr schwierig sind.“
Der Schlüssel für Salesforce bei der Entwicklung von Einstein bestand darin, intelligente Erkenntnisse und Empfehlungen liefern zu können, ohne alle Daten des Kunden zusammenzufassen zu müssen. Dies war eine ziemlich große Herausforderung für den Hersteller gewesen, bevor er eine Reihe von Spezialisten für maschinelles Lernen erwarb, darunter MetaMind und sein Gründer Richard Socher, der heute als leitender Wissenschaftler bei Salesforce tätig ist.
„Wir haben riesige Datenmengen, Petabyte um Petabyte, also haben wir die Daten, die wir brauchen, und die Antwort ist, dass wir jetzt mit diesen Daten arbeiten können, ohne die Vertrauensbeziehung zu unseren Kunden zu stören“, sagt Salesforce-CEO Marc Benioff.
Nabar schreibt dazu: „Wir müssen kundenspezifische Machine-Learning-Modelle für jeden beliebigen Anwendungsfall erstellen. Selbst wenn wir globale Modelle erstellen könnten, macht dies absolut keinen Sinn, weil die Daten jedes Kunden einzigartig sind und unterschiedliche Schemata haben, verschiedene Formate, die durch verschiedene Geschäftsprozesse bedingt sind. Um Machine Learning wirklich für unsere Kunden nutzbar zu machen, müssen wir Tausende von personalisierten Maschinenlernmodellen aufbauen und einsetzen, die auf die Daten jedes einzelnen Kunden für jeden einzelnen Anwendungsfall trainiert werden. Die einzige Möglichkeit, dies zu erreichen, ohne eine Armee von Datenwissenschaftlern zu beschäftigen, ist die Automatisierung. Die meisten AutoML-Lösungen sind heute entweder sehr eng auf einen kleinen Teil des gesamten Machine Learning-Workflows ausgerichtet oder sind für unstrukturierte, homogene Daten für Bilder und Sprache ausgelegt. Wir brauchten aber eine Lösung, mit der schnell dateneffiziente Modelle für heterogene, strukturierte Daten in großem Maßstab erstellt werden können.“
Die Lösung besteht darin, ein einzelnes, modulares Modell zu erstellen, das über kleinere, personalisiertere Datensätze hinweg funktioniert und den Eindruck mehrerer domänenspezifischer Modelle vermittelt. „Mit nur wenigen Codezeilen kann ein Data Scientist die Datenbereinigung, das Feature-Engineering und die Modellauswahl automatisieren, um zu einem performanten Modell zu gelangen, von dem aus weitergearbeitet werden kann“, erklärt Nabar.
„TransmogrifAI bedeutete für uns eine Transformation und ermöglichte es unseren Datenwissenschaftlern, Tausende von Modellen mit minimalem manuellen Tuning produktiv einzusetzen und die durchschnittliche Bearbeitungszeit für das Training eines performanten Modells von Wochen auf wenige Stunden zu verkürzen.“
Nabar ergänzt: „Dieser Grad an Automatisierung war für uns unverzichtbar, um für Unternehmenszwecke skaliert werden zu können. Wir glauben jedoch, dass heutzutage jedes Unternehmen mehr Machine Learning-Fälle als Data Scientists hat und Automatisierung der Schlüssel ist, um die Macht des maschinellen Lernens nutzen zu können.“
Um zu erklären, warum sich Salesforce entschieden hat, dieses Projekt in die Open-Source-Community einzubringen, sagt Nabar: „Salesforce war ein langjähriger Anwender und Mitwirkender von Apache Spark und wir freuen uns, TransmogrifAI weiterhin gemeinsam mit der Community aufzubauen. Maschinelles Lernen hat das Potenzial, das Business zu verändern. Wir sind der Meinung, dass Barrieren für die Akzeptanz nur durch einen offenen Austausch von Ideen und Code verringert werden können. Indem wir im Open Source-Umfeld arbeiten, können wir verschiedene Perspektiven zusammenbringen, um die Technologie weiter voranzutreiben und es für alle zugänglich zu machen.“
*Scott Carey ist Redakteur der Computerworld UK.
Be the first to comment