Warum Salesforce die KI-Technologie hinter Einstein frei verfügbar macht

Der CRM-Anbieter stellt die Machine-Learning-Technologie seiner Einstein-Plattform öffentlich zur Verfügung. [...]

Maschinelles Lernen hat das Potenzial, das Business zu verändern. (c) GDJ pixabay
Maschinelles Lernen hat das Potenzial, das Business zu verändern. (c) GDJ pixabay

TransmogrifAI, die AutoML-Bibliothek, enthält weniger als 10 Zeilen Scala-Code auf Apache Spark und kann von Entwicklern verwendet werden, die Maschinenlernmodelle trainieren, um Kundenverhalten vorherzusagen, ohne einen großen Datensatz für das Training verwenden zu müssen.

„Es wurde mit dem Fokus entwickelt, die Produktivität von Entwicklern durch Machine LearningAutomatisierung zu erhöhen und eine API zu implementieren, die etwa Modularität und Wiederverwendung sicherstellt. Durch Automatisierung erreicht das System eine Genauigkeit, die an manuelle Modelle heranreicht, aber mit fast hundertfacher Zeiteinsparung“, heißt es auf der Website von Salesforce.

In einem Beitrag von letzter Woche schrieb Shubha Nabar, leitender Direktor für Data Science beim Salesforce Einstein-Team: „Vor drei Jahren, als wir begannen, Machine Learning-Funktionen in die Salesforce-Plattform zu integrieren, mussten wir erfahren, dass Machine Learning-Systeme im großen Maßstab sehr schwierig sind.“

Der Schlüssel für Salesforce bei der Entwicklung von Einstein bestand darin, intelligente Erkenntnisse und Empfehlungen liefern zu können, ohne alle Daten des Kunden zusammenzufassen zu müssen. Dies war eine ziemlich große Herausforderung für den Hersteller gewesen, bevor er eine Reihe von Spezialisten für maschinelles Lernen erwarb, darunter MetaMind und sein Gründer Richard Socher, der heute als leitender Wissenschaftler bei Salesforce tätig ist.

„Wir haben riesige Datenmengen, Petabyte um Petabyte, also haben wir die Daten, die wir brauchen, und die Antwort ist, dass wir jetzt mit diesen Daten arbeiten können, ohne die Vertrauensbeziehung zu unseren Kunden zu stören“, sagt Salesforce-CEO Marc Benioff.

Nabar schreibt dazu: „Wir müssen kundenspezifische Machine-Learning-Modelle für jeden beliebigen Anwendungsfall erstellen. Selbst wenn wir globale Modelle erstellen könnten, macht dies absolut keinen Sinn, weil die Daten jedes Kunden einzigartig sind und unterschiedliche Schemata haben, verschiedene Formate, die durch verschiedene Geschäftsprozesse bedingt sind. Um Machine Learning wirklich für unsere Kunden nutzbar zu machen, müssen wir Tausende von personalisierten Maschinenlernmodellen aufbauen und einsetzen, die auf die Daten jedes einzelnen Kunden für jeden einzelnen Anwendungsfall trainiert werden. Die einzige Möglichkeit, dies zu erreichen, ohne eine Armee von Datenwissenschaftlern zu beschäftigen, ist die Automatisierung. Die meisten AutoML-Lösungen sind heute entweder sehr eng auf einen kleinen Teil des gesamten Machine Learning-Workflows ausgerichtet oder sind für unstrukturierte, homogene Daten für Bilder und Sprache ausgelegt. Wir brauchten aber eine Lösung, mit der schnell dateneffiziente Modelle für heterogene, strukturierte Daten in großem Maßstab erstellt werden können.“

Die Lösung besteht darin, ein einzelnes, modulares Modell zu erstellen, das über kleinere, personalisiertere Datensätze hinweg funktioniert und den Eindruck mehrerer domänenspezifischer Modelle vermittelt. „Mit nur wenigen Codezeilen kann ein Data Scientist die Datenbereinigung, das Feature-Engineering und die Modellauswahl automatisieren, um zu einem performanten Modell zu gelangen, von dem aus weitergearbeitet werden kann“, erklärt Nabar.

„TransmogrifAI bedeutete für uns eine Transformation und ermöglichte es unseren Datenwissenschaftlern, Tausende von Modellen mit minimalem manuellen Tuning produktiv einzusetzen und die durchschnittliche Bearbeitungszeit für das Training eines performanten Modells von Wochen auf wenige Stunden zu verkürzen.“

Nabar ergänzt: „Dieser Grad an Automatisierung war für uns unverzichtbar, um für Unternehmenszwecke skaliert werden zu können. Wir glauben jedoch, dass heutzutage jedes Unternehmen mehr Machine Learning-Fälle als Data Scientists hat und Automatisierung der Schlüssel ist, um die Macht des maschinellen Lernens nutzen zu können.“

Um zu erklären, warum sich Salesforce entschieden hat, dieses Projekt in die Open-Source-Community einzubringen, sagt Nabar: „Salesforce war ein langjähriger Anwender und Mitwirkender von Apache Spark und wir freuen uns, TransmogrifAI weiterhin gemeinsam mit der Community aufzubauen. Maschinelles Lernen hat das Potenzial, das Business zu verändern. Wir sind der Meinung, dass Barrieren für die Akzeptanz nur durch einen offenen Austausch von Ideen und Code verringert werden können. Indem wir im Open Source-Umfeld arbeiten, können wir verschiedene Perspektiven zusammenbringen, um die Technologie weiter voranzutreiben und es für alle zugänglich zu machen.“

*Scott Carey ist Redakteur der Computerworld UK.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*