SAS hat mit Paradise Found ein Machine-Learning-Projekt gestartet, das Kunden und Partnern die komplexe Thematik auf spielerische Art und Weise näher bringt. DACH Vice President Patric Märki hat mit der COMPUTERWELT über den schönsten Ort auf Erden gesprochen. [...]
Wir beschäftigen uns in diesen Tagen mit sehr vielen Dingen. Aus sehr unterschiedlichen Gründen. Sie haben die Digitalisierung angesprochen. Das ist kein Zukunftsszenario mehr, sondern gelebte Realität. Und zwar in allen Branchen, wenn auch mit unterschiedlicher Geschwindigkeit. Unsere Kunden haben hier sehr viele Potenziale, die sie gerade angehen oder angehen möchten. Kunden wollen in erster Linie Innovation herbeiführen. Egal ob das mit disruptiven Geschäftsmodellen passiert oder mit konventionellen.
Das ist ein sehr wichtiges Thema. Das beginnt schon sehr früh in der analytischen Wertschöpfungskette, nämlich bei der Aufbereitung der Daten und da können wir schon helfen. Hier geht es in erster Linie um die Integration der Daten und das Etablieren einer Daten-Governance. Hier haben wir Softwarelösungen und Dienstleistungen im Portfolio, die genau dort ansetzen. Wenn es konkret darum geht, was es zu untersuchen gilt, dann haben wir ein Bündel an Lösungen. Das kann ganz klassisch sein, dass wir dem Kunden helfen, on Premise eine Lösung aufzubauen, und die Systeme anzuschließen und zu parametrisieren und zu konfigurieren. Das geht aber auch bis zu Remote Managed Services, ganz nach dem Wunsch der Kunden. Fast alle unsere Lösungen sind schon cloudfähig. Es ist aber auch möglich, dass uns die Kunden einfach ihre Daten zur Verfügung stellen und wir die Analyse übernehmen. Wir bieten hier die ganze Palette an.
SAS Forum vorgestellt. Das ist in erster Linie ein Hingucker um ein sehr komplexes Thema auf eine spielerische Art abzubilden. Wir wollen mit Paradise Found die Menschen an das Thema Analytics heranführen und mit einem emotional besetzten Thema Interesse wecken. Es geht darum, dass wir eine Lösung entwickelt haben, die aufgrund von unzähligen Parametern und Daten den besten Ort der Welt evaluieren kann. Im Gegensatz zu klassischen Auswertungen die auf Modellannahmen beruhen, ist es bei Machine Learning Technologien so, dass wir eine Gesamtlösung schaffen, die kein Modell als Ausgangspunkt hat, sondern einen immensen Datenschatz. Die Maschine liest diesen Schatz aus, lernt daraus und baut sich die Modelle selbst zusammen. Es werden schier unendlich viele Daten wie Wetter, Verkehr, Pharamadaten Lebensmittelpreise, Daten zu Sicherheit, Lebenserhaltungsosten etc. herangezogen und intelligent verknüpft.
Unser Machine Learning Tool ist zu dem Schluss gekommen, dass das West Perth in Australien ist, also nicht nur einfach die Stadt Perth, sondern ein ganz konkreter Bezirk. Das Beispiel soll zeigen, was mit Machine-Learning-Technologie alles möglich ist. Das Grundprinzip ist aber in allen Branchen uneingeschränkt zu verwenden. Die Maschine lernt von selbst und kann ohne ein Modell eine Bewertung abgeben. Wir haben uns für dieses Szenario entschieden, weil ja jeder Mensch irgendeinen Bezug zu gewissen Orten hat, etwa wo er lebt oder Urlaub gemacht hat.
Da muss ich etwas weiter ausholen. Das beginnt mit einem Zusammenspiel aus Daten-management, Analytics und Visualisierung. Menschen bringen ihre Expertise mit, was man mit gewissen Daten machen kann und machen muss und welche Daten sich zur Analyse eignen. Die Krux daran ist, dass es hier um unüberwachtes Lernen geht. Das bedeutet, dass die Ergebnisse von Daten und eben nicht von Modellen ausgehen. Bei unbewachtem Lernen gibt es keine Zielgröße. Der Machine Learning Algorithmus hat selbst Variablen und Verknüpfungen in den Daten entdeckt und hat so in einem Datentopf Muster gefunden. Das sind letztendlich Muster, die nicht unbedingt kausal erahnt werden können.
Wir haben Daten von 150.000 Orten auf der ganzen Welt herangezogen. Da war alles dabei was man sich vorstellen kann – bis hin zu Grünflächen oder Verkehrsaufkommen. Das genaue Datenvolumen muss sich bei ungefähr fünf Millionen Datensätzen bewegt haben. Wir hatten etwa 200 Variablen pro Ort. Das ist eine unglaubliche Zahl an Daten. All diese Daten waren öffentlich zugänglich und können im Grunde von jeder Person durch Internet-Recherche gefunden werden.
Nummer zwei wurde Rotterdam bzw. genauer gesagt der Bezirk Feyenoord. Der dritte Platz ging an New York City. Als Schweizer möchte ich auch nicht unerwähnt lassen, dass der sechste Platz an Zürich gegangen ist.
Be the first to comment