Wie Data Scientists arbeiten

Die Erwartungen des Business empfinden Data Scientists als zu hoch. Ihnen geht es ums experimentelle Erforschen von Daten. Forrester nennt vier Arbeitsweisen. [...]

Mit der Erkenntnis von Daten als wichtigstem Rohstoff entstand das Berufsbild des Data Scientists. Bevor Unternehmen einen solchen suchen, plädiert der US-Marktforscher Forrester für eine Begriffsklärung. Die Analysten grenzen den Begriff insbesondere gegen Enterprise-Architekten und Data-Engineers ab. In dem Papier „The four things Data Scientists wish you knew“ führen sie das aus.

Die Studie basiert nicht auf einer quantitativen Befragung. Forrester hat mit zehn Data-Science-Leadern gesprochen und weitere zehn Unternehmen befragt, die Advanced Analytics anwenden. Einer der Gesprächspartner war Andrew Jennings, Chief Analytics Officer beim Analytics-Software-Unternehmen FICO. Er sagte, die Welt eines Data Scientist sei sowohl den meisten Informatikern als auch den meisten Betriebswirten vollkommen fremd.

Für Forrester sollen Data Engineers und Enterprise-Architekten vor allem Ordnung und Struktur in die Datenflut bringen. Bei Data Scientists geht es dagegen um den Prozess des Erforschens der Daten an sich. Das Explorative sei wichtiger als der Algorithmus, so Forrester.

VIER MERKMALE

Forrester sieht die Arbeit der Data Scientists durch vier Prinzipien geprägt. Sie lauten:

  • Data Scientists müssen mit Data-Engineers und dem Business ein Team bilden. Die befragten Data Scientists beklagten sich bei Forrester über zu hohe Erwartungen durch das Business. Man werfe ihnen irgendwelche Schlagworte hin und erwarte, dass sie aus Daten generierte Erkenntnisse anbrächten. Das funktioniere nicht, so die Befragten weiter. Sie wünschen sich ein Team: Vertreter des Business leiten Data Scientists an, die dann Hypothesen und Annahmen entwickeln. Data Engineers unterstützen diesen Prozess, das Stichwort lautet hier DevOps. Das Kunstwort aus Development und Operations soll die Lücke zwischen dem explorativen Prozess und dem strukturgebenden schließen.
  • Data Scientists nehmen gerne Rohdaten. Unternehmens-Architekten meinen es ja nur gut, wenn sie Daten gesäubert, geordnet und strukturiert präsentieren, weiß Forrester. Aber Data Scientists brauchen den Zugriff auf Rohdaten, weil sie experimentell arbeiten.
  • Der Prozess an sich kann Erfolge erzielen. Die Erfolgskontrolle gestaltet sich bei Predictive Analytics sehr schwierig. Finanzielle Benefits lassen sich schwer bemessen. Unternehmen müssen verstehen, dass Data Scientists möglicherweise „zufällig“ auf wichtige Zusammenhänge stoßen oder über Umwege an interessante Ergebnisse kommen. In jedem Fall gewinnen sie Erkenntnisse über unternehmensinterne Prozesse.
  • Geschwindigkeit ist wichtig. Frameworks wie Hadoop unterstützen Data Scientists. Denn ihre Arbeit ist iterativ und generiert immer mehr Daten. Je schneller die IT Daten managen kann, umso besser.

Forrester geht davon aus, dass viele Unternehmen bereits Data Scientists suchen oder in Kürze mit der Suche starten werden. Die gewünschten Skills kreisen um Large-Scale Predictive Modeling, Data Mining, Advanced Analytics und Big Data.

* Christiane Pütter ist Redakteurin der Computerwoche.


Mehr Artikel

Gerold Pulverer, Business Management der Insight in Österreich (c) Insight Technology Solutions GmbH
Interview

DaaS als Gamechanger im IT-Management

Die moderne Arbeitswelt erfordert Flexibilität und Mobilität. Mitarbeitende nutzen längst nicht nur einen Büro-PC, sondern mehrere IT-Geräte. Unternehmen stehen dadurch vor der Frage: Wie lässt sich dieses Geräte-Management effizient und nachhaltig gestalten? Insight bietet mit »Flex for Devices« ein Device as a Service (DaaS)-Modell, das strukturierte Verwaltung, ökologische Nachhaltigkeit und finanzielle Flexibilität ermöglicht. ITWELT.at hat dazu mit Gerold Pulverer, Business Management von Insight in Österreich, ein Interview geführt. […]

News

Deep Observability und fünf weitere Schritte zur NIS-2-Konformität

Noch immer steht das genaue Datum nicht fest, ab wann die europäische NIS2-2 Richtline offiziell in Kraft treten wird. Das übergeordnete Ziel ist bekanntlich, die Cybersicherheit und -resilienz in Unternehmen auf europäischer und nationaler Ebene zu stärken. Sichtbarkeit bis zur Netzwerkebene (Deep Observability) wird daher immer entscheidender und wandelt sich für Unternehmen vom „Nice-to-have“ zum „Must-have“. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*