Data Scientists sind heiß begehrt: Experten erläutern, wie man die richtigen Data Scientist findet und welche Spezialisten in Big Data-Projekten wichtig sind. [...]
83 Euro. So viel verlangen IT-Freiberufler laut der Vermittlung Gulp aktuell für eine Arbeitsstunde, wenn sie sich auf Big Data spezialisiert haben. Die Zahl alleine verrät, dass Spezialisten in diesem Bereich gesucht sind wie nie – Data Scientists zum Beispiel.
Das Problem vieler Firmen: Sie wissen zwar, dass sie Datenkönner benötigen; aber nicht unbedingt ist ihnen klar, was genau die Könner können sollten und wie man sie findet.
Immerhin gibt es derzeit eine Reihe grundlegender Antworten auf diese drängenden Fragen, zum Beispiel vom Berater Jonathan Hassell in unserer amerikanischen Schwesterpublikation CIO.com oder vom BI-Experten Wolfgang Martin für Computerwoche.de.
IDEAL: EINSTEIN, MICHAELANGELO UND EINE PRISE GATES
Die Nöte der Firmen gründen offenbar darin, dass dem Jobprofil etwas Unwirkliches anhaftet. Man kreuze ein Schaf, ein Huhn und eine Kuh, und schon hat man immer Wolle, Eier und Milch. Klappt halt nicht. Vor einem Jahr wurde der Data Scientist auf CIO.de bereits als „Alleskönner“ beschrieben.
Die analytischen Fertigkeiten eines Wissenschaftlers und die Kreativität eines Künstlers kombiniert die Idealbesetzung am besten noch mit IT-Know-how. Einstein, Michelangelo und Bill Gates in einem, das wär’s. Aber gibt’s diesen Superhelden? Und wenn, warum sollte er für 83 Euro auch nur den kleinen Finger rühren?
Anders betrachtet spricht selbstverständlich nichts dagegen, dass Informatiker analytische Begabung mitbringen. Und kaum etwas, dass viele von ihnen auch kreativ Probleme lösen können. Die benötigten Fertigkeiten in ihrem Zusammenspiel müssen gleichwohl ausgebildet werden.
FRAUNHOFER BIETET SCHULUNGEN AN
In Deutschland bietet beispielsweise das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) in Sankt Augustin bei Bonn entsprechende Schulungen an. Und die potenziellen Anwender von Big Data müssen wissen, wohin sie mit der Datenanalyse eigentlich wollen.
Auch weil die CeBIT in diesem Jahr „Datability“ zum Leitthema auserkor, ist das Problem in jüngster Zeit vielfach beleuchtet worden. „Gesucht am Arbeitsmarkt und gefordert sind Analytiker, die sich nicht nur mit sehr, sehr großen Datenbanken auskennen, sondern auch auf unstrukturierten Daten Mustererkennung anwenden können, Wahrscheinlichkeitsrechnung beherrschen und auch noch sehr sophistische Methoden der Datenanalyse drauf haben“, erläuterte der Journalist Peter Welchering für den Deutschlandfunk.
10 KUNDEN AUS 30 TERABYTE ZIEHEN
„Platt gesagt, will die Wirtschaft eine Mischung aus Softwareentwickler und Analytiker haben, dem sie 30 Terabyte geben und sagen: Hole uns da die zehn Kunden raus, mit denen wir im nächsten Jahr den meisten Umsatz machen können.“ Weil der klassisch ausgebildete Informatiker damit in der Regel überfordert ist, werde momentan über eine Weiterentwicklung des Fachs in Richtung Datenwissenschaft diskutiert, so Welchering.
ANGEBOT HINKT HINTER NACHFRAGE HER
Wie groß der Bedarf an Datenspezialisten tatsächlich ist, illustriert die Entwicklung der Stundensätze bei Gulp. Im Gesamtdurchschnitt aller IT-Freiberufler gab es da seit April 2012 wenig Bewegung. Der durchschnittlich gefordert Stundensatz stieg von 74 beinahe unmerklich auf 76 Euro. Bei der Gruppe der Big Data-Experten schnellte der Betrag derweil von unterdurchschnittlichen 63 Euro über mittelprächtige 76 Euro vor einem Jahr auf 83 Euro empor.
Die Nachfrage wächst offenbar tatsächlich rasant, das Angebot kommt nicht mit. Auf rund 500 Data Scientists wird der hierzulande verfügbare Pool auf dem Portal Arcor.de geschätzt. „Man muss natürlich enormes technisches Verständnis mitbringen, aber auch Neugier und Offenheit für neue Technologien“, berichtet dort Klaas Bollhoefer, Data Scientist beim Berliner Dienstleister The Unbelievable Machine, über seiner Erfahrungen. „Und man muss darüber erzählen können.“
BEISPIEL FÜR ARBEIT EINES DATA SCIENTISTS
Bollhoefer gibt auf Arcor.de auch ein Beispiel dafür, warum Data Scientists kreativ sein sollten. „Wir haben zum Beispiel mal eine Big-Data-Analyse für einen Nahrungsmittelhersteller gemacht“, so der Data Scientist. „Der wollte wissen, ob und wie er online im Bereich Kochen oder Rezepte erwähnt wird. Dafür muss man also eigentlich das ganze Internet absuchen – Rezeptplattformen, Blogs, Social Media und so weiter.“ Und ein funktionierendes Modell dafür entwickeln, was ohne IT-Wissen nicht geht.
Im gleichen Artikel bringt Michael Mock vom Fraunhofer IAIS das derzeitige Dilemma auf den Punkt: „Wir haben in einer Umfrage herausgefunden, dass viele Firmen Big Data nutzen möchten, aber nicht wissen wie.“ Die Überforderung setzt sich fort, sobald sie Data Scientists anheuern wollen. Für Jonathan Hassell, Chef des Beratungshauses 82 Ventures, handelt es sich um „einen der zweifelsohne heißesten Jobs auf dem Markt“.
5 RECRUITING-TIPPS FÜR DATA SCIENTISTS
„Der perfekte Kandidat ist ein Zahlengenie und ein Gelehrter in Firmenpolitik, der mit statistischen Computersprachen umgeht wie ein Konzertpianist“, so Hassell auf CIO.com. „Aber es ist schwierig, dieses Ideal in eine praktische Jobbeschreibung und die dazu passenden Suchkriterien zu übersetzen.“ Weil es sich um eine neue Rolle mit wenigen Erfahrungswerten handle, empfiehlt der Experte für die Rekrutierung eine enge Zusammenarbeit zwischen IT und Personalabteilung. Er nennt außerdem fünf Punkte, auf die es zu achten gilt.
1. Statistisches Verständnis: Ein Data Scientist muss aus einer Fülle von Daten die nützlichen Informationen filtern und dabei mit Zahlenbergen so versiert sein, dass Trends frühzeitig erkannt werden. Ein Hochschulabschluss in Mathematik wäre wünschenswert, meint Hassell. Es sei aber davon auszugehen, dass die meisten Kandidaten praktischere Bildungswege eingeschlagen hätten – Informatik oder Ingenieurswissenschaften in aller Regel.
„Lassen sie sich nicht abschrecken, wenn Bewerbern fortgeschrittene Mathematikkenntnisse fehlen“, rät der Berater. „Ein Augenmerk auf Statistik in der akademischen Karriere sollte für die Rolle ausreichen – egal ob auf Bachelor-Niveau oder höher.“
2. Neugierde ist essenziell: Hassell lobpreist die Wissbegierde potenzieller Data Scientists; er meint damit das, was gemeinhin als Kreativität bezeichnet wird. Um der Aufgabe gerecht werden zu können, müssen Datenbankabfragen nämlich nicht nur umgesetzt werden. Der Datenspezialist sollte weiterdenken, selbst die richtigen Fragen konzipieren, auf die sonst im Unternehmen niemand kommt und die Gewinnchancen eröffnen.
Hassell empfiehlt, diese Fähigkeit anhand hypothetischer Szenarien im Vorstellungsgespräch zu testen. „Man sollte den Bewerbern dabei sagen, dass Denken abseits ausgetrampelter Pfade erwünscht ist und Antworten nicht auf die Problemstellung verengt werden sollten“, so der Berater.
3. Fachwissen über Datenbanken: Ein guter Data Scientist kennt sich mit dem Design und der Implementierung von Datenbanken aus – auch wenn das nicht zur oberflächlichen Betrachtung von Big Data passt. „Auch wenn unter diesem Begriff insbesondere unstrukturierte Daten subsummiert werden, hilft ein grundlegendes Verständnis sowohl relationaler als auch säulenartiger Datenbanken weiter“, so Hassell.
Big Data möge neu und sexy sein, aber viele nützliche Informationen und Trends könnten aus traditionellen Datenbanken destilliert werden. Kenntnisse in diesem Bereich seien auch sinnvoll, um neue, anspruchsvollere Systeme aufsetzen zu können.
Hinzu komme, dass viele Entwickler von Big Data-Software bewusst SQL-ähnliche Sprachen verwenden. Klassische Administratoren sollen nämlich nicht verschreckt werden, wenn sie sich nicht auf MapReduce einlassen wollen. „Traditionelles SQL-Wissen wird weiter Dividenden abwerfen“, meint Hassell.
4. Basisfertigkeiten in Skriptsprachen: Die besten Bewerber beherrschen nach Einschätzung von 82 Ventures auf alle Fälle die im Big Data-Umfeld angesagte Skriptsprache Python. „Python ist eine Open Source-Sprache, die als leicht verständlich und praktisch in der Anwendung gilt“, erläutert Hassell. „Sie sollte keine allzu hohe Hürde darstellen.“
Testen könne man außerdem grundsätzlich, wie Bewerber mit Pseudo-Codes umgehen oder ob sie Algorithmen und Abfragen in normaler Sprache erklären können. Können sie das, sollte die Aneignung von Sprachkenntnissen kein Problem sein.
5. Kein Lohndumping: „Man sollte nicht versuchen, unter marktüblichem Tarif zu bezahlen“, schreibt Hassell. „Sogar Startups entlohnen Data Scientists erklecklich und ermöglichen ihnen die Arbeit an spannenden Produkten.“
Mit Billiglöhnen angle man keine Top-Talente, so der Berater. Die aktuellen Gulp-Stundensätze zeigen, dass dieses Diktum aus den USA längst auch hierzulande gilt.
4 DINGE, DIE EIN DARA SCIENTIST KÖNNEN MUSS
Für unsere Schwesterpublikation Computerwoche nennt BI-Experte Wolfgang Martin vier Dinge, die Data Scientist mitbringen müssen.
- Erstens technische Expertise: „Tiefe Kenntnisse in einer Natur- oder Ingenieurs-Wissenschaft sind notwendig“, stellt Martin klar. „Insofern sollte man zukünftige Data Scientists in dieser Gruppe suchen und dann auch die weiteren geforderten Eigenschaften testen.“
- Zweitens sei Problembewusstsein nötig – also die Fähigkeit, ein Problem in testbare Hypothesen aufzubrechen.
- Drittens Kommunikation – sprich die Fähigkeit, komplexe Dinge per Anekdoten durch einfach verständliche und gut kommunizierbare Sachverhalte darzustellen.
- Viertens Kreativität – also die Fähigkeit, Probleme mit anderen Augen zu sehen und anzugehen.
Martin macht in seinem Beitrag unter Zuhilfenahme einer McKinsey-Studie aber auch deutlich, dass Data Scientist alleine für das Schultern von Big Data-Projekten nicht genügen. Er grenzt die Rolle zunächst ab von den Data Stewards, die die Verantwortung für die Unternehmensdaten und für Daten aus den Fachabteilungen tragen. Bei der Big Data-Analyse seien neue Skills und Rollen gefragt, „die sich organisatorisch gesehen am besten in einem erweiterten BI-Kompetenzzentrum ansiedeln lassen“, so der Fachmann.
5 NEUE ROLLEN FÜR BIG-DATA-PROJEKTE
Er nennt konkret fünf neue Rollen:
- Data Hygienists stellen sicher, dass die Daten bereinigt und richtig sind und auch über den Lebenszyklus der Daten so bleiben.
- Data Explorers durchsuchen das Big-Data-Universum, um die Daten aufzufinden, die man im Projekt braucht.
- Business Solution Architects haben die Aufgabe, die identifizierten Daten zusammenzustellen und für die Analyse vorzubereiten.
- Data Scientists übernehmen das Organisieren der Daten und das Bauen von analytischen Modellen im Rahmen des Projektes.
- Campaign Experts schließlich haben die Aufgaben des Interpretierens der Ergebnisse und dem Umsetzen in Aktionen.
ROLLE DER DATA STEWARDS
„Data Stewards haben auch in Big-Data-Initiativen ihre Rolle, nämlich die der Data Hygienists, die sich aber jeweils an den Projektzielen und nicht an der Unternehmensstrategie ausrichtet“, schreibt Martin in seinem Fazit. „Sie spielen in der Big-Data-Analytik die Rolle eines SWAT-Teams (Special Weapons and Tactics, Anm. der Red.), also eines taktisch agierenden Spezialteams, und nicht die strategische Rolle wie im Unternehmen.“ Insofern seien sie wieder ein Dienstleister, der bei Big-Data-Initiativen von den Data Scientists gerufen wird, aber nicht selbständig agiert.
* Werner Kurzlechner ist Redakteur der deutschen CIO.
Be the first to comment