Das Berufsbild „Data Scientist“ gilt als der „sexiest Job ofthe 21st century“. Das wirkt auch auf den ersten Blick richtig, denn wenn man sich den Jobmarkt ansieht, merkt man sehr schnell, dass all jene, die etwas von „Data Science“ verstehen sehr gefragt sind. [...]
Unternehmen suchen mittlerweile auch in Österreich händeringend nach Data Scientists – und vermelden Verzweiflung. Gut ausgebildete Fachkräfte sind Mangelware – und oftmals sind die Unternehmen nicht bereit, dafür zu zahlen. Will man gut ausgebildete Fachkräfte im Data-Science-Bereich muss man oft tief in die Tasche greifen – oder aber akzeptieren, dass man ohne diese Personen auskommen muss. Billig zu bekommen sind Personen mit einem entsprechenden Profil nicht – und aussuchen können Sie sich dennoch, wo Sie gerne arbeiten möchten. Doch die Unternehmen haben viel zu verlieren: wenn Sie keine geeigneten Mitarbeiter(innen) finden, riskieren Sie im Wettbewerb zurück zu fallen. Es gibt keine Alternative – die Data Scientists sind hier in der stärkeren Position.
Doch dann stellt sich die Frage: Wie wird man Data Scientist? Was muss man können um sich hier zu etablieren? Sieht man sich das Berufsbild an, so wird sehr schnell klar, dass der Data Scientist ein richtiges Multitalent ist. Es wird wissen aus den unterschiedlichsten Bereichen gefordert, welche in verschiedenen Disziplinen angesiedelt sind.
Wollen wir erstmal mit der Kerndisziplin anfangen: Mathematik und Statistik. Ein Data Scientist muss ein großartiger Mathematiker und/oder Statistiker sein. Man muss die Daten sehen und sofort Schlüsse ableiten können. Die Daten müssen für den Data Scientist ein einfach zu lesendes Muster sein. Der Data Scientist muss auf dem ersten Blick erkennen, was die Daten bedeuten und welche Schlüsse man davon ableiten könnte. Daten sind sein zuhause – und er liebt es, mit diesen zu spielen.
Hinsichtlich „Spielen“ kommen wir auch sofort zum nächsten Bereich: mit den Daten spielen beziehungsweise arbeiten. Geht es um große Datenmengen – und wir sprechen ja von „Big Data“ – dann kann man sehr schnell feststellen, dass oftmals neuartige Tools eingesetzt werden müssen. Hierbei greift man oft auf die Technologie „Hadoop“ zurück. Hierbei muss der Data Scientist außerdem ein perfekter Softwareentwickler sein, welcher mit Java und den diversen Hadoop Tools einfach umgehen kann. Ferner ist es notwendig, ein gutes Wissen über Map/Reduce zu haben und verteilte Algorithmen zu kennen.
Dann wären noch die verteilten Tools – ein Data Scientist muss sich außerdem perfekt mit verteilten Plattformen auskennen und perfekt in dieser Infrastrukturumgebung sein. Hier ist es notwendig, viel über Virtualisierung, der Hadoop Infrastruktur und Cloud Technologien zu kennen. Ein Data Scientist muss dementsprechend ausgesprochen gut mit diesen Technologien umgehen können.
Aber was nutzt all dieses umfassende Technologiewissen, wenn man keine Ahnung von der Fachabteilung hat? Gar nichts. Datengetriebene Anwendungen werden meist in den Fachabteilungen verwendet und wenn man vom Business keine oder nur wenig Anwendung hat so können Initiativen sehr schnell scheitern. Daher muss der Data Scientist auch ein perfekter Business Developer sein, der das Geschäft versteht.
Doch ist das bereits alles? Definitiv nicht – denn eine weitere wichtige Kompetenz fehlt hier noch. Wenn man all jenes kann und die Daten nun richtig erarbeitet hat, wie kann man diese so weit präsentieren dass es auch gut aufgefasst wird? Um das zu ermöglichen, muss ein Data Scientist auch ein „Data Artist“ sein – also eine Person, welche Daten ideal präsentieren und aufbereiten kann. Die Visualisierung der Daten steht hierbei im Zentrum.
Wie man hier gut erkennen kann, ist ein Data Scientist sehr gefragt und gefordert. Hierbei muss es sich um einen richtigen Alleskönner handeln. Man muss sich die (berechtigte) Frage stellen, ob eine Person das alles erfüllen kann. Im Normalfall ist das zu verneinen. Ein Data Scientist ist keine Einzelperson, sondern ein Team, welches diese Eigenschaften ideal abdeckt.
Falls Sie Sie auch ein Data Scientist werden wollen, verpassen Sie auf keinen Fall die IDC Data Hub Conference am 21. Mai: http://idcdatahub.com/
Be the first to comment