So werden Mitarbeiter zu Data Scientists

Datenanalysen zur Entscheidungsfindung sind wichtig. Dafür benötigt man weder teure Werkzeuge noch unbezahlbare, externe Data Scientists. Ein Appell an die Vernunft. [...]

Beim Thema Datenanalysen in Unternehmen, der sogenannten Business Intelligence (BI), überschlagen sich Buzzwords, wie „Big Data“, „Data Science“, „Self Service BI“ und Aussagen, wie „Es gibt immer mehr Daten, in denen verborgene Schätze zu finden sind“, „x Prozent der Unternehmen haben keine Big-Data-Strategie“ oder „y Prozent fehlt die technische Infrastruktur“. Die Folgen sind Verunsicherung und Aktionismus.
Daten sind Alltag
In einem Unternehmen fallen täglich Daten an – und zwar nicht nur bei Google, Facebook & Co, deren Geschäftsmodell Daten sind, sondern auch bei Spediteuren, Produzenten, IT-Dienstleistern oder Beratungsunternehmen. Dort findet man Daten, wie Anzahl Kundenaufträge, Wareneingänge, produzierte Produkte, Arbeitszeiten, Kostenstellenbelastungen, versandte Paletten, Besucher auf einer Webseite und vieles mehr. Diese Daten kann man auswerten. Gründe für Auswertungen sind schnell gefunden:
  • Anzahl Besucher auf der Webseite nach Veröffentlichung einer neuen Fernsehwerbung
  • Durchschnittlicher Krankenstand oder Überstunden im aktuellen Jahr
  • Eingesetzte Rohstoffe in der Produktion und Entwicklung
  • angefallener Verschnitt oder Fehlteile vor und nach der Änderung von Prozessen
  • Geleistete versus bezahlte Beraterstunden
  • 80:20 Analyse von Lieferanten und Kunden

Zentrales Reporting im Unternehmen

Es stimmt also nicht, dass Unternehmen keine Daten auswerten. Bereits die Buchhaltung und die entstehende Bilanz am Ende des Jahres sind nichts anderes als Datenanalysen. Auch die Ermittlung von Werten wie Cashflow, EBIT (Earnings Before Interest and Taxes) und Deckungsbeitrag sind Ergebnisse von Auswertungen. Häufig findet man in Unternehmen Daten schon konsolidiert in einem sogenannten Management Information System oder kurz MIS.
Wie der Name schon andeutet, wird man in einem MIS hauptsächlich Controlling- und Finanzdaten entdecken: Es sind Daten, die das Management interessieren. Vergeblich suchen wir aber nach Logistikdaten, wie Pickgeschwindigkeiten, Lieferzeiten oder Liefertreue. Auch das ist Verwaltung, oder eben Management – nur auf einer weniger abstrakten Ebene. Das Gleiche gilt für Besucherzahlen auf einer Webseite oder Arbeitszeiten und Krankenstand.
Auf oberster Ebene sind Kennzahlen vergleichsweise einfach. Denn was bleibt, wenn wir alle Details abstrahieren? Ein bisschen Cashflow, ein bisschen EBIT, ein bisschen Deckungsbeitrag. Solche Kennzahlen für ein mittelgroßes Unternehmen unter Zustimmung aller Beteiligten festzulegen, ist selbstverständlich schon ein Kraftakt. Je mehr man sich aber konkreten Geschäftsprozessen nähert, desto häufiger muss man für Lieferant A und B Ausnahmen definieren, bestimmte Wochentage unter gewissen Umständen außer Acht lassen und viele Fallunterscheidungen mehr beachten. Je detaillierter man in Prozesse hineinschaut, desto weniger Details kann man eben weglassen.
Datenanalyse mit Excel
Ein Software-System, das keinen Export in eine Tabellenkalkulation wie Excel anbietet, wird nicht mehr akzeptiert. Man benötigt die Daten in Excel für weiterführende Analysen. Selbst wenn das System eigene Auswertungen anbietet. Es werden nie die Kennzahlen sein, die man braucht.
Darüber hinaus arbeiten Unternehmen mit einer Vielzahl von Systemen – auch wenn alle nach einer integrierten IT-Lösung rufen, findet man in allen Unternehmen neben einem zentralen ERP-System auch noch Lagersysteme, Personalsysteme oder Qualitätssysteme. Damit fehlen für übergreifende Auswertungen in einem dieser Systeme immer Daten aus anderen Systemen, beispielsweise aus der Finanzbuchhaltung oder aus einem Lagersystem, Informationen über Besucherzahlen auf den Webseiten oder Qualitätskennzahlen aus einem CAQ-System (Computer Aided Quality). Für übergreifende Auswertungen verwendet man dann eben: Excel.
Gehen Sie mit offenen Augen durch Ihr Unternehmen und versuchen festzustellen, wie viele Auswertungen aus Ihren Systemen heute manuell in einer Tabellenkalkulation durchgeführt werden. Selbst wichtige Entscheidungen werden auf Basis von Excel-Auswertungen getroffen – niemand gibt so etwas zu. Es ist wie die Bild-Zeitung – die bekanntlich auch niemand liest. Es heißt aber auch: Natürlich werden Daten analysiert!
Mehr Daten ins MIS
Nun werden Stimmen laut und verlangen, dass Daten von allen vorhandenen Systemen in ein MIS überführt werden, um ein zentrales Berichtswesen in allen Bereichen zu etablieren. Dazu allerdings muss der Leidensdruck groß sein, am besten von außen durch Auftraggeber oder durch den Gesetzgeber. Erst dann budgetiert man ein Projekt.
Nur, wie erwähnt, je weniger man im Unternehmen abstrahiert, je konkreter man Prozesse betrachtet, desto komplexer wird es, desto schwieriger werden Definitionen. Damit ist der Grundstein gelegt für ein lang laufendes und teures Projekt: Bis Daten im zentralen System korrekt sind und Anwender die Ergebnisse akzeptieren, sind die Modelle bereits veraltet. Die Welt hat sich in der Zeit der Umsetzung weitergedreht. Die Folge: Das Projekt war zwar teuer, aber die Excel-Auswertungen bleiben.
Vorurteil 1: Es liegt an den Datenmengen
Es heiß, Unternehmen produzietren immer mehr Daten, die immer schwieriger auszuwerten seien. Aber schon mit Excel können Sie eine Million Datensätze auswerten. So wenig ist das zunächst einmal nicht. Seit Excel 2010 gibt es in Excel ein Add-In namens Power Pivot – es ist kostenfrei erhältlich. In Excel 2016 ist dieses Add-In bereits integriert.
Als Demo habe ich aus den USA Daten zu Flügen heruntergeladen und in Power Pivot importiert – etwa 125 Millionen Datensätze. Damit erstelle ich Analysen zu Verspätungen auf Flugstrecken, zu Auslastungen von Flughafen oder Rankings von Fluggesellschaften – nicht auf einem Hochleistungsrechner, sondern auf einem Laptop. In einem Dashboard schränke ich Fluglinien, Auswertungs-Zeitspannen oder Abflug-Flughäfen ein. Die Berechnungen dauern nur Sekunden.
Wären die Datensätze nicht Flüge, sondern Packstücke aus einem Versandsystems der letzten zehn Jahre, dann entspricht das zirka 1.000.000 Packstücke pro Monat, also 50.000 Packstücken am Tag. Bei einem Fünf-Jahres Horizont, der bei Auswertungen eher relevant ist, wären es schon 100.000 Pakete am Tag. Haben Sie mehr Buchungen/Pakete/Besucher/Produktionsaufträge am Tag? Falls ja, dann müssen Sie sich tatsächlich nach leistungsfähigeren Systemen umschauen.
Vorurteil 2: Excel sorgt für Wildwuchs
Auswertungen mit reinem Excel führen schnell zu Wildwuchs. Anwender verstehen nicht, was der Vorgänger getan hat. Bleibt eine Analyse ein paar Wochen liegen, weißt selbst der Ersteller nicht mehr, was die Werte bedeuten sollen.
Der Wildwuchs kommt nicht durch die Datenmengen oder durch chaotische Benutzer, sondern durch die unüberschaubaren Verknüpfungen zwischen Arbeitsblättern und verschiedenen Excel-Dateien. Der Feind hier heißt SVerweis – eine berüchtige Formel in Excel zur Verknüpfung von Daten. Excel selbst war nie für komplexe Datenanalysen ausgelegt.
Mit dem bereits genannten, kostenfreien Werkzeug Power Pivot ist das Datenmodell aber explizit. Kein SVerweis, sondern saubere Diagramme mit verknüpften Tabellen. Auch wenn verschiedene Quellen wie Datenbanken, CSV-Dateien und manuelle Daten verknüpft werden.
Vorurteil 3: Unternehmen benötigen teure Werkzeuge
Niemand will Datenanalysen auf einem Blatt Papier durchführen. Aber teure Werkzeuge lösen nicht das eigentliche Problem. Denn: A fool with a tool is still a fool!
Die Erfahrung zeigt, dass eigentlich jedes BI-Werkzeug die geforderten Aufgaben löst. Aber auch ein teures BI-Werkzeug, mit dem man Diagramme darstellen, das Berichte über Nacht aufbereiten und sie automatisiert versenden kann, benötigt die richtigen Daten.
Daher: Warum nicht mit kostenfreien Produkten, wie Power Pivot Auswertungen erstellen? Es fließt keine Zeit in langwierige Werkzeug-Evaluationen und es muss kein Budget definiert werden. Man beschränkt sich auf die Lösung der echten Aufgaben: Welche Zahlen, welche Daten, welche Darstellung? Wer die Auswertungen sehen darf, oder ob diese automatisch verteilt werden, kann man später – wenn es dann überhaupt noch relevant ist – immer noch mit Hilfe spezialisierter BI-Werkzeuge regeln. Der Transfer von den bereits erstellen Auswertungen in ein komplexes BI-Werkzeug ist wenig Aufwand.
Vorurteil 4: Es fehlt der Data Scientist
Das Vorurteil, dass Mitarbeiter fehlen, die Daten analysieren können, stimmt nicht ganz. Wenn immer vom Excel-Wildwuchs gesprochen wird, dann muss es doch Mitarbeiter geben, die diesen produziert haben! Diese Mitarbeiter wissen bereits, wo Daten zu finden und welche Tabellen notwendig sind sowie welche Daten unbeachtet bleiben müssen. Vor allem wissen sie, welche Auswertungen notwendig sind und wie man vorhandene operative Prozesse messen sollte.
Diese Mitarbeiter sind also nicht die echte Ursache für den Wildwuchs. Warum befähigt man diese Mitarbeiter nicht, ihre Arbeit effizienter durchzuführen? Niemand kennt die Prozesse ihres Unternehmens besser als dessen Mitarbeiter. Externe Berater müssen aufwändig geschult werden – und sind danach wieder weg, inklusive des Wissens, das sie aufgebaut haben! Nutzen Sie externe Kräfte lieber zur Weiterbildung und Unterstützung Ihrer Mitarbeiter!
Zentrale Datenhaltung
Dies ist natürlich kein Appell gegen eine zentrale Datenhaltung. Man benötigt weiterhin zentrale, unternehmensweite Datenablagen für firmen- oder konzernweite Analysen. Fachabteilungen machen aber weiterhin eigenständige Datenanalysen.
Sehen wir dieses „Self Service BI“ einfach im Sinne von Prototyping. Eigene Auswertungen genießen eine viel höhere Akzeptanz, weil sie aus dem Fachbereich selbst stammen. Zudem fördern sie den Blick der Mitarbeiter auf die Daten in Systemen: Welche dürfen wir löschen, welche müssen wir archivieren, bei welchen Daten müssen wir aufpassen, wenn wir Änderungen vornehmen, welchen Einfluss hat etwas auf bestehende Analysen? Und vielleicht sind die Auswertungen am Ende so stabil und nutzbringend, dass man sich unternehmensweit nutzen kann – definiert sind sie dann schon.
Der Appell
Daher mein Appell an Unternehmen: Technik ist ausreichend vorhanden. Jetzt geht es um Befähigung und Talent.
* Holger Gubbels ist Geschäftsführer der mogular GmbH und dort als Berater, Dozent und Data Scientist tätig.

Mehr Artikel

News

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*