Chief Data Officers (CDOs) spielen eine immer wichtigere Rolle in ihren Unternehmen. [...]
So sind sie heute nicht mehr nur für die Einhaltung von Vorschriften zuständig, sondern leiten wichtige Dateninitiativen, wie die Beschleunigung der Wertschöpfung aus Daten, die Bereitstellung von Self-Service-Zugängen sowie die Sicherstellung der Datenverwaltung und -qualität für Analysen und für den Einsatz Künstlicher Intelligenz (KI).
Doch wirtschaftliche Unsicherheit, zunehmende globale Regulierung und die steigende Komplexität des Technologie-Stacks zwingen die CDOs dazu, neue Wege zu finden, um den wachsenden Herausforderungen zu begegnen.
Aus diesem Grund haben kürzlich Mitglieder des Informatica CDO Executive Advisory Board , darunter auch Sanjeev Mohan, Principal bei SanjMo Advisory Services und ehemaliger Gartner Research VP, Big Data and Advanced Analytics, diskutiert, wie die Verwaltung von Daten als Produkt helfen kann, diese aktuellen Herausforderungen zu bewältigen.
Unternehmen, die einen datenproduktbasierten Ansatz verfolgen, können laut einer Studie von McKinsey & Co. die Total Cost of Ownership für Daten um 30 Prozent senken.1 Um zu erklären, warum dieser Ansatz hilfreich sein kann, ist zunächst ein Blick auf die Datenlandschaft hilfreich.
Das Streben nach Dezentralisierung mit Data Mesh
Das Bedürfnis der Unternehmen nach mehr Agilität und Self Service treibt die Einführung dezentraler Datenansätze wie Data Mesh voran. Dieses beinhaltet im Wesentlichen vier Prinzipien:
- Domain-Eigentum
- Daten als Produkt
- Self Service Dateninfrastruktur
- Federated Computational Governance
Die Implementierung eines Data Mesh hat viele Vorteile. So verwendet es ein domainorientiertes Design, erhöht die Verantwortlichkeit und trägt dazu bei, der Knappheit an Dateningenieuren entgegenzuwirken. Außerdem wird die Agilität verbessert und es können Datensilos sowie Redundanzen verringert werden. Aber eine Data-Mesh-Architektur ist nicht für jedes Unternehmen geeignet.
Zum einen fehlt es oft an einer Anleitung, wie man es richtig einsetzt. Außerdem mangelt es vielen Domain-Inhabern möglicherweise am Willen und/oder auch an der Fähigkeit, eine eigene Dateninfrastruktur zu besitzen. Es kann zudem auch zu neuen Datensilos sowie zu Schwierigkeiten führen, gemeinsam genutzte Daten zu verwalten.
Jeder Datensatz kann zum Datenprodukt werden
Datenprodukte gehören zu den Schlüsselelementen bei der Implementierung eines Data Mesh. Obwohl sie in der Regel mit Data Meshs assoziiert werden, bieten sie auch einen Mehrwert, der unabhängig vom Datenverwaltungsansatz eines Unternehmens ist.
So ist ein Datenprodukt als Kodifizierung von Regeln, Kontext und Semantik von Daten und Metadaten zu beschreiben. Ein Datenvertrag kodifiziert in diesem Kontext die Spezifikationen des Datenprodukts, wie den API-Zugang, Qualität, Auffindbarkeit, Verfügbarkeit, Zuverlässigkeit, SLAs und mehr.
Er baut zudem die Brücke zwischen einzelnen Datenproduzenten und mehreren unterschiedlichen Verbrauchern, sodass diese ein gemeinsames Verständnis bekommen und beseitigt mögliche Mehrdeutigkeiten.
Datenprodukte können in diesem Sinne alles sein, was sich Anwender wünschen. So kann jede Art von Datenbestand ein Datenprodukt darstellen, z. B. ein Dashboard, ein Bericht, eine Kundentabelle usw. Der Schlüssel liegt darin, zu entscheiden, wie man an Datenprodukte herangeht, sie entwirft und nutzt und dabei die Grundsätze des Produktmanagements anwendet.
Mit anderen Worten, man muss definieren, wie man ein Produkt erleben will. Es kann sich dabei auch um eine hierarchische Struktur mit Datengrundlagen für Finanzen, Marketing, Unternehmen usw. handeln, die eine vernetzte Architektur schafft, die mit kontrolliertem Zugriff gemeinsam genutzt werden kann.
Darüber hinaus kann es dann auch Data Marts geben, wobei jeder Data Mart für sich genommen ein Datenprodukt ist, das von allen genutzt werden kann, während die Grundlage nur für ausgewählte Teams zugänglich ist.
Änderung der Denkweise und des Ansatzes
Die Implementierung eines Data Mesh und eines Datenproduktansatzes erfordert ein Umdenken. Viele Unternehmen priorisieren derzeit zuerst die Technologie, mit einem engen Bottom-up-Fokus. Diese datengetriebene Denkweise kann jedoch zu technischen Herausforderungen führen, erfordert umfangreiche Data-Engineering-Ressourcen und verlagert die Datenqualität nach hinten, was oft zu Duplikaten und Datensilos führt.
Ein moderner architektonischer Ansatz für Datenprodukte hingegen wird von Geschäftsergebnissen bestimmt und konzentriert sich auf Prozesse und Self Service. Er stützt sich auf eine einheitliche Metadatenebene, um Auffindbarkeit, gemeinsames Verständnis, Governance, Datenschutz und gemeinsame Nutzung von Daten zu gewährleisten.
Be the first to comment