SAP Datasphere: Die neueste SAP-Evolution im Bereich Data & Analytics

Aus SAP Data Warehouse Cloud wird SAP Datasphere! Was steckt hinter dem neuen Release? Bloß ein neuer Name – also anders ausgedrückt reines Marketing – oder verbirgt sich mehr hinter der neuesten Evolution aus dem Hause SAP? [...]

Foto: GerdAltmann/Pixabay

Am 8. März 2023 launchte SAP Datasphere im Rahmen von SAP Data Unleashed, einem virtuellen Event rund um Neuerungen im Kontext Data & Analytics. Auch auf den diesjährigen DSAG Technologietagen am 22. und 23. März in Mannheim war Datasphere eines der Hot Topics. Und so viel vorneweg: Die Neuausrichtung seitens SAP verspricht einiges und Datasphere bietet bereits einige spannende neue Features. 

Werfen wir aber zunächst nochmal einen Blick zurück. Die Entwicklung der Data Warehouse Cloud  (DWC) in den letzten anderthalb Jahren war wirklich rasant. Mit jedem neuen Release spürte und spürt man die Intensität und Manpower, mit denen hinter den Kulissen an neuen Features und der Verbesserung bestehender Funktionalitäten gearbeitet wird.

Auf einige der aktuellsten Neuerungen im Rahmen der Umbenennung zu Datasphere werde ich später noch genauer eingehen. 

In der Praxis zeigte sich in den letzten Monaten, dass die DWC insbesondere beim Thema Datendemokratisierung ein sehr interessanter und relevanter Baustein für Unternehmen werden kann.

Durch die zentralen Elemente der Spaces, Sharing-Optionen zwischen den unterschiedlichen virtuellen Bereichen sowie Data Access Controls als wichtige Governance-Elemente auf der einen Seite und der Möglichkeit, Modelle auf Basis eines grafischen Editors zu erstellen, auf der anderen Seite ergeben sich mitunter komplett neue Möglichkeiten in der Zusammenarbeit zwischen IT und Business.

Ein Tool alleine ermöglicht natürlich keine Datendemokratisierung im Unternehmen – die technischen Möglichkeiten erfordern immer auch das Vorhandensein von Datenkompetenz innerhalb der involvierten Bereiche (Data  Literacy) sowie klar definierte Data & Analytics-Rollen. 

Die Agilität sowie die leichte und intuitive Bedienbarkeit bei der Erstellung neuer analytischer Modelle beziehungsweise semantischer Sichten auf vorhandene Datensets sind in der agilen und schnelllebigen Business-Welt ein absoluter Unterscheidungsfaktor im Analytics-Umfeld.

Auf der anderen Seite wurden auch die Möglichkeiten aus Entwicklersicht stark erweitert. Ein Beispiel ist hier das Command Line Interface (CLI). Seit einiger Zeit ist es über das DWC-CLI  möglich, gewisse manuelle und vor allem wiederkehrende Tätigkeiten beim Administrieren des Tenants, der Userverwaltung oder dem Erstellen von Tabellen und Views mithilfe der Kommandozeile programmatisch zu lösen – oder besser gesagt zu automatisieren.

Das DWC-CLI  ist technisch gesehen ein eingeständiges Node.js-Modul. Voraussetzung ist die Installation der letzten Node.js-Version auf dem Client. Mithilfe des CLI lassen sich lästige und wiederkehrende Mehrfacharbeiten in der UI reduzieren und wie bereits erwähnt automatisieren – und letztendlich auf diese Weise auch standardisieren. 

Seit der Einführung der DWC wurden neue Innovationen im Bereich Data & Analytics nach und nach nur noch im neuen Cloud-Service integriert; ein Beispiel ist hier der Data Marketplace, der mittlerweile etliche Datenmodelle von Drittanbietern bereitstellt.

Ebenso hat man als Unternehmen die Möglichkeit, eigene Datenprodukte nach draußen zu verteilen. Hier denke man zum Beispiel an Lieferanten oder enge Partner, mit denen auf diese Weise noch enger kooperiert werden kann. Sogar innerhalb eines Unternehmens lässt sich der Marketplace nun einsetzen, um beispielsweise Datenprodukte an die eigenen Fachbereiche auszuliefern. 

SAP Datasphere – auf dem Weg zur „Business Data Fabric“ 

Werfen wir nun einen genaueren Blick auf die neueste Evolutionsstufe im Data & Analytics-Portfolio von SAP. Was verbirgt sich hinter dem Begriff Datasphere? Zunächst einmal ändert sich für DWC Kunden nicht sonderlich viel: Das Look&Feel des Tools ist gleich geblieben, lediglich der Name  wurde ausgetauscht und bereits einige neue technische Features hinzugefügt. 

Mit Datasphere möchte SAP den Data-Fabric-Ansatz stärker verfolgen und spricht in dem Zusammenhang nun von einer „Business Data Fabric“. Aber was versteht SAP eigentlich unter diesem Begriff?  

SAPs Definition der Business Data Fabric ist im Kern eine Datenmanagementarchitektur für einen virtuellen oder persistierten semantischen Daten-Layer über der darunterliegenden Datenlandschaft  (Beispiele: zentrales DWH, Lakehouse, MES- beziehungsweise Produktionsdaten, IoT-Daten etc.) eines Unternehmens.

Die Basis für dieses Vorhaben soll mit SAP Datasphere und einem offenen Daten-Ökosystem, das im Zuge einiger strategischen Partnerschaften mit unter anderem Databricks, Collibra, Confluent und DataRobot angekündigt wurde, geschaffen werden. Das  grundlegende Ziel, das SAP hiermit verfolgt, ist, einen skalierbaren und einheitlichen Datenzugriff ohne Datenduplikationen im Unternehmen zu ermöglichen.


Datasphere bildet SAPs Grundlage einer Business Data Fabric. Bildquelle: Screenshot SAP

Als Grundlage einer Business Data Fabric bringt Datasphere sämtliche Funktionalitäten eines modernen Data Tools mit, angefangen vom Datenzugriff via Self-Service &  Data Discovery bis hin zur  Datenintegration sowie Governance & Security.

Data Warehousing, Virtualisierung, die semantische Modellierung von Businesslogik sowie Orchestrierung und Processing als zentrale Datenmanagementaufgaben gehören ebenso zum Funktionsumfang. Wer sich bereits mit der DWC  beschäftigt hat, wird merken, dass dies nun erstmal nichts Neues ist, denn auch die DWC verfügte schon über die genannten Funktionalitäten.

Rein technisch ist Datasphere daher aktuell vielmehr als das neueste Release der DWC zu interpretieren. Einige Neuigkeiten auf dem Weg zum vollumfänglichen Data Tool gibt es aber dennoch bereits mit der Umstellung zu SAP Datasphere: 

  • Neue Datenintegrationsmöglichkeiten mit dem Cloud-basierten Replication Flow
    • Der Replication Flow ist ein Data Intelligence Feature, das nun in Datasphere integriert wurde. Mit der Komponente kann man eine Cloud-basierte Datenreplikation ohne Transformationslogik durchführen und somit große Datenmengen von A nach B bewegen. Ebenso unterstützt der neue Replication Flow den Change Data Capture (CDC). Stand heute ist der Funktionsumfang noch stark eingeschränkt. So stehen derzeit als Ziel beispielsweise lediglich SAP Datasphere, HANA Cloud und HANA  Data Lake zur Auswahl. Es wurde jedoch angekündigt, dass zukünftig für den Replication Flow auch Third-Party-Applikationen als mögliches Ziel angeboten werden. 
  • Neues analytisches Modell
    • Mit dem neuen Artefakt für die semantische Datenmodellierung hat SAP deutlich mehr Modellierungsmöglichkeiten geschaffen. Es ist nun in Datasphere möglich, ein auf die Anforderungen des Business abgestimmtes und optimiertes semantisches Datenmodell mit Variablen, eingeschränkten Kennzahlen und Filtern für die SAC bereitzustellen. Darüber hinaus  bietet das neue analytische Modell eine wirklich sehr hilfreiche Datenvorschau bei der Modellierung und eine verbesserte Integration mit der SAC bei der späteren Nutzung. 
  • Ein weiterer Schritt Richtung Datendemokratisierung und Governance mit dem neuen Catalog
    • Mit Datasphere hat SAP nun auch einen Data Catalog gelauncht. Über den Catalog Crawler werden die  Metadaten aus Datasphere automatisch in den Catalog geladen, ebenso lassen sich zusätzlich SAC-Instanzen mit wenigen Klicks integrieren. 

SAP Datasphere Catalog Source Systems und Metadaten-Extraktion. Bildquelle: QUNIS GmbH

Über den Catalog und dessen Suchfunktion kann man seinen Business Usern jetzt einen sehr guten Überblick über die verfügbaren Datenprodukte geben, KPIs definieren, kategorisieren und in den Assets pflegen sowie Business Terms in Form eines Glossars definieren.

Über die Lineage lassen sich so schnell und einfach die Views und Tabellen in Datasphere ausfindig machen, auf die beispielsweise ein Report in der SAC auf Basis eines analytischen Modells aufsetzt. 


Datasphere Catalog – Beispiel Lineage. Bildquelle: QUNIS GmbH

Fazit

Auf dem Data & Analytics Forum im Juni 2022 kündigte SAP das Projekt „SAP Data Suite“ an. Mit Datasphere präsentiert das Unternehmen aus Walldorf nun die ersten Ergebnisse – und wenn die Entwicklung der neuen Data Suite von SAP mit der gleichen Geschwindigkeit wie in den vergangenen Monaten weitergeht, sind wir sehr optimistisch, dass die aktuell noch bestehenden Funktionslücken Schritt für Schritt geschlossen werden.

Beispielsweise verspricht der Blick auf die Roadmap im Laufe des Jahres eine nahtlose Integration der SAC-Planung mit Datasphere und die Erweiterung des neuen Catalogs hinsichtlich der Anbindung zusätzlicher SAP-Quellen.

Ebenso soll  es zukünftig möglich sein, User pro Space unterschiedlich zu berechtigen. Auch das analytische  Modell wird weiter ausgebaut und um Multi-Fact sowie weitere Modellierungsfunktionen erweitert. 

Aber es gibt auch noch genügend Themen, die dringend angegangen werden müssen. Insbesondere beim Thema Life-Cycle-Management – Stichwort CI/CD – hat SAP Datasphere aktuell noch keine wirklich zufriedenstellende Antwort zu bieten. 

powered by www.it-daily.net


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*