5. April 2025

Gute Daten, schlechte Daten

Wie Automatisierung dabei helfen kann, die Integrität von Daten im Zeitalter von Big Data zu gewährleisten. [...]

c1rH9xdG — Neil Barton ist CTO von WhereScape, einem Anbieter von Software zur Automatisierung der Dateninfrastruktur. (c) WhereScape

Der Begriff Big Data ist nun schon einige Jahre alt. Er wurde Mitte der 2000er Jahre erfunden, um Datensätze zu beschreiben, die zu groß waren, um sie mit herkömmlichen Business-Intelligence-Tools verwalten und verarbeiten zu können. Seitdem ist die Menge der Daten bekanntlich exponentiell weiter gewachsen und stellt IT-Manager allein schon wegen des schwer vorstellbaren Volumens vor große Herausforderungen.

Doch über die enorme Menge der Daten hinaus, gibt es selbstverständlich noch weitere Facetten, die es bei Big Data zu beachten gilt. Eine dieser Facetten ist die Art neu generierter Daten, die zu einem immer größer werdenden Anteil unstrukturiert sind. Der Nachteil bei der Verwaltung solcher Daten ist, dass sie im Vergleich zu ihren strukturierten Verwandten deutlich schwerer zu kategorisieren und zu sortieren sind. Die Datenspeicherung und -verwaltung ist natürlich kein Selbstzweck. In den vielen Daten schlummert enormes Potenzial, das Unternehmen mit Big-Data-Analytics-Lösungen nutzen wollen, um im Wettbewerb mit anderen Unternehmen erfolgreich zu sein. Somit ist es für jedes Unternehmen sehr wichtig zu lernen, wie sie mit den immer größer werdenden, vermehrt unstrukturierten Datensätzen umgehen sollen.

Mangelnde Datenintegrität verfälscht Big-Data-Analysen

Die Suche nach Wert innerhalb der Daten ist für viele IT-Verantwortlichen, trotz der Nutzung entsprechender Lösungen, wie die sprichwörtliche Suche nach der Nadel im Heuhaufen. Doch nicht nur das große Datenvolumen stellt bei dieser Suche nach wertvollen Informationen ein enormes Problem dar. Denn je mehr Informationen man hat, desto größer ist die Wahrscheinlichkeit, dass einige dieser Informationen falsch, doppelt, veraltet oder anderweitig fehlerhaft sind. Diese mangelhafte Integrität gespeicherter Daten stellt für Unternehmen natürlich eine große Herausforderung dar. Denn sind Daten verfälscht, können die aus ihnen abgeleiteten Erkenntnisse auch nicht richtig sein.

Sieht man sich die Probleme vieler Unternehmen mit ihren Ansätzen zur Datenanalyse in der Praxis an, so erkennt man, dass diese Lösungen alleine nicht ausreichen, um Datenintegrität bei großen Datensammlungen zu gewährleisten. Neue Technologien wie KI und Maschinelles Lernen können zwar helfen, auch sehr große Datensätze besser zu verstehen, doch auch ihre Ergebnisse können nur so gut sein, wie die zugrunde liegenden Daten. Damit die Gewinnung von Erkenntnissen im Rahmen einer Big-Data-Strategie also effektiv ist, egal ob mit traditionellen Mitteln oder neueren Mitteln wie KI, muss ein gewisses Maß an Ordnung herrschen. Daten müssen also von fehlerhaften, doppelten oder alten Versionen befreit werden, bevor sie für die Analyse genutzt werden können. Nur so ist die Analyse effektiv und lässt sich zukünftig höher skalieren.

Konfigurationsfehler produzieren einen Strom fehlerhafter Daten

Fehler zu finden und zu beseitigen ist somit eine wertvolle Fähigkeit. Dies gilt generell für alle Fehler, insbesondere jedoch für grundlegende Konfigurationsfehler von Datenquellen. Bleiben diese Fehler unentdeckt, so produzieren diese Quellen einen andauernden Strom schlechter Daten – und schlussendlich natürlich auch eine uneffektive Analyse und fehlerhafte Ableitungen. Der Wert solcher Big-Data-Analysen ist natürlich gering.

Dieses Problem wird noch verschärft, wenn Daten aus mehreren verschiedenen Quellen und Systemen aufgenommen werden, von denen jede die Daten unterschiedlich verarbeitet haben kann. Die schiere Komplexität einer solchen Big-Data-Architektur kann das Aufspüren von Fehlern fast unmöglich machen. Man sucht dann nicht mehr nach einer Nadel im Heuhaufen, sondern eine Nadel in einem Stall voller Heuhaufen.

DSGVO fordert höhere Datenintegrität von Unternehmen

Inzwischen ist die Herausforderung Datenintegrität zu schaffen nicht mehr nur auf die IT-Abteilung beschränkt. Seitdem die DSGVO in Kraft ist, müssen Unternehmen Wege finden, ihre personenbezogenen Daten im Rahmen der Gesetzgebung zu verwalten – unabhängig davon, wie komplex ihre Infrastruktur sein mag, oder wie schwierig es sein kann, unstrukturierte Daten zu verwalten. Darüber hinaus müssen Unternehmen in der Lage sein, Informationen über eine Person zu löschen, zu sammeln und sogar an Behörden weiterzugeben.

Die Automatisierung des Data-Warehouse schafft Datenintegrität

Also, was ist die Lösung? Eine der besten Lösungen für die Verwaltung des Monsters Big Data und eine, die die Möglichkeit bietet, Datenintegrität zu schaffen, ist die komplette Automatisierung des Data Warehouse. Automatisiert man dieses, schafft man einen klaren Weg, der zeigt, woher die Daten stammen und wie sie im Lauf der Zeit verwendet wurden.

Darüber hinaus sind automatisierte Prozesse wesentlich einfacher zu verwalten und damit auch zuverlässiger. Um ihre Datenaufnahme und -verarbeitung zu automatisieren, nutzen Unternehmen eine moderne Automatisierungssoftware. Moderne Lösungen bieten über die effektive Automatisierung auch Funktionen, die die Abstammung von Daten bis ins kleinste Detail darstellen können. Sie können Datenquellen beispielsweise sogar nachträglich katalogisieren. Auch die Datenextraktion zur Einhaltung von Anforderungen im Rahmen der DSGVO ist mit solchen Lösungen einfach möglich.

Mit den richtigen Tools, wie der Automatisierung des Data Warehouse, wird die Datenspeicherung im Rahmen einer Big-Data-Strategie wesentlich einfacher – und schafft gleichzeitig Datenintegrität. So können Datenprozesse einfach zurückverfolgt werden, inklusive wann und wo die Daten genutzt wurden. Big Data kann so mit all seinen komplexen Facetten gelingen und Erkenntnisse liefern, auf die sich Unternehmen auch komplett verlassen können.

Neil Barton ist CTO von WhereScape, einem Anbieter von Software zur Automatisierung der Dateninfrastruktur.

Datenschutzverstöße in Österreich nehmen zu

4. April 2025

2024 kam es in Europa zu 130.000 Datenschutzverstößen – davon rund 1.300 in Österreich. Für Österreich bedeutet das einen Anstieg der Datenschutzverstöß von 21 Prozent im Vergleich mit dem Jahr 2023. Nur 4 Länder verzeichneten Rückgänge bei den Verstößen. Seit dem DSGVO-Start wurden in der EU 5,9 Milliarden Euro Bußgelder verhängt. […]

Erster Pre-6G Videostream in Österreich

4. April 2025

Im A1 Technologiezentrum in Wien haben A1 und Technologiepartner Nokia den nächsten Schritt in der Evolution des Mobilfunks gesetzt: Erstmals in Mitteleuropa wurde ein Pre-6G Videostream im oberen 6-GHz-Spektrum durchgeführt. […]

Best Practices zum Umgang mit Lookalike-Domains

4. April 2025

Bei Cyberangriffen, die Lookalike-Domains nutzen, registrieren Angreifer für sich Domains, die legitimen Domains echter Unternehmen sehr ähnlich sehen. Nachdem sie sich die entsprechende Domain gesichert haben, beginnen sie dann, die dazugehörigen E-Mail-Server für eine E-Mail-Angriffskampagne herzurichten. […]

Europas digitale Souveränität beginnt mit IT-Sicherheit „made in EU“

4. April 2025

Die geopolitischen Herausforderungen der letzten Jahre zeigen: Europa muss unabhängiger werden – auch in der IT-Sicherheit. Der europäische IT-Sicherheitshersteller ESET warnt davor, sich auf Anbieter außerhalb der EU zu verlassen und fordert Unternehmen sowie Behörden auf, sich bewusst für europäische Lösungen zu entscheiden. […]

Digitalisierung der Immobilienbranche schreitet voran

4. April 2025 Simon Müller *

Die Digitalisierung stellt die Immobilienwirtschaft vor zahlreiche Herausforderungen. Ein zentraler Aspekt ist der Fachkräftemangel, der laut Umfragen 79 Prozent der Unternehmen dazu drängt, KI als Schlüsseltechnologie für die Automatisierung von Routineaufgaben einzusetzen. […]

Ein Großteil der Unternehmen stuft seine Sicherheitslage als stabil oder verbessert ein. (c) Pexels

Deloitte-Studie: Zwischen Realität und gefühlter Sicherheit

4. April 2025 Wolfgang Franz

Österreichische Unternehmen stehen vor einer zunehmend komplexen Cyber-Bedrohungslage, die durch den technologischen Fortschritt – insbesondere durch künstliche Intelligenz – weiter verschärft wird. Der Deloitte Cyber Security Report 2025 zeigt auf, wie Unternehmen auf diese Herausforderungen reagieren. ITWelt.at hat sich die Studie angesehen. […]

Rainer Schneemayer, Geschäftsführer bei Timewarp (c) timeline / Rudi Handl

Maßgeschneiderte Lösungen zur Steigerung der Resilienz

3. April 2025 Klaus Lorbeer

In Zeiten multipler Krisen spielt eine hohe Unternehmensresilienz sowie ein gutes Business Continuity Management eine wichtige Rolle. Wie man sein Unternehmen resilienter machen und im Fall eines Falles die Ausfallzeiten so gering wie möglich halten kann, erklärt Rainer Schneemayer, Geschäftsführer bei Timewarp, im ITWELT.at-Interview. […]

Raiffeisen Bank International etabliert internationales FinTech-Scout-Netzwerk. (c) Unsplash

RBI setzt auf globale FinTech-Scouts

3. April 2025 pi/cb

Die Raiffeisen Bank International (RBI) verstärkt ihre Bemühungen im Bereich Finanzinnovationen durch die Etablierung eines global verteilten Teams von FinTech-Scouts. Diese Experten sollen Marktentwicklungen und neue Geschäftsmodelle aufzeigen sowie direkten Zugang zu relevanten Technologieanbietern weltweit ermöglichen. […]

Hightech-Crime-Report: Advanced Persistent Threats setzen Europa unter Druck

3. April 2025

Mit einem Anstieg von 22 Prozent gegenüber dem Vorjahr nahmen betrügerische Machenschaften 2024 weltweit zu. Europäische Finanzdienstleister waren mit 34 Prozent aller Betrugsfälle am stärksten betroffen, gefolgt von der Transportbranche und dem Regierungs- und Militärsektor. Auch bei Phishing-Angriffen setzte sich der Aufwärtstrend fort: Mehr als 80.000 Phishing-Websites wurden 2024 enttarnt – ein Anstieg um 22 Prozent gegenüber dem Vorjahr. […]

Gute Daten, schlechte Daten

Wie Automatisierung dabei helfen kann, die Integrität von Daten im Zeitalter von Big Data zu gewährleisten. [...]

Mangelnde Datenintegrität verfälscht Big-Data-Analysen

Konfigurationsfehler produzieren einen Strom fehlerhafter Daten

DSGVO fordert höhere Datenintegrität von Unternehmen

Die Automatisierung des Data-Warehouse schafft Datenintegrität

Mehr Artikel

Datenschutzverstöße in Österreich nehmen zu

Erster Pre-6G Videostream in Österreich

Best Practices zum Umgang mit Lookalike-Domains

Europas digitale Souveränität beginnt mit IT-Sicherheit „made in EU“

Digitalisierung der Immobilienbranche schreitet voran

Deloitte-Studie: Zwischen Realität und gefühlter Sicherheit

Maßgeschneiderte Lösungen zur Steigerung der Resilienz

RBI setzt auf globale FinTech-Scouts

Hightech-Crime-Report: Advanced Persistent Threats setzen Europa unter Druck

Be the first to comment

Leave a Reply Antworten abbrechen