5. Dezember 2025

„Offshore-Leaks“: Big Data in Aktion

Das "größte Datenleck der Geschichte" hat einige, die ihr Vermögen in vermeintlich ruhigen Steueroasen geparkt haben, nervös gemacht. Wie man in einem 260 Gigabyte großen Datenberg – unstrukturiertes Material inklusive – die "smoking guns" findet. [...]

Die sogenannten Offshore-Leaks haben nicht nur die Welt der Schönen und Reichen durcheinandergewirbelt – das globale Netzwerk der Steueroasen wird derzeit mit viel Aufmerksamkeit gewürdigt. Mit der Zusendung der geheimnisvollen Festplatte an das „Internationale Konsortium investigativer Journalisten“ (ICIJ) vor etwa einem Jahr hat auch ein neues Zeitalter redaktioneller Recherche begonnen: Die 260 Gigabyte Daten, darunter über zwei Millionen E-Mails und Bilder, schlugen in den beteiligten Redaktionen des Konsortiums wie eine Bombe ein und degradierten die klassischen Such- und Analysemethoden der Journalistenwelt in Handumdrehen zu Klatschspielen an einem Kindergeburtstag. Big Data verlangt nach Größerem.

Freundlicherweise setzten die mit der Analyse der Datenberge betrauten Journalisten von Anfang an auf Transparenz und beschrieben schnell nach der Präsentation der ersten Ergebnisse im Detail, wie man sich an die 260 Gigabyte an geheimen Daten herangetastet hatte, darunter Sebastian Mondial aus Deutschland und der Brite Duncan Campbell in seinem Artikel „How ICIJ’s Project Team Analyzed the Offshore Files“.

Campbells Informationen zufolge enthält besagte Festplatte vier prall gefüllte Datenbanken, dazu 500.000 Text- und PDF-Dokumente, Tabellen, Bilder und Webfiles. Ein gewaltiger Berg an unstrukturierten Daten mit unzähligen Dubletten.

Bevor das Team an die Analyse gehen konnte, mussten erst zehntausende Dokumente, die als Bilddateien vorlagen, aufbereitet werden. Dazu gehörten etwa Kopien von Reisepässen oder Verträgen. Diese hat man mit einem OCR-fähigen System eingescannt, um Namen und Zahlen dem Recherchepool hinzuzufügen.

Dieser enthält nun so viele Daten, dass auch die Lebenszeit eines großen Mitarbeiterstabes nicht ausgereicht hätte, sie auszuwerten. Damit ist man inmitten der Welt von E-Discovery. „Sie müssen sich das wie einen Filterprozess vorstellen, bei dem die Software bestimmte Begriffe im Kontext sucht und nur die Dokumente zur Prüfung vorschlägt, die das gesuchte Muster zeigen“, erklärt Dokumentenanalyse-Fachmann Hartwig Laute von Recommind gegenüber der COMPUTERWELT. „Die Zeitersparnis bei Software-gestützter Dokumentensichtung ist enorm. Schon kleine Stichproben reichen, um in kurzer Zeit aus Millionen von Dokumenten die vielleicht 10.000 entscheidenden Dateien zu finden.“ Das ICIJ setzte die Programme NUIX und dtSearch ein, um am Ende des Tunnels überhaupt ein Licht zu erkennen.

Ein britischer Programmierer hat zudem unter dem Namen Interdata innerhalb von zwei Wochen ein System auf die Beine gestellt, damit die schnell wachsende Projektgruppe rasch an die relevanten Dokumente kommen konnte. Laut Duncan Campbell haben die beteiligten Journalisten über die interne Lösung bis Anfang April 28.000 Suchanfragen abgeschickt und 53.000 Dokumente heruntergeladen.

Trotz der potenten Hilfe in Sachen Big-Data-Analyse war das Frustrationslevel der Journalisten hoch – kein Wunder, denn die für die Firmengeflechte Verantwortlichen haben alles unternommen, ihre Spuren zu verwischen. (su)

Mehr als nur ein Compliance-Kriterium: Cybersicherheit ist eine Angelegenheit der Unternehmenskultur

5. Dezember 2025 Nicholas Jackson *

Ein Blick in die Praxis zeigt: IT-Sicherheit scheitert nicht an Technologien oder Fehlverhalten, sondern bereits grundsätzlich an einem Mangel an Unternehmenskultur. Wenn Cybersicherheit in einer Organisation nur als eine schlecht durchgesetzte Aufgabe von anderen für andere verstanden wird, entsteht vielleicht eine oberflächliche Compliance, aber keine wirkliche Cyberresilienz. […]

Agile Transformation scheitert nicht am Budget, sondern an der Unternehmenskultur

5. Dezember 2025

Um den Erfolg agiler Arbeitsweisen zu messen, setzen Österreichs Unternehmen auf klare Kennzahlen. Dabei ist vor allem die Kundenzufriedenheit wichtig. Gleichzeitig gewinnt Effizienz im Hinblick auf die angespannte Wirtschaftslage an Bedeutung: kürzere Projektlaufzeiten werden immer wichtiger, genauso wie die Kontrolle der Implementierungskosten. […]

Copilot-Notebook Medion SPRCHRGD 14 S2 (MD62722) im Test

5. Dezember 2025 Daniel Bader *

Zugegeben, am kryptischen Namen des brandneuen 14-Zoll-Notebooks sollte Hersteller Medion noch etwas feilen. Das, worauf es bei einem Laptop aber ankommt, ist vom Feinsten. Der PCtipp-Test. […]

Michael Maier, Director Austria iteratec (c) iteratec

KI-Transformation in Unternehmen – Eine Revolution in fünf Schritten

4. Dezember 2025 Michael Maier*

Wie weit wird die Evolution der Künstlichen Intelligenz gehen und wie wird sie sich auf Wirtschaft und Gesellschaft als Ganzes auswirken? Was für Privatpersonen interessante Fragen sind, sind für Unternehmer existenzielle Themen, schließlich müssen diese wirtschaftlich gegenüber Konkurrenten bestehen, von denen viele bereits an einer effektiven Nutzung von KI arbeiten. […]

Künstliche Intelligenz: Dateninfrastruktur ist wichtiger als der Use Case

4. Dezember 2025

Damit KI-Anwendungen produktiv und skalierbar eingesetzt werden können, benötigen Unternehmen zunächst eine tragfähige technologische und organisatorische Basis. Insbesondere moderne Datenplattformen, klare Governance-Strukturen und eine hohe Datenqualität gelten als Voraussetzung für erfolgreiche KI-Nutzung. Aber genau hier besteht noch Nachholbedarf. […]

Diese Trends bestimmen 2026 das SAP-Universum

4. Dezember 2025

Vor allem Datensouveränität, Compliance und das nahende Ende des Supports für Legacy-Lösungen stehen im Fokus – neben den Dauerthemen Cloud und KI. […]

Rebranding: Tietoevry schlägt mit „Tieto“ ein neues Kapitel auf

4. Dezember 2025

Die neue Marke vereint den operativen Kern des Tech-Consulting-Dienstleisters und bekräftigt sein Engagement, Wirtschaft und Gesellschaft mit Technologie zu unterstützen. […]

Produktionsplanung 2026: Worauf es ankommt

4. Dezember 2025

Resilienz gilt als das neue Patentrezept, um aktuelle und kommende Krisen nicht nur zu meistern, sondern sogar gestärkt daraus hervorzugehen. Doch Investitionen in die Krisenprävention können zu Lasten der Effizienz gehen. Ein Dilemma, das sich in den Griff bekommen lässt. […]

Monitor Eizo FlexScan EV2740S im Test

4. Dezember 2025 Daniel Bader *

Was soll denn an einem 27 Zoll großen Monitor für Büroumgebungen schon besonders sein? Vieles, wie unser Test klar macht. […]

„Offshore-Leaks“: Big Data in Aktion

Das "größte Datenleck der Geschichte" hat einige, die ihr Vermögen in vermeintlich ruhigen Steueroasen geparkt haben, nervös gemacht. Wie man in einem 260 Gigabyte großen Datenberg – unstrukturiertes Material inklusive – die "smoking guns" findet. [...]

Mehr Artikel

Mehr als nur ein Compliance-Kriterium: Cybersicherheit ist eine Angelegenheit der Unternehmenskultur

Agile Transformation scheitert nicht am Budget, sondern an der Unternehmenskultur

Copilot-Notebook Medion SPRCHRGD 14 S2 (MD62722) im Test

KI-Transformation in Unternehmen – Eine Revolution in fünf Schritten

Künstliche Intelligenz: Dateninfrastruktur ist wichtiger als der Use Case

Diese Trends bestimmen 2026 das SAP-Universum

Rebranding: Tietoevry schlägt mit „Tieto“ ein neues Kapitel auf

Produktionsplanung 2026: Worauf es ankommt

Monitor Eizo FlexScan EV2740S im Test

Be the first to comment

Leave a Reply Antwort abbrechen