23. April 2025

22. Dezember 2014 Kriemhilde Klippstätter*

Was ist was bei Big Data?

Big Data, was ist das eigentlich? Was gehört dazu, welche Techniken werden eingesetzt - und wozu das Ganze? Unser Glossar hilft weiter. [...]

Big Data, was ist das eigentlich? Was gehört dazu, welche Techniken werden eingesetzt – und wozu das Ganze? Der Begriff Big Data wurde schon im Jahr 2001 von Douglas Laney, dem damaligen Analysten der Meta Group – heute Gartner – eingeführt. Er beschrieb damit, was damals überall auf der Welt in den Unternehmen passierte: Die Erzeugung von immer größeren Unternehmens- und Kundendaten aus immer unterschiedlicheren Quellen. Laney definierte „Big Data“ als „Daten mit großem Volumen („Volume“), großer Vielfalt an Datenformaten („Variety“) und großer Geschwindigkeit („Velocity“) mit der neue Daten entstehen“.

Im Prinzip geht es heute bei Big Data darum, aus den Daten keine aggregierten Summentabellen zu erzeugen wie früher, sondern den einzelnen Vorgang bis auf Belegebene einzubeziehen und so Muster zu erkennen, die dann „den Weg nach vorne in die Zukunft weisen“. Eine Reihe von Fachbegriffen säumen das Wesen, die Verarbeitung und den Einsatz von Big Data. Hier erklären wir die wichtigsten:

AD TARGETING
Der Versuch, die Aufmerksamkeit des potenziellen Kunden zu gewinnen, meist durch „passgenaue“ Werbung.

ALGORITHMUS
Eine in Software gegossene mathematische Formel mit der ein Datensatz analysiert wird.

ANALYTICS
Mit Hilfe von Software-basierenden Algorithmen und statistischen Methoden werden Daten interpretiert. Dazu benötigt man eine analytische Plattform, die aus Software oder Software plus Hardware besteht und die die Werkzeuge und Rechenpower bereitstellt, um unterschiedliche analytische Abfragen durchführen zu können. Es gibt eine Reihe unterschiedlicher Formen und Einsatzzwecke, die in diesem Glossar näher beschrieben sind.

AUTOMATIC IDENTIFICATION AND CAPTURE (AIDC)
Jede Methode der automatischen Identifizierung und Datensammlung über eine Gegebenheit und die nachfolgende Speicherung in ein Computersystem. Etwa die Informationen aus einem RFID-Chip, die ein Scanner ausliest.

BEHAVIORAL ANALYTICS
Behavioral Analytics nutzt Informationen über das menschliche Verhalten, um die Absichten zu verstehen und zukünftiges Verhalten vorhersehen zu können.

BUSINESS INTELLIGENCE (BI)
Der generelle Ausdruck für die Identifizierung, Herkunft und Analyse der Daten.

CALL DETAIL RECORD (CDR) ANALYSE
Diese enthält Daten, die die Telekommunikationsunternehmen über die Nutzung von Mobilfunkgesprächen – etwa Zeitpunkt und Dauer der Gespräche – sammeln.

CASSANDRA
Ein verteiltes Datenbank-Verwaltungssystem für sehr große strukturierte Datenbanken („NoSQL“-Datenbanksystem) auf Open-Source-Basis (Apache).

CLICKSTREAM ANALYTICS
Bezeichnet die Analyse der Web-Aktivitäten eines Benutzers per Auswertung seiner Klicks auf einer Website.

COMPETITIVE MONITORING
Tabellen, in denen die Aktivitäten der Konkurrenz im Web automatisch gespeichert werden.

COMPLEX EVENT PROCESSING (CEP)
Ein Prozess, bei dem alle Aktivitäten in den Systemen einer Organisation überwacht und analysiert werden. Bei Bedarf kann sofort in Echtzeit reagiert werden.

DATA AGGREGATION
Das Sammeln von Daten aus unterschiedlichen Quellen für die Erstellung eines Berichts oder für eine Analyse.

DATA ANALYTICS
Ein Stück Software, mit dem Informationen aus einem Datensatz gezogen werden. Das Ergebnis kann ein Report, ein Status oder eine Aktion sein, die automatisch gestartet wird.

DATA ARCHITECTURE AND DESIGN
Legt dar, wie Unternehmensdaten strukturiert sind. Meist erfolgt das in drei Prozessschritten: Begriffliche Abbildung der Geschäftseinheiten, logische Abbildung der Beziehungen innerhalb der Geschäftseinheit sowie die physikalische Konstruktion eines Systems, das die Tätigkeiten unterstützt.

DATA EXHAUST
Die Daten, die eine Person bei ihrer Internet-Aktivität „nebenbei“ erzeugt.

DATA VIRTUALIZATION
Der Prozess der Abstraktion verschiedener Datenquellen durch eine einzige Zugriffsschicht auf die Daten.

DISTRIBUTED OBJECT
Ein Stück Software, das es erlaubt, mit verteilten Objekten auf einem anderen Computer zusammenzuarbeiten.

DE-IDENTIFICATION
Das Entfernen aller Daten, die eine Person mit einer bestimmten Information verbindet.

DISTRIBUTED PROCESSING
Die Ausführung eines Prozesses über verschiedene per Netzwerk verbundene Computer hinweg.

DRILL
Apache Drill ist eine Open-Source-SQL-Suchmaschine für Hadoop- und NoSQL-Datenmanagement-Systeme.

1 2

Bad Bot Report 2025: künstliche Intelligenz befeuert Anstieg schwer zu erkennender Bots

23. April 2025

Die Zunahme von KI-Tools hat die Einstiegshürde für Cyberangreifer wesentlich gesenkt und ermöglicht die Erstellung und den Einsatz bösartiger Bots in großem Umfang. Zum ersten Mal seit einem Jahrzehnt hat der automatisierte Datenverkehr die menschlichen Aktivitäten übertroffen und macht 51 Prozent gesamten Internetverkehrs aus. […]

KMU wollen neue Virtual Desktop Infrastrukturen

23. April 2025

Konfrontiert mit steigenden Kosten und zunehmender Komplexität ihrer bestehenden virtuellen Desktop-Infrastruktur (VDI) sind 63 Prozent der Mittelständler laut einer Studie von Parallels aktiv auf der Suche nach alternativen VDI- oder DaaS-Anbietern (Desktop-as-a-Service). […]

5G-Router Devolo WiFi 6 3600 5G LTE im Test

23. April 2025 Daniel Bader *

Lang, lang ist es her! Nach über 20 Jahren lanciert Netzwerkspezialist Devolo mit dem WiFi 6 3600 5G LTE wieder einen Router. Was die mobile Internetschleuse kann, verrät der Test. […]

Verantwortungsvolle KI ist laut Studie keine Option, sondern eine Notwendigkeit – insbesondere im sensiblen Bereich der Überwachung. (c) Pexels

KI in der Videoüberwachung: Potenziale, Herausforderungen und ethische Fragen

22. April 2025 Wolfgang Franz

Künstliche Intelligenz verändert die Videoüberwachung grundlegend und könnte künftig nicht nur die Sicherheit und Effizienz verbessern, sondern auch neue Formen der Geschäftsanalyse ermöglichen. ITWelt.at hat sich die Studie angesehen. […]

Peter Rosendahl, Senior Vice President New Work & Cybersecurity bei All for One (c) All for One

Mit Resilienz und Cyber-Kompetenz gegen wachsende Cyberkriminalität

22. April 2025 Peter Rosendahl*

Die Zahl der Cybercrime-Fälle nimmt weltweit rasant zu, und Österreich bildet dabei keine Ausnahme. Laut der aktuellen KPMG-Studie „Cybersecurity in Österreich 2024“ war bereits jeder sechste Cyberangriff auf ein österreichisches Unternehmen erfolgreich. Besonders alarmierend: Jedes dritte Unternehmen hat nach einem Ransomware-Angriff bereits Lösegeld bezahlt. […]

KI macht Jagd auf Borkenkäfer

22. April 2025

Das Interreg-Projekt SMARTbeetle hat ein klares Ziel: wirksamere und umweltfreundlichere Lockstoffe für den Borkenkäfer. Die Partner aus Österreich und Tschechien lassen sich bei der Entwicklung auch von künstlicher Intelligenz unterstützen. […]

Suchergebnisse als Falle

22. April 2025

Immer mehr Internetnutzer geraten unbewusst in die Fänge von Cyberkriminellen – nicht über dubiose E-Mails oder Links, sondern direkt über beliebte Suchmaschinen. Mit SEO-Betrugsmaschen gelangen gefälschte Webseiten durch die Manipulation der Suchergebnisse an prominente Positionen. Das hat teils gravierende Folgen für die Nutzer. […]

84 Prozent mehr Phishing-E-Mails als im Vorjahr

22. April 2025

In Europa wurde 23 Prozent aller 2024 weltweit erfassten Attacken registriert. Damit belegt Europa den dritten Platz der am meisten angegriffenen Wirtschaftsregionen. Innerhalb Europas waren das Vereinigte Königreich (25 Prozent), Deutschland (18 Prozent) und Österreich (14 Prozent) die meistattackierten Länder. […]

Monitor Eizo FlexScan FLT im Test

22. April 2025 Daniel Bader *

Sparsam im Verbrauch, maximal ergonomisch und herausragend in punkto Bildqualität. Nichts anderes will Eizos neues Business-Display FlexScan FLT leisten. Der Test. […]

Was ist was bei Big Data?

Big Data, was ist das eigentlich? Was gehört dazu, welche Techniken werden eingesetzt - und wozu das Ganze? Unser Glossar hilft weiter. [...]

Mehr Artikel

Bad Bot Report 2025: künstliche Intelligenz befeuert Anstieg schwer zu erkennender Bots

KMU wollen neue Virtual Desktop Infrastrukturen

5G-Router Devolo WiFi 6 3600 5G LTE im Test

KI in der Videoüberwachung: Potenziale, Herausforderungen und ethische Fragen

Mit Resilienz und Cyber-Kompetenz gegen wachsende Cyberkriminalität

KI macht Jagd auf Borkenkäfer

Suchergebnisse als Falle

84 Prozent mehr Phishing-E-Mails als im Vorjahr

Monitor Eizo FlexScan FLT im Test

Be the first to comment

Leave a Reply Antworten abbrechen