24. April 2025

Hadoop: Was die Plattform alles kann

Wenn man über Big Data spricht, meint man damit oft gleichzeitig auch Hadoop. Hadoop ist eine der zentralen Technologien im Big Data Umfeld. Laut IDC gibt es in Österreich inzwischen auch schon etliche Pilotprojekte. [...]

Die IDC hat in den letzten Monaten mehrere Umfragen zu Hadoop gemacht und mit den bedeutendsten heimischen Unternehmen gesprochen – mit dem Resultat, dass mittlerweile sehr viele Pilotprojekte mit Hadoop durchgeführt werden.

Hadoop ist keine Software, die man mithilfe eines Setup-Assistenten installiert. Es handelt sich um eine Plattform für verschiedene Dienste. Erste große Anwendungen liefen bei Yahoo, wo Hadoop für Map/Reduce Jobs benutzt wurde. Heute muss man nicht mehr zwangsweise Map/Reduce Jobs selbst schreiben, denn Hadoop bietet eine ganze Reihe an abstrakten Sprachen, welche Skripte wiederum in Map/Reduce Umfragen übersetzen.

Der Hadoop-Stack lässt sich in fünf große Blöcke einteilen, welche wiederum mehrere Teilprojekte haben. Der erste Block kümmert sich um das Cluster-Management. Hier sind Hadoop-Projekte vertreten, welche die primäre Aufgabe haben, grundlegende Infrastrukturbereiche abzudecken. Ambari ist hierbei für die Provisionierung, Überwachung und Management, ZooKeeper für die Koordinierung im Cluster und Oozie für das Workflow-Scheduling zuständig.

Eine Ebene höher befinden sich wichtige Dienste wie HDFS (Hadoop Distributed File System) und die gemeinsam genutzten Bibliotheken. YARN ist die Ausführungsebene, welche sich um die Ausführung der Map/Reduce Jobs kümmert und die Ressourcen verwaltet.

Der nächste Layer besteht aus dem Datenspeicher, Datenzugriff und „Data Science“. Wichtige Projekte sind hier HBase, welches eine sehr beliebte NoSQL-Datenbank zum Speichern großer Datenmengen darstellt. Für den Datenzugriff wird oftmals Apache Pig und Apache Hive verwendet. Apache Hive ist vor allem für SQL-Entwickler sehr interessant, da das Konzept von Hive auf SQL basiert (wobei viele Elemente von SQL nicht unterstützt werden). Apache Pig wiederum bietet eine „Datenflusssprache“ und ermöglicht es, Daten zu transformieren.

Auf diesen Layer gibt es noch eine ganze Menge weiterer Projekte wie etwa Apache Storm, welches vor allem für Echtzeitanalysen sehr gut geeignet ist. Storm wurde von Twitter entwickelt, um die „Trending Topics“ anzuzeigen. Aber auch andere Teilprojekte wie etwa Tez, Mahout, Giraph und Spark bieten sehr interessante Möglichkeiten, um mit großen und sich schnell bewegenden Datenquellen zu arbeiten.

Der vorletzte Layer bietet zahlreiche Projekte für die Datenintegration. Müssen Daten importiert werden, so sind Projekte auf diesem Layer hilfreich. Der letzte Layer bietet ein GUI an. Dieses kommt vom führenden Hadoop-Distributor Cloudera und heißt Hue. Dieses Projekt macht die Arbeit mit Hadoop wesentlich einfacher. (pi/aw)

Demokratie mit KI: webLyzard leitet EU-Forschungsprojekt für digitale Bürgerbeteiligung

24. April 2025

Falschinformation, Polarisierung, Filterblasen: die moderne Demokratie ist zahlreichen Bedrohungen ausgesetzt. Als Antwort darauf will das kürzlich gestartete EU-Projekt „MultiPoD“ einen offenen, multikulturellen Raum für politische Debatten schaffen – mit Hilfe von künstlicher Intelligenz (KI). Die Koordination übernimmt das Deep Tech Unternehmen webLyzard aus Wien. […]

Risikobewertung von Drittanbietern wird zunehmend wichtiger

24. April 2025 Thomas Lo Coco *

Anzahl und Umfang von Drittanbieter-Netzwerken steigen stetig, und damit steigt auch das Risiko durch Drittanbieter. Deren Risikobewertung muss angesichts der aktuellen Cyber-Bedrohungen eine Kernkomponente der Cyber-Resilienz-Strategie jedes Unternehmens werden. […]

Cyberangriffe auf österreichische Unternehmen im ersten Quartal 2025 um 69 Prozent gestiegen

24. April 2025

Der Global Cyber Attack Report von Check Point zeigt eine starke Zunahme der Cyber-Angriffe in Östrreich – mit 69 Prozent ein stärkeres Wachstum als weltweit (47 Prozent). Global sind besonders Ransomware-Angriffe mit einem Anstieg von 126 Prozent durch die Decke gegangen. […]

Finanziell motivierte Gruppen machen 55 Prozent aller Angreifer aus. (c) Pexels

Cyberbedrohungen im Wandel: Angreifer nutzen Schwachstellen und soziale Manipulation gezielt aus

23. April 2025 Wolfgang Franz

Die aktuelle Mandiant-Analyse „M-Trends 2025“ von Google Cloud liefert umfassende Einblicke in globale Cyberbedrohungen des Jahres 2024. Der Bericht zeigt auf, wie Angreifer zunehmend Schwachstellen, gestohlene Zugangsdaten und unzureichend gesicherte Cloud-Umgebungen ausnutzen, um ihre Ziele zu verfolgen. ITWelt.at hat sich die Studie angesehen. […]

Die Nutzung von KI im Unternehmensalltag erfordert gezielte Maßnahmen zur Risikosteuerung. (c) Pexels

KI am Arbeitsplatz: Sicherheitsrisiken durch Mitarbeiter

23. April 2025 pi/cb

Die Integration künstlicher Intelligenz in Unternehmen birgt neben Produktivitätssteigerungen auch wachsende Sicherheitsrisiken. Unachtsame oder unautorisierte KI-Nutzung durch Mitarbeiter kann zu Datenlecks und anderen Bedrohungen führen. […]

42 Prozent der Österreicher:innen sind gestresst im Job

23. April 2025

41,5 Prozent der Arbeitnehmer:innen sind bei der Arbeit gestresst. Zudem sagt in einer Studie von kununu nur rund jede dritte angestellte Person (35,7 Prozent) in Österreich, dass ihr Arbeitsplatz eine gesunde Work-Life-Balance sowie das mentale oder körperliche Wohlbefinden unterstützt oder aktive Pausen fördert. […]

Bad Bot Report 2025: künstliche Intelligenz befeuert Anstieg schwer zu erkennender Bots

23. April 2025

Die Zunahme von KI-Tools hat die Einstiegshürde für Cyberangreifer wesentlich gesenkt und ermöglicht die Erstellung und den Einsatz bösartiger Bots in großem Umfang. Zum ersten Mal seit einem Jahrzehnt hat der automatisierte Datenverkehr die menschlichen Aktivitäten übertroffen und macht 51 Prozent gesamten Internetverkehrs aus. […]

KMU wollen neue Virtual Desktop Infrastrukturen

23. April 2025

Konfrontiert mit steigenden Kosten und zunehmender Komplexität ihrer bestehenden virtuellen Desktop-Infrastruktur (VDI) sind 63 Prozent der Mittelständler laut einer Studie von Parallels aktiv auf der Suche nach alternativen VDI- oder DaaS-Anbietern (Desktop-as-a-Service). […]

5G-Router Devolo WiFi 6 3600 5G LTE im Test

23. April 2025 Daniel Bader *

Lang, lang ist es her! Nach über 20 Jahren lanciert Netzwerkspezialist Devolo mit dem WiFi 6 3600 5G LTE wieder einen Router. Was die mobile Internetschleuse kann, verrät der Test. […]

Hadoop: Was die Plattform alles kann

Wenn man über Big Data spricht, meint man damit oft gleichzeitig auch Hadoop. Hadoop ist eine der zentralen Technologien im Big Data Umfeld. Laut IDC gibt es in Österreich inzwischen auch schon etliche Pilotprojekte. [...]

Mehr Artikel

Demokratie mit KI: webLyzard leitet EU-Forschungsprojekt für digitale Bürgerbeteiligung

Risikobewertung von Drittanbietern wird zunehmend wichtiger

Cyberangriffe auf österreichische Unternehmen im ersten Quartal 2025 um 69 Prozent gestiegen

Cyberbedrohungen im Wandel: Angreifer nutzen Schwachstellen und soziale Manipulation gezielt aus

KI am Arbeitsplatz: Sicherheitsrisiken durch Mitarbeiter

42 Prozent der Österreicher:innen sind gestresst im Job

Bad Bot Report 2025: künstliche Intelligenz befeuert Anstieg schwer zu erkennender Bots

KMU wollen neue Virtual Desktop Infrastrukturen

5G-Router Devolo WiFi 6 3600 5G LTE im Test

Be the first to comment

Leave a Reply Antworten abbrechen