Talend verbessert Handhabung von Hadoop

Weil das Datenvolumen kontinuierlich weiter wächst, führen Organisationen auf der ganzen Welt Apache Hadoop ein, um Big Data zu speichern, verwalten und verarbeiten. Die Hadoop-Welt mit ihren schnellen Integrationszyklen kann aber Unternehmen vor große Herausforderungen stellen. [...]

„Hadoop hat enormes Potential, um Unternehmen beim Thema Big Data zu helfen“, so Merv Adrian, Research Vice President bei Gartner Research. „Bei großen Fortune-500-Unternehmen haben wir bereits eine ganze Reihe erfolgreicher Hadoop-Installationen beobachten können. Das typische Unternehmen hat aber meist keine eigenen Kenntnisse im Umgang mit Hadoop-Clustern und verwandten Werkzeugen zur Datenintegration. Sie warten auf weitere Verbesserungen, bevor sie ganz auf Hadoop setzen. Jetzt, wo die Infrastrukturebene von Hadoop unternehmensgeeignet ist, besteht der nächste Schritt darin, es besser verwaltbar und einfacher in der Bedienung zu machen.“
Talend bietet eine Open-Source-Lösung, mit der sich Hadoop mit den restlichen Unternehmensanwendungen verbinden lässt. Davon profitieren dem Unternehmen zufolge insbesondere Datenforscher, die auf große Datenmengen effizient und effektiv zugreifen und diese analysieren müssen. Als Kernkomponente der Talend Platform for Big Data soll Talend Open Studio for Big Data Organisationen ermöglichen, ihre Produktivität durch die Einrichtung von Big-Data-Lösungen in Stunden statt Wochen oder Monaten zu erhöhen. Talend Open Studio for Big Data ist den Angaben zufolge kompatibel zu allen Apache-Hadoop-Distributionen und in die Hortonworks Data Platform eingebettet. Zusätzlich zu den mehr als 450 Konnektoren, die Talend für die Integration von Unternehmensdaten in Hadoop bietet, etwa das Hadoop Distributed File System (HDFS), Pig, HBase, Sqoop und Hive, enthält Talend Open Studio for Big Data jetzt weitere Hadoop-Konnektoren, darunter:
HCatalog, ein Managementsystem für Metadaten und Tabellen, mit dem sich Daten zwischen Apache Hadoop und anderen Datensystemen im Unternehmen teilen lassen. Es ermöglicht Nutzern, Applikationen zu schreiben, ohne sich darum kümmern zu müssen, wo Daten gespeichert sind. Das macht sie unabhängig von Änderungen bei Datenschemata und Speicherformaten. 
Oozie, ein System zur Verarbeitung von Workflows, mit dem Anwender eine Jobserie in zahlreichen Sprachen definieren können – etwa Map Reduce, Pig and Hive – und das diese dann intelligent miteinander verbindet. Mit Oozie können Anwender beispielsweise festlegen, dass eine bestimmte Abfrage erst dann gestartet wird, wenn vorher spezifizierte Jobs, von denen die Abfrage Daten erhält, vollendet sind. 
„Als führender Anbieter einer kommerziellen Apache Hadoop Distribution freuen wir uns über unsere tief gehende Kooperation mit Talend. Gemeinsam bringen wir das Beste an Big-Data-Integration auf den Markt“, so Eric Baldeschwieler, CTO von Hortonworks. „Die Unterstützung von Hadoop-Technologien wie HCatalog und Oozie durch Talend Open Studio for Big Data verbessert die Integration mit der Unternehmens-IT und erleichtert das Management. Dadurch wird die Akzeptanz von Hadoop bei Unternehmen weiter wachsen.“ (pi)

Mehr Artikel

News

6 Grundsätze für eine KI-taugliche Datenbasis

Wer Künstliche Intelligenz nutzen will, muss über eine vertrauenswürdige Datengrundlage verfügen. Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. Nur so können KI-Modelle robust, anpassungsfähig und vertrauenswürdig arbeiten. […]

News

Cybersicherheitsbudgets werden falsch priorisiert

Der ICS/OT Cybersecurity Budget Report 2025 von OPSWAT deckt erhebliche Lücken in den Cybersicherheitsbudgets sowie einen Anstieg von ICS/OT-fokussierten Angriffen auf. Ferner wird deutlich, wie durch eine unzureichende Finanzierung, falsch gesetzte Prioritäten und uneinheitliche Abwehrmaßnahmen kritische Infrastrukturen immer raffinierteren Bedrohungen ausgesetzt sind. […]

News

Nach dem Hype: Diese vier KI-Trends werden 2025 weiterhin prägen

Die vergangenen zwei Jahre haben einen regelrechten KI-Boom erlebt. Insbesondere generative Modelle (GenAI) haben sich rasant weiterentwickelt und etablieren sich zunehmend als feste Größe in den Arbeitsprozessen von Organisationen weltweit. Angesichts dieser Dynamik fragen sich nun viele Unternehmen, welche Entwicklungen das Jahr 2025 bestimmen werden und welche Potenziale sich daraus ergeben. […]

News

Generative KI als Sicherheitsrisiko

Eine neue Studie von Netskope zeigt einen 30-fachen Anstieg der Daten, die von Unternehmensanwendern im letzten Jahr an GenAI-Apps (generative KI) gesendet wurden. Dazu gehören sensible Daten wie Quellcode, regulierte Daten, Passwörter und Schlüssel sowie geistiges Eigentum. Dies erhöht das Risiko von kostspieligen Sicherheitsverletzungen, Compliance-Verstößen und Diebstahl geistigen Eigentums erheblich. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*