Talend verbessert Handhabung von Hadoop

Weil das Datenvolumen kontinuierlich weiter wächst, führen Organisationen auf der ganzen Welt Apache Hadoop ein, um Big Data zu speichern, verwalten und verarbeiten. Die Hadoop-Welt mit ihren schnellen Integrationszyklen kann aber Unternehmen vor große Herausforderungen stellen. [...]

„Hadoop hat enormes Potential, um Unternehmen beim Thema Big Data zu helfen“, so Merv Adrian, Research Vice President bei Gartner Research. „Bei großen Fortune-500-Unternehmen haben wir bereits eine ganze Reihe erfolgreicher Hadoop-Installationen beobachten können. Das typische Unternehmen hat aber meist keine eigenen Kenntnisse im Umgang mit Hadoop-Clustern und verwandten Werkzeugen zur Datenintegration. Sie warten auf weitere Verbesserungen, bevor sie ganz auf Hadoop setzen. Jetzt, wo die Infrastrukturebene von Hadoop unternehmensgeeignet ist, besteht der nächste Schritt darin, es besser verwaltbar und einfacher in der Bedienung zu machen.“
Talend bietet eine Open-Source-Lösung, mit der sich Hadoop mit den restlichen Unternehmensanwendungen verbinden lässt. Davon profitieren dem Unternehmen zufolge insbesondere Datenforscher, die auf große Datenmengen effizient und effektiv zugreifen und diese analysieren müssen. Als Kernkomponente der Talend Platform for Big Data soll Talend Open Studio for Big Data Organisationen ermöglichen, ihre Produktivität durch die Einrichtung von Big-Data-Lösungen in Stunden statt Wochen oder Monaten zu erhöhen. Talend Open Studio for Big Data ist den Angaben zufolge kompatibel zu allen Apache-Hadoop-Distributionen und in die Hortonworks Data Platform eingebettet. Zusätzlich zu den mehr als 450 Konnektoren, die Talend für die Integration von Unternehmensdaten in Hadoop bietet, etwa das Hadoop Distributed File System (HDFS), Pig, HBase, Sqoop und Hive, enthält Talend Open Studio for Big Data jetzt weitere Hadoop-Konnektoren, darunter:
HCatalog, ein Managementsystem für Metadaten und Tabellen, mit dem sich Daten zwischen Apache Hadoop und anderen Datensystemen im Unternehmen teilen lassen. Es ermöglicht Nutzern, Applikationen zu schreiben, ohne sich darum kümmern zu müssen, wo Daten gespeichert sind. Das macht sie unabhängig von Änderungen bei Datenschemata und Speicherformaten. 
Oozie, ein System zur Verarbeitung von Workflows, mit dem Anwender eine Jobserie in zahlreichen Sprachen definieren können – etwa Map Reduce, Pig and Hive – und das diese dann intelligent miteinander verbindet. Mit Oozie können Anwender beispielsweise festlegen, dass eine bestimmte Abfrage erst dann gestartet wird, wenn vorher spezifizierte Jobs, von denen die Abfrage Daten erhält, vollendet sind. 
„Als führender Anbieter einer kommerziellen Apache Hadoop Distribution freuen wir uns über unsere tief gehende Kooperation mit Talend. Gemeinsam bringen wir das Beste an Big-Data-Integration auf den Markt“, so Eric Baldeschwieler, CTO von Hortonworks. „Die Unterstützung von Hadoop-Technologien wie HCatalog und Oozie durch Talend Open Studio for Big Data verbessert die Integration mit der Unternehmens-IT und erleichtert das Management. Dadurch wird die Akzeptanz von Hadoop bei Unternehmen weiter wachsen.“ (pi)

Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*