21. März 2025

23. Juni 2023 it-daily.net | Ines Wolf; Quantum

Die Auswirkungen von KI, ML und Deep Learning auf Data Storage

Artificial Intelligence (AI) und Maschinelles Lernen (ML) sind schon seit langem ein heiß diskutiertes Thema. Die Auswirkungen auf unser Leben waren bisher jedoch noch überschaubar. [...]

files-gd7add669b_640 — Foto: AgKu/Pixabay

Seitdem jedoch OpenAI mit ChatGPT für Furore sorgt, klingen die enthusiastischen AI-Prognosen aus den letzten Jahren kaum noch futuristisch. Es steht nicht mehr zur Debatte, dass AI und andere Formen des Maschinellen Lernens das Leben und die Wirtschaft nachhaltig verändern werden.

Denn mit AI-Tools lassen sich wiederholende Aufgaben automatisieren und beschleunigen. Möglich machen das neue AI-Anwendungen – auf der Grundlage riesiger Datenmengen. Die Entwicklung von Deep-Learning-Anwendungen erfolgt dabei im Allgemeinen in drei Schritten: Datenaufbereitung, Modelltraining und Schlussfolgerung.

1. Datenaufbereitung (data preparation) – Riesige Mengen an Rohmaterial werden in verwertbare Daten umgewandelt.
2. Modelltraining (model training) – Softwareprogramme werden darauf trainiert, aus den Daten eine neue Fähigkeit zu erlernen.
3. Schlussfolgerung (inference) – Das Programm wendet das Gelernte auf neue Daten an.

Man muss kein Spezialist sein, um zu sehen, dass Daten die Basis für AI sind. Entsprechend kann erwartet werden, dass mit mehr AI-Anwendungen ein massives Datenwachstum einhergeht. Branchenanalysten gehen davon aus, dass sich die Kapazität unstrukturierter Daten – also Dateien und Objekte – in den nächsten Jahren verdoppeln oder sogar verdreifachen wird. AI, ML und Deep Learning werden einen großen Anteil an diesem Wachstum haben.

Neue Ära für Datenspeicherung

Diese “neue Ära” für Daten stellt die Verantwortlichen für die IT-Infrastruktur vor einige besondere Herausforderungen. Die Datensätze haben einen Umfang und ein Volumen, welche exponentiell größer sind als alles andere je zuvor.

Unternehmen, die beispielsweise Machine-Learning-Technologien für Autonomes Fahren entwickeln, erzeugen im Allgemeinen in nur wenigen Jahren mehr als ein Exabyte an Daten.

Autonomes Fahren ist eine Form des Maschinellen Lernens, insbesondere des maschinellen Sehens, das auf Bild- und Videodaten beruht. Es wird erwartet, dass sich das Datenwachstum aufgrund von AI und ML in den nächsten fünf Jahren noch weiter beschleunigen wird.

Anforderungen an die Storage-Infrastruktur

Über die einfache Speicherung dieser enormen Datenmengen hinaus, stellen solche Deep-Learning-Anwendungen enorme Anforderungen an die Leistung der Speicherinfrastruktur. Denn die Verarbeitung dieser riesigen unstrukturierten Datensätze erfordert extrem niedrige Latenzzeiten und auch in diesem Maßstab konsistente Performance.

Festplattenbasierte Speichersysteme, die auf seriellen Festplatten basieren, können diese Anforderungen einfach nicht mehr erfüllen. Um die nötigen niedrigen Latenzzeiten und höhere Performance zu garantieren, setzen Unternehmen auf neue verteilte Architekturen basierend auf NVMe und RDMA.

Die Nutzung dieser auf Flash basierten Speicher werden aufgrund der sinkenden Preise für Flashspeicher auch immer häufiger eingesetzt.

Deutliche Leistungssteigerung von Speichersystemen notwendig

Der Ort der Speicherung dieser neuen Daten ist ein weiterer Faktor, den es zu beachten gilt. Denn die Daten befinden sich in den seltensten Fällen bequem auf dem Primärspeicher im Hauptrechenzentrum. In den meisten Fällen werden die Daten irgendwo außerhalb des Rechenzentrums erzeugt und anschließend zur Verarbeitung an einen anderen Ort transferiert.

Dies kann in der Public Cloud oder in einem Rechenzentrum geschehen, oder – was wahrscheinlicher ist – finden Teile der Datenverarbeitung an beiden Orten statt. Datentransport und -verwaltung über den gesamten Lebenszyklus der Daten hinweg sind also wichtige Aspekte für die Verantwortlichen der IT-Infrastruktur.

Insbesondere, da diese Datenmengen und ihre Modelle über Jahrzehnte aufbewahrt werden, falls die Programme neu trainiert werden müssen.

All diese Faktoren haben bereits Druck auf alte Speicherarchitekturen ausgeübt. Der größte Teil der unstrukturierten Daten wird auf Systemen gespeichert, die vor über 20 Jahren entwickelt wurden, als man sich noch nicht vorstellen konnte, dass zukünftig Billionen von Daten und Objekten jahrzehntelang gespeichert werden und die meisten Dateien von Maschinen und nicht von Menschen erstellt werden.

Fazit: Storage neuester Generation mit NVMe und RDMA ist notwendig

Unternehmen, die Anwendungen auf Basis von AI, ML und Deep Learning erstellen, können ihre Ziele auf Dauer nicht mit einer traditionellen Speicherinfrastruktur erreichen, denn diese beeinträchtigt die Produktivität der Datenwissenschaftler, Inhaltsersteller und Analysten, die täglich auf diese Daten angewiesen sind.

Schlussendlich müssen diese Unternehmen sich mit den Möglichkeiten von Speicherarchitekturen der neuesten Generation auseinandersetzen. NVMe und RDMA werden hier zwangsläufig Teil der Planung sein.

Resilient und autonom wie eine Raumstation

21. März 2025 Paul Butnaru *

Autonom durch KI Gefahren erkennen, sich redundant aufstellen und Ausfallszenarien schon in der Entwicklung einkalkulieren: Auf der internationalen Raumstation ISS implementierte IT zeigt den Weg für die irdische IT-Sicherheit. […]

KI-Agenten brauchen menschliche Aufsicht

21. März 2025

Agentic AI bietet Unternehmen große Vorteile, muss aber von menschlichen Instanzen überwacht werden, um regulatorische Vorgaben und ethische Standards zu erfüllen. […]

Unternehmen im DACH-Raum zunehmend mit KI-Angriffen konfrontiert

21. März 2025

Unternehmen im DACH-Raum sehen sich verstärkt mit KI-gesteuerten Cyberangriffen konfrontiert und verzeichnen einen Anstieg von Multichannel-Cyberattacken. Besonders kritisch ist außerdem der unkontrollierte Zugriff auf sensible Unternehmensinfrastrukturen über persönliche Geräte und Konten von Mitarbeitenden. […]

OC3 2025: Top-Event für Confidential Computing

21. März 2025

Die fünfte Auflage der Open Confidential Computing Conference (OC3) steigt am 27. März 2025 im hybriden Format in Berlin sowie online und vereint Spitzenexperten aus den Bereichen IT-Sicherheit, Cloud und KI-Datenschutz. […]

Generative KI wird bereits von knapp 44 Prozent der Onlinebevölkerung genutzt. (c) Pexels

Nutzung und Wahrnehmung generativer KI zur Informationssuche in Deutschland

21. März 2025 pi/wf

In welchem Ausmaß, für welche Zwecke und aus welchen Gründen die deutsche Bevölkerung generative künstliche Intelligenz in Anwendungen wie ChatGPT oder Google Gemini nutzt, hat das Forschungsprojekt “Generative künstliche Intelligenz für die Informationsnavigation”, gefördert vom BMBF, untersucht. […]

Gerold Pulverer, Business Management der Insight in Österreich (c) Insight Technology Solutions GmbH

DaaS als Gamechanger im IT-Management

20. März 2025 Chistof Baumgartner

Die moderne Arbeitswelt erfordert Flexibilität und Mobilität. Mitarbeitende nutzen längst nicht nur einen Büro-PC, sondern mehrere IT-Geräte. Unternehmen stehen dadurch vor der Frage: Wie lässt sich dieses Geräte-Management effizient und nachhaltig gestalten? Insight bietet mit »Flex for Devices« ein Device as a Service (DaaS)-Modell, das strukturierte Verwaltung, ökologische Nachhaltigkeit und finanzielle Flexibilität ermöglicht. ITWELT.at hat dazu mit Gerold Pulverer, Business Management von Insight in Österreich, ein Interview geführt. […]

Die wichtigsten IT-Trends für 2025

20. März 2025

Peter Lieber, Unternehmer und Vize-Präsident des Verbandes Österreichischer Software Innovationen, skizziert, welche IT-Themen heuer auf der Agenda von IT-Verantwortlichen ganz oben stehen sollten. […]

Deep Observability und fünf weitere Schritte zur NIS-2-Konformität

20. März 2025 Tiho Saric *

Noch immer steht das genaue Datum nicht fest, ab wann die europäische NIS2-2 Richtline offiziell in Kraft treten wird. Das übergeordnete Ziel ist bekanntlich, die Cybersicherheit und -resilienz in Unternehmen auf europäischer und nationaler Ebene zu stärken. Sichtbarkeit bis zur Netzwerkebene (Deep Observability) wird daher immer entscheidender und wandelt sich für Unternehmen vom „Nice-to-have“ zum „Must-have“. […]

KI-Agenten werden zum unverzichtbaren Bestandteil der Softwareentwicklung

20. März 2025

Der aktuelle State of IT Report von Salesforce zeigt, wie Unternehmen ihre Strategien und Taktiken angesichts der steigenden Nachfrage nach immer neuen Services und Apps, zunehmenden IT-Sicherheitsbedrohungen und den laufenden Entwicklungen im Bereich der künstlichen Intelligenz anpassen. […]

Die Auswirkungen von KI, ML und Deep Learning auf Data Storage

Artificial Intelligence (AI) und Maschinelles Lernen (ML) sind schon seit langem ein heiß diskutiertes Thema. Die Auswirkungen auf unser Leben waren bisher jedoch noch überschaubar. [...]

Neue Ära für Datenspeicherung

Anforderungen an die Storage-Infrastruktur

Deutliche Leistungssteigerung von Speichersystemen notwendig

Fazit: Storage neuester Generation mit NVMe und RDMA ist notwendig

Mehr Artikel

Resilient und autonom wie eine Raumstation

KI-Agenten brauchen menschliche Aufsicht

Unternehmen im DACH-Raum zunehmend mit KI-Angriffen konfrontiert

OC3 2025: Top-Event für Confidential Computing

Nutzung und Wahrnehmung generativer KI zur Informationssuche in Deutschland

DaaS als Gamechanger im IT-Management

Die wichtigsten IT-Trends für 2025

Deep Observability und fünf weitere Schritte zur NIS-2-Konformität

KI-Agenten werden zum unverzichtbaren Bestandteil der Softwareentwicklung

Be the first to comment

Leave a Reply Antworten abbrechen