13. Januar 2025

Sparse Modeling macht KI-Modell 80 Prozent schlanker

Der europäische KI-Chiphersteller Graphcore und das Heidelberger KI-Unternehmen Aleph Alpha konnten ein KI-Modell mit 13 Milliarden Parametern auf nur noch 2,6 Milliarden Parameter verschlanken und dabei die meisten seiner Fähigkeiten erhalten. [...]

Dense-vs-Sparse_w492_h312 — Foto: aleph-alpha.com

Die heute leistungsfähigsten KI-Modelle basieren auf vielen Milliarden von Parametern. Die größten Fortschritte wurden dabei bisher durch Skalierung erreicht. Der Bedarf an benötigter Rechenleistung nimmt allerdings erheblich schneller zu als die Parameteranzahl der KI-Modelle.

Dies führt zu immer weiter steigenden Anforderungen was die benötigte Rechenleistung angeht sowie natürlich auch dem damit einhergehenden wachsenden Energieverbrauch der KI-Modelle.

In den bisherigen Dense-Modellen wird ein Großteil der Rechenkapazität für die Durchführung von arithmetischen Operationen an Parametern aufgewandt, die für die behandelte Problemstellung nicht relevant sind, da aussagefähige Parameter in diesen Modellen spärlich verteilt sind („sparse“).

Sparse-Modelle nutzen hingegen neue Verfahren, bei denen – vereinfacht ausgedrückt – die Verarbeitungsleistung auf diejenigen Elemente konzentriert wird, die für die Lösung einer komplexen Aufgabe am wichtigsten sind.

Die IPU (Intelligence Processing Unit) des britischen KI-Chipherstellers Graphcore mit ihrem Multiple-Instruction Multiple-Data (MIMD) Design eignet sich hierfür ideal, da sie eine detailliertere Parallelität über mehrere Dimensionen hinweg ermöglicht und Point Sparse Matrix Multiplications unterstützt.

Das Verfahren, durch das circa 80 Prozent des Modellgewichts eliminiert und gleichzeitig die meisten seiner Fähigkeiten erhalten werden konnten, nutzt die von der Graphcore Intelligence Processing Unit (IPU) unterstützten Point Sparse Matrix Multiplications – eine Charakteristik der gezielt für KI-Workloads entwickelten Chiparchitektur.

Die beiden Unternehmen haben auf der Super Computing Conference 2022 (SC22) in Texas eine verschlankte Variante des Conversational Module Lumi von Aleph Alpha vorgestellt. Luminous Base Sparse benötigt nur 20 Prozent der Verarbeitungs-FLOPs und 44 Prozent des Speichers seines Dense-Äquivalents.

Von zentraler Bedeutung sei dabei, dass seine 2,6 Milliarden Parameter vollständig auf dem Ultra-High-Speed On-Chip-Memory eines Graphcore IPU-POD16 Classic gehalten werden können, wodurch eine maximale Leistung erzielt werden kann.

Die meisten KI-Anwendungen nutzen momentan Dense Models, bei denen alle Parameter gleichermaßen dargestellt und berechnet werden, unabhängig davon, ob diese zum Modellverhalten beitragen. Dies hat zur Folge, dass wertvolle Verarbeitungszeit und Speicherkapazität für die Speicherung von Parametern und zur Durchführung von Berechnungen mit Parametern verschwendet werden, die keinerlei Auswirkungen haben.

Aleph Alpha und Graphcore ist es gelungen, 80 Prozent des weniger relevanten Modellgewichts zu bereinigen und das Luminous-Modell nur mit den wichtigen Paramentern neu zu trainieren.

Die Anzahl der für Inferenzen erforderlichen FLOPs konnte im Vergleich zum Dense Model auf nur noch 20 Prozent gesenkt werden, während die Speicherbelegung auf 44 Prozent reduziert werden konnte.

Dies ist darauf zurückzuführen, dass zusätzliche Kapazität zur Speicherung von Orts- und Wertinformationen für die verbleibenden Non-Zero Parameter benötigt wird. Das Sparse Model, soll außerdem 38 Prozent weniger Energie verbrauchen als das Dense Model.

aleph-alpha.com

*Bernhard Lauer beschäftigt sich seit Jahrzehnten mit IT-Themen und bereitet diese als Autor und Redakteur auf – unter anderem für die dotnetpro. Programmieren gelernt hat er mit dem C64 und Basic. Er hat über die Anfänge von Java, JavaScript, HTML und .NET berichtet und sich zuletzt mit Python beschäftigt, nicht zuletzt deshalb, weil es ohne Semikolons auskommt ;-).

Transparenz in Gehaltsfragen wird für Unternehmen immer wichtiger, um im Wettbewerb um Talente bestehen zu können. (c) Pexels

IT-Branche & CO – so viel verdient man in Deutschland

10. Januar 2025 Wolfgang Franz

Der Stepstone Gehaltsreport 2025 bietet einen detaillierten Einblick in die aktuelle Gehaltslandschaft in Deutschland. Die IT-Branche nimmt in der Studie eine bedeutende Stellung ein. […]

Die wichtigsten Technologietrends für den Sicherheitssektor im Jahr 2025

10. Januar 2025

Axis Communications hat sechs Technologietrends identifiziert, die den Sicherheitssektor im Jahr 2025 prägen werden. Die Trends bringen sowohl Herausforderungen als auch Chancen mit sich, um beispielsweise mehr Flexibilität, Effizienz und verbesserte Wertschöpfung für Hersteller, Systemintegratoren und Endkunden zu erreichen. […]

GitHub Copilot Free: kostenloser KI-Coding-Assistent

10. Januar 2025 Patrick Hediger *

GitHub bietet jetzt mit Copilot Free eine kostenlose Version seines KI-basierten Coding-Assistenten an, die es Entwicklern ermöglicht, von intelligenten Code-Vorschlägen zu profitieren. […]

Künstliche Intelligenz kommt auf Endgeräten an

10. Januar 2025

Das Jahr 2025 wird an vielen Stellen für Umbrüche und Neuerungen sorgen. Ein genereller Trend ist dabei der weiter greifende Einsatz von KI-Funktionen: Unternehmen werden immer mehr Anwendungsfälle erkennen sowie implementieren – und dabei auch verstärkt auf lokale KI-Ressourcen und On-Prem-Hardware zurückgreifen. […]

Flexible Vernetzung dezentraler Unternehmensstrukturen

10. Januar 2025

Drei ergänzt sein Angebot für Geschäftskunden mit einer Vernetzungslösung für Firmenstandorte. Mit Drei SD-WAN lassen sich Standorte jeder Größe sowie Home-Office-Arbeitsplätze und Cloud-Anwendungen ans Firmennetz anbinden. […]

7 KI-Trends, die das Jahr 2025 prägen werden

10. Januar 2025

2025 wird wegweisend für die Weiterentwicklung der Künstlichen Intelligenz. Experten weltweit arbeiten daran, KI praxisnäher, präziser und vertrauenswürdiger zu machen. Mit besonderem Blick auf Datenarbeit skizziert Michael Berthold, CEO von KNIME, sieben wichtige Trends. […]

Andreas Müller, Vice President Enterprise Sales Central and Eastern Europe bei Delinea (c) Delinea

KI, Deepfakes und Quantenkryptografie bergen Bedrohungspotential

9. Januar 2025 Andreas Müller*

Die Bedrohungen im Cyberraum entwickeln sich schneller, als viele Unternehmen reagieren können – von KI-unterstützten Angriffen bis hin zu Deepfake-Technologien. Andreas Müller, Vice President Enterprise Sales Central and Eastern Europe bei Delinea, über die wichtigsten Cybersicherheits-Herausforderungen für 2025. […]

Florian Brence, Partner bei Deloitte Österreich (c) Deloitte

Diese Trends bestimmen die Tech-Welt 2025

9. Januar 2025 pi/wf

Deloitte-Analyse: Auch wenn der erste mediale Hype vorbei ist, wird vor allem das Thema Generative Artificial Intelligence (GenAI) den Markt in den kommenden Monaten aufmischen. Die Branche muss sich auf einen Umbruch einstellen, der neben Chancen und Potenzialen auch einige Herausforderungen bringen wird. […]

Markus Eisele, Developer Strategist bei Red Hat. (c) Red Hat

Warum offene Plattformen 2025 der Gamechanger für die KI werden

9. Januar 2025 Markus Eisele*

Künstliche Intelligenz wird auch 2025 ein entscheidender Treiber für die Innovations- und Wettbewerbsfähigkeit von Unternehmen sein. Laut Markus Eisele, Developer Strategist bei Red Hat, sollten IT-Verantwortliche und Führungskräfte im kommenden Jahr auf fünf Entwicklungen achten. […]

Sparse Modeling macht KI-Modell 80 Prozent schlanker

Der europäische KI-Chiphersteller Graphcore und das Heidelberger KI-Unternehmen Aleph Alpha konnten ein KI-Modell mit 13 Milliarden Parametern auf nur noch 2,6 Milliarden Parameter verschlanken und dabei die meisten seiner Fähigkeiten erhalten. [...]

Mehr Artikel

IT-Branche & CO – so viel verdient man in Deutschland

Die wichtigsten Technologietrends für den Sicherheitssektor im Jahr 2025

GitHub Copilot Free: kostenloser KI-Coding-Assistent

Künstliche Intelligenz kommt auf Endgeräten an

Flexible Vernetzung dezentraler Unternehmensstrukturen

7 KI-Trends, die das Jahr 2025 prägen werden

KI, Deepfakes und Quantenkryptografie bergen Bedrohungspotential

Diese Trends bestimmen die Tech-Welt 2025

Warum offene Plattformen 2025 der Gamechanger für die KI werden

Be the first to comment

Leave a Reply Antworten abbrechen