27. April 2025

Wie findet man die besten Prozessoren für KI-Anwendungen?

Künstliche Intelligenz (KI) ist ein der bestimmendes Thema im Jahr 2024. Für die entsprechende KI-Leistung sorgen spezielle Prozessoren. Die Frage ist: Welcher Prozessor ist am besten geeignet, um die eigenen KI-gestützten Anwendungen schnell, kostengünstig und ressourcenschonend zu bewältigen? Jeff Wittich, Chief Product Officer beim Chip-Experten Ampere Computing, weiß Rat. [...]

Jeff Wittich, Chief Product Officer beim Chip-Experten Ampere Computing (c) Ampere Computing

Bei der Wahl der richtigen CPU oder Beschleuniger für rechenintensive KI-Trainings und groß angelegte Inferenzen kommt es auf eine ideale Dimensionierung der Rechenleistung für die jeweilige Anwendung an. Jeff Wittich, Chief Product Officer beim Chip-Experten Ampere Computing, kennt drei mögliche Wege, um die richtige Lösung für KI-Workloads auszusuchen:

1. Es wird nur so viel Rechenleistung wie benötigt eingesetzt, um die Leistungsanforderungen der Anwendung zu erfüllen:

GPUs und andere KI-Beschleuniger sind für viele KI-Anwendungen – insbesondere für Batch-Inferenzen – ein Overkill an Rechenleistung. Die meisten Unternehmen, die mit dem Einsatz von KI-Modellen beginnen, nutzen allerdings diese Art von Inferenzen.

Da Batch-Inferenzanwendungen weniger anspruchsvolle Workloads sind und nicht die Rechenleistung eines GPUs oder Beschleunigers benötigen, ist die Verwendung von GPUs für diesen Zweck vergleichbar mit dem Kauf eines schicken Sportwagens für den morgendlichen Arbeitsweg – es ist mehr, als nötig wäre. Wird eine GPU für Batch-Inferenz verwendet, wird in der Regel nur ein kleiner Prozentsatz der Kapazität der GPU genutzt. Da GPUs mehr Strom verbrauchen und teurer sind, spart der Wechsel von der GPU zur CPU in diesen Fällen Energie, Platz und Kosten.

2. Eine Kombination aus Beschleunigern und energieeffizienten Cloud Native Processors für schwere KI-Trainings oder LLM-Inferencing-Workloads:

Bei KI-Anwendungen, die einen Beschleunigererfordern, wird die schwere KI-Arbeitslast auf dem Beschleunigerverarbeitet, während eine CPU als Systemhost erforderlich ist. Bei dieser Anwendung ist die Leistung der CPU immer gleich – unabhängig davon, welche CPU verwendet wird, da der Beschleuniger die Leistung des Systems bestimmt. Daher ist die Verwendung einer möglichst energieeffizienten CPU empfehlenswert. Durch den Einsatz von Cloud Native Processors kann die Energieeffizienz, die im Vergleich zu herkömmlichen x86-CPUs gewonnen wird, den Stromverbrauch des Gesamtsystems erheblich reduzieren – bei exakt gleicher Leistung.

3. Umstellung der AI-CPU-only-Inferenzierung von herkömmlichen x86-Prozessoren auf Cloud Native Processors:

Die meisten reinen AI-CPU-only-Inferenzierungsprozesse können mit einer Cloud Native CPU effektiver und effizienter durchgeführt werden als mit einem herkömmlichen x86-Prozessor. Das liegt daran, dass sie von vornherein für die Verarbeitung von Cloud-Workloads, wie wir sie für KI verwenden, entwickelt wurden. Im Gegensatz zu herkömmlichen x86-Prozessoren kann dank der Leistungssteigerungen durch die Cloud Native Processors von Ampere eine CPU-only für ein breiteres Spektrum an KI-Workloads eingesetzte werden. Dadurch entfällt der Bedarf an zusätzlichen Beschleunigern und Kosten und Energieverbrauch werden gesenkt.

Die Zukunft der KI ist leistungsfähig, effizient und offen

Die Welt steuert darauf zu, dass wir KI in unsere Weise zu leben und arbeiten integrieren. Daher ist die Senkung der Hardware- und Stromkosten für die Masseneinführung eine der größten Herausforderungen. Richtig dimensionierte Rechenleistung und optimierte Modelle führen zu Effizienz im großen Maßstab.

Ein Schlüssel zur richtigen Dimensionierung ist die Sicherstellung, dass die Hardwarelösungen nicht nur Ihre heutigen Rechenanforderungen erfüllen, sondern auch das Wachstum und die Zukunftssicherheit Ihrer Anwendung von morgen ermöglichen.

*Jeff Wittich ist Chief Product Officer beim Chip-Experten Ampere Computing.

Heinz-Peter Gahleitner, Leiter der Abteilung Branchenlösungen und Prokurist bei der PROGRAMMIERFABRIK (c) PROGRAMMIERFABRIK

PROGRAMMIERFABRIK verleiht Heinz-Peter Gahleitner die Prokura

25. April 2025 pi/cb

Seit 1987 arbeitet Heinz-Peter Gahleitner im Bereich Support und Entwicklung einer Individual-Software für österreichische Lagerhausgenossenschaften. […]

Die beiden Sprecherinnen von Women@DSAG: (links) Franziska Niebauer, Beraterin für SAP IS-H bei der Helios Kliniken GmbH, und Anna Hartmann, Geschäftsführerin der in4MD Service GmbH (c) Bild links: Helios Kliniken GmbH; Bild rechts: www.AndreasLander.de

Chancengleichheit der Geschlechter – überbewertet oder wichtiger denn je?

25. April 2025 pi/kdl

In den USA schaffen Großkonzerne auf Geheiß Donald Trumps ihre Diversitätsprogramme ab. Auch in Europa folgen Unternehmen dem „Anti-Woke-Kurs“. Die DSAG nahm dies zum Anlass, bei den Mitgliedern des Frauennetzwerks Women@DSAG nachzufragen, wie es derzeit um die Chancengleichheit der Geschlechter im Job steht. 139 Frauen aus Deutschland, Österreich und der Schweiz nahmen an der Umfrage teil. […]

In Großbritannien etwa nutzten Ende 2024 rund 50 Prozent der Erwachsenen digitale Erstbanken, Tendenz steigend. (c) Pexels

Unbricking the Wall: Neue Wege der Software-Governance in Großbanken

25. April 2025 Wolfgang Franz

Trotz erheblicher Investitionen in DevOps und CI/CD stoßen viele Banken bei der Softwarebereitstellung immer noch auf ein zentrales Hindernis: manuelle Governance-Prozesse. Diese bremsen nicht nur die Innovationsgeschwindigkeit, sondern bergen auch Compliance-Risiken. ITWelt.at hat sich eine aktuelle Kosli-Studie zu diesem Thema angesehen. […]

"Sammlung allerhand auserlesener Reponsorum […]", Johann Hieronymus Hermann, 1736 (c) Österreichische Nationalbibliothek

Kulturpool – digitalisiertes Kulturerbe

25. April 2025 pi/kdl

Einer der Vorteile der Digitalisierung ist, dass Kulturgüter zunehmend auch in digitalisierter Version für alle online zugänglich vorliegen. So versammelt das zentrale Suchportal für digitalisiertes Kulturerbe in Österreich, Kulturpool, 1,6 Millionen Objekten, darunter historische Handschriften, Bücher, Kunstwerke und vieles mehr. Einer der Hauptbeiträger von Kulturpool ist die Österreichische Nationalbibliothek. […]

IT ist nicht gleich IT-Security: Warum eine fachlich überschätzte IT-Abteilung zum Problem wird

25. April 2025

Selbst eine leistungsfähige IT-Abteilung mit qualifizierten Fachkräften deckt oft nicht automatisch den hochspezialisierten Bereich der Cybersicherheit ab. Fehlen spezifisches Knowhow und gezielte Ressourcen im Bereich IT-Security sind Unternehmen trotz starker IT-Infrastruktur anfällig für Cyberangriffe. […]

Unternehmen trotz verbesserter Schutzmaßnahmen noch immer Opfer von Cyberattacken

25. April 2025

Eine neue Studie von Veeam zeigt, dass die gemessenen Raten an Datenwiederherstellung angesichts fortschrittlicher Cyber-Bedrohungen alarmierend sind. Das unterstreicht den dringenden Bedarf an robusten Strategien für die Ausfallsicherheit von Daten. […]

Camunda veröffentlicht Buch zum Thema Enterprise Process Orchestration

25. April 2025

Camunda-Mitbegründer und Chief Technologist Bernd Rücker hat in Zusammenarbeit mit Principal Practice Strategist Leon Strauch einen praxisorientierten Leitfaden zur Nutzung von Prozessorchestrierung und Automatisierung geschrieben. […]

Cybercrime im Alltag: wie Betrüger analoge Wege nutzen

25. April 2025 Christian Reinhardt *

Der Begriff „Quishing“ – ein Kunstwort aus QR-Code und Phishing – steht exemplarisch für eine neue Form digitaler Täuschung im realen Raum. Cyberkriminelle platzieren dabei täuschend echte QR-Codes in öffentlich zugänglichen Orten, etwa auf Parkautomaten oder in öffentlichen Verkehrsmitteln. […]

YouTube optimal nutzen

25. April 2025 Andreas Fischer *

An der Videoplattform von Google kommt heute fast niemand vorbei. Auf YouTube finden Sie abertausende Videos aus verschiedensten Bereichen. Wir zeigen, wie Sie noch mehr aus der Webseite herausholen und sie optimal nutzen. […]

Werbung





Newsletter
			

		

Service
			Mediadaten 
 Printabo 
 Newsletter  
 Impressum 
 Whitepaper 
Knowhow 
 Zeitung Online 
 Case-Studies

App

 Datenschutz
		

Partnerseiten
			Virtuelle KI-Konferenz

Gitex Europe 

Website Security
		

Share
			RSS

Facebook

X

Xing

LinkedIn

YouTube

		



	
		
			Aktuelle Business IT-News für Österreich. Die  ITWELT (vormals: COMPUTERWELT) ist Österreichs führende IT- Zeitung für den gesamten Bereich der Informationstechnik und Telekommunikation. Wir schreiben für leitende IT- Experten (IT-Leiter, CIO) in IT-Branche und EDV-Abteilungen. Unsere Themen: Business Software, Netzwerk, Security, Mobile Kommunikation, Infrastruktur, Cloud, Wirtschaft, IT-Innovation. Zudem finden Sie hier IT-Anbieter, Whitepaper, Webinare, Termine, Social Events und Praxisreports aus der IT und ITK Branche. (c) 2024 - ITW Verlag GmbH

1. Es wird nur so viel Rechenleistung wie benötigt eingesetzt, um die Leistungsanforderungen der Anwendung zu erfüllen:

2. Eine Kombination aus Beschleunigern und energieeffizienten Cloud Native Processors für schwere KI-Trainings oder LLM-Inferencing-Workloads:

3. Umstellung der AI-CPU-only-Inferenzierung von herkömmlichen x86-Prozessoren auf Cloud Native Processors:

Die Zukunft der KI ist leistungsfähig, effizient und offen

Mehr Artikel