IBM Granite 3.0: Vertrauenswürdige KI-Modelle für Unternehmen

Auf der jährlichen TechXchange-Veranstaltung von IBM präsentierte das Unternehmen mit Granite 3.0 seine bisher fortschrittlichste Familie von KI-Modellen. Die Granite-Sprachmodelle der dritten Generation übertreffen bei vielen akademischen und industriellen Benchmarks ähnlich große Modelle der Konkurrenz und zeichnen sich durch hohe Leistung, Transparenz und Sicherheit aus. [...]

IBM engagiert sich sehr für Open-Source-KI und dementsprechend werden die Granite-Modelle unter einer uneingeschränkten Apache 2.0-Lizenz veröffentlicht. Die Granite 3.0-Familie von IBM umfasst:

Allgemeine Anwendungen/Sprachen: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Leitplanken und Sicherheit: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mischung aus Experten: Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base

Die neuen Granite 8B- und 2B-Modelle sind als „Arbeitspferde“ für die KI in Unternehmen konzipiert und bieten hohe Leistung und Kosteneffizienz für Aufgaben wie Retrieval Augmented Geneneration (RAG), Klassifizierung, Zusammenfassung, Entitätsextraktion und Toolnutzung. Diese kompakten, vielseitigen Modelle sind für die Feinabstimmung mit Unternehmensdaten konzipiert und lassen sich nahtlos in jede Geschäftsumgebung und jeden Arbeitsablauf integrieren.

Während viele große Sprachmodelle (LLMs) auf öffentlich verfügbaren Daten trainiert werden, bleibt ein Großteil der Unternehmensdaten ungenutzt. Durch die Kombination eines kleinen Granite-Modells mit Unternehmensdaten, insbesondere unter Verwendung der revolutionären Alignment-Technik InstructLab – die von IBM und RedHat im Mai vorgestellt wurde – können Unternehmen nach Ansicht von IBM eine aufgabenspezifische Leistung erzielen, die mit größeren Modellen konkurriert, und das zu einem Bruchteil der Kosten (basierend auf einer beobachteten Spanne von 3- bis 23-fach geringeren Kosten als bei großen Frontier-Modellen in mehreren frühen Proofs-of-Concept. Die Kostenberechnungen basieren auf den API-Kosten pro Million Token von IBM watsonx für offene Modelle und openAI für GPT4-Modelle (unter der Annahme einer Mischung von 80 Prozent Inout, 20 Prozent Output) für Kunden-Proofs-of-Concept.)

Mit Granite 3.0 unterstreicht IBM ihr Engagement, Transparenz, Sicherheit und Vertrauen in KI-Produkte schaffen zu wollen. Der technische Bericht zu Granite 3.0 und der Leitfaden zur verantwortungsvollen Nutzung enthalten eine Beschreibung der Datensätze, die zum Trainieren dieser Modelle verwendet wurden, Einzelheiten zu den angewandten Filter-, Bereinigungs- und Kuratierungsschritten sowie umfassende Ergebnisse der Modellleistung in wichtigen akademischen und Unternehmens-Benchmarks.

Entscheidend ist, dass IBM eine IP-Entschädigung für alle Granite-Modelle auf watsonx.ai anbietet, damit Unternehmenskunden ihre Daten vertrauensvoll mit den Modellen zusammenführen können.

Die Messlatte höher legen: Granite 8B- und 2B-Benchmarks

Die Granite 3.0-Sprachmodelle zeigen auch bei der reinen Leistung vielversprechende Ergebnisse.

Bei akademischen Standard-Benchmarks, die vom Hugging Face OpenLLM Leaderboard definiert wurden, liegt die Gesamtleistung des Granite 3.0 8B Instruct-Modells im Durchschnitt über der Leistung von Open-Source-Modellen ähnlicher Größe von Meta und Mistral. Bei IBMs modernstem Sicherheitsbenchmark AttaQ ist das Granite 3.0 8B Instruct Modell in allen gemessenen Sicherheitsdimensionen führend im Vergleich zu Modellen von Meta und Mistral.

Bei den zentralen Unternehmensaufgaben der RAG, der Werkzeugnutzung und den Aufgaben im Bereich Cybersecurity zeigt das Granite 3.0 8B Instruct Modell im Vergleich zu ähnlich großen Open-Source-Modellen von Mistral und Meta eine durchschnittlich führende Leistung.

IBM bietet seine Granite Mixture of Experts (MoE) Architecture-Modelle, Granite 3.0 1B-A400M und Granite 3.0 3B-A800M, als kleinere, leichtgewichtige Modelle an, die sowohl für Anwendungen mit geringer Latenz als auch für CPU-basierte Implementierungen eingesetzt werden können und ein hervorragendes Gleichgewicht zwischen Leistung und Inferenzkosten bieten.

Außerdem kündigt IBM eine aktualisierte Version seiner vortrainierten Granite-Zeitreihenmodelle an, deren erste Versionen Anfang des Jahres veröffentlicht wurden. Diese neuen Modelle wurden mit dreimal so vielen Daten trainiert und liefern eine starke Leistung bei allen drei wichtigen Zeitreihen-Benchmarks und übertreffen die 10-mal größeren Modelle von Google, Alibaba und anderen. Die aktualisierten Modelle bieten auch eine größere Flexibilität bei der Modellierung mit Unterstützung für externe Variablen und rollierende Prognosen.

Granite Guardian 3.0: die nächste Ära verantwortungsvoller KI

Im Rahmen dieser Version führt IBM auch eine neue Familie von Granite Guardian-Modellen ein, die es Anwendungsentwicklern ermöglichen, Sicherheitsleitplanken zu implementieren, indem sie Benutzeraufforderungen und LLM-Antworten auf eine Vielzahl von Risiken überprüfen. Die Granite Guardian 3.0 8B- und 2B-Modelle bieten die umfassendste Palette an Risiko- und Schadenserkennungsfunktionen, die derzeit auf dem Markt erhältlich ist.

Zusätzlich zu den Schadensdimensionen wie soziale Voreingenommenheit, Hass, Toxizität, Obszönität, Gewalt, Gefängnisausbruch und desgleichen mehr bieten diese Modelle auch eine Reihe einzigartiger RAG-spezifischer Prüfungen, wie z. B. Fundiertheit, Kontextrelevanz und Antwortrelevanz. In umfangreichen Tests mit 19 Sicherheits- und RAG-Benchmarks hat das Granite Guardian 3.0 8B-Modell eine höhere Gesamtgenauigkeit bei der Schadenserkennung als alle drei Generationen der Llama Guard-Modelle von Meta. Auch bei der Erkennung von Halluzinationen liegt es im Durchschnitt gleichauf mit den spezialisierten Halluzinationserkennungsmodellen WeCheck und MiniCheck.

Obwohl die Granite Guardian-Modelle von den entsprechenden Granite-Sprachmodellen abgeleitet sind, können sie zur Implementierung von Leitplanken neben allen offenen oder proprietären KI-Modellen verwendet werden.

Verfügbarkeit der Granite 3.0-Modelle

Die gesamte Suite der Granite 3.0 Modelle und die neuen Zeitreihenmodelle stehen auf HuggingFace unter der uneingeschränkten Apache 2.0 Lizenz zum Download bereit. Die Instruct-Varianten der neuen Granite 3.0 8B- und 2B-Sprachmodelle und die Granite Guardian 3.0 8B- und 2B-Modelle sind seit einer Woche für die kommerzielle Nutzung auf der watsonx-Plattform von IBM verfügbar. Eine Auswahl der Granite 3.0-Modelle wird auch als NVIDIA NIM Microservices und über die Vertex AI Model Garden-Integrationen von Google Cloud mit HuggingFace verfügbar sein.

Um Entwicklern eine größere Auswahl und eine einfachere Nutzung zu ermöglichen und lokale Edge-Implementierungen zu unterstützen, ist eine Auswahl der Granite 3.0-Modelle auch auf Ollama und Replicate verfügbar.

Die neueste Generation der Granite-Modelle erweitert den robusten Open-Source-Katalog der leistungsstarken LLMs von IBM. IBM hat mit Ökosystempartnern wie AWS, Docker, Domo, Qualcomm Technologies, Inc. über seinen Qualcomm AI Hub, Salesforce, SAP und anderen zusammengearbeitet, um eine Vielzahl von Granite-Modellen in die Angebote dieser Partner zu integrieren oder Granite-Modelle auf ihren Plattformen verfügbar zu machen, was Unternehmen auf der ganzen Welt eine größere Auswahl bietet.

Von Assistenten zu Agenten: die Zukunft der KI in Unternehmen realisieren

IBM treibt die KI in Unternehmen durch ein breites Spektrum an Technologien voran – von Modellen und Assistenten bis hin zu den Tools, die für die Abstimmung und den Einsatz von KI speziell für die Daten und Anwendungsfälle von Unternehmen erforderlich sind. Das Unternehmen ebnet auch den Weg für zukünftige KI-Agenten, die sich selbst steuern, reflektieren und komplexe Aufgaben in dynamischen Geschäftsumgebungen ausführen können.

Das IBM-Portfolio an KI-Assistententechnologien wird kontinuierlich weiterentwickelt – von watsonx Orchestrate, mit dem Unternehmen ihre eigenen Assistenten über Low-Code-Tools und Automatisierung erstellen können, bis hin zu einer breiten Palette an vorgefertigten Assistenten für spezifische Aufgaben und Bereiche wie Kundenservice, Personalwesen, Vertrieb und Marketing. Unternehmen auf der ganzen Welt haben watsonx Assistant genutzt, um KI-Assistenten für Aufgaben wie die Beantwortung von Routinefragen von Kunden und Kundinnen oder Mitarbeitenden, die Modernisierung ihrer Mainframes und älteren IT-Anwendungen, die Unterstützung von Studenten bei der Erkundung potenzieller Karrierewege oder die Bereitstellung digitaler Hypothekenunterstützung für Hauskäufer zu entwickeln.

Weiters wurde die nächste Generation von watsonx Code Assistant vorgestellt, die auf Granite-Code-Modellen basiert und allgemeine Unterstützung bei der Codierung in Sprachen wie C, C++, Go, Java und Python sowie erweiterte Funktionen zur Anwendungsmodernisierung für Enterprise-Java-Anwendungen bietet. Die Code-Funktionen von Granite sind jetzt auch über eine Visual Studio Code-Erweiterung, IBM Granite.Code, zugänglich.

Überdies sollen demnächst neue Tools veröffentlich werden, mit denen Entwicklern KI effizienter über watsonx.ai entwickeln, anpassen und einsetzen können – einschließlich agentenbasierter Frameworks, Integrationen in bestehende Umgebungen und Low-Code-Automatisierungen für gängige Anwendungsfälle wie RAG und Agenten.

IBM plant, bis 2025 weitere Agentenfunktionen für ihr gesamtes Portfolio zu entwickeln, einschließlich vorgefertigter Agenten für bestimmte Domänen und Anwendungsfälle.

Erweiterte KI-gestützte Bereitstellungsplattform unterstützen IBM Berater mit KI

IBM kündigt ferner eine bedeutende Erweiterung seiner KI-gestützten Lieferplattform IBM Consulting Advantage an. Die Multi-Modell-Plattform enthält KI-Agenten, -Anwendungen und -Methoden wie wiederholbare Frameworks, mit denen 160.000 IBM-Berater einen besseren und schnelleren Kundennutzen zu geringeren Kosten liefern können.

Ein weiterer wichtiger Bestandteil der Erweiterung ist die Einführung von IBM Consulting Advantage for Cloud Transformation and Management und IBM Consulting Advantage for Business Operations. Beide umfassen domänenspezifische KI-Agenten, -Anwendungen und -Methoden, die mit den Best Practices von IBM angereichert sind, so dass IBM-Berater Kunden dabei helfen können, Cloud- und KI-Transformationen bei Aufgaben wie Code-Modernisierung und Quality Engineering zu beschleunigen oder Abläufe in Bereichen wie Finanzen, HR und Beschaffung zu transformieren und durchzuführen.

Weitere Informationen über Granite und die IBM-Strategie für KI für Unternehmen erfahren Interessierte unter www.ibm.com/de-de/granite.