Mit Qwen3-Coder präsentiert Alibaba sein bislang leistungsstärkstes KI-Modell zur Unterstützung komplexer Softwareentwicklung. Das Open-Source-Modell basiert auf einer MoE-Architektur mit 480 Milliarden Parametern und glänzt in Benchmarks mit Top-Ergebnissen. [...]
Alibaba hat mit Qwen3-Coder sein bislang fortschrittlichstes KI-Modell für agentenbasierte Programmierung vorgestellt. Entwickelt für hochperformante Softwareentwicklung, überzeugt Qwen3-Coder durch seine Stärken in der Code-Generierung, der Steuerung komplexer Coding-Workflows und der automatisierten Fehlerbehebung in umfangreichen Codebasen.
Das Open-Source-Modell Qwen3-Coder-480B-A35B-Instruct basiert auf einer Mixture-of-Experts-Architektur (MoE) mit insgesamt 480 Milliarden Parametern, von denen bei der Verarbeitung jeweils 35 Milliarden pro Token aktiv genutzt werden. In standardisierten Benchmarks für agentenbasierte Programmierung, Browser-Interaktionen und die Nutzung externer Tools erzielt das Modell Ergebnisse auf dem Niveau führender State-of-the-Art-Modelle (SOTA-Modellen).
Qwen3-Coder-480B-A35B-Instruct liefert starke Ergebnisse in zentralen Benchmarks
Ergänzend veröffentlicht Alibaba das Open-Source-Tool Qwen Code, eine leistungsfähige Command-Line-Interface-Lösung (CLI), mit der Entwickler Engineering-Aufgaben per natürlicher Sprache an die KI delegieren können. Durch speziell abgestimmte Prompts und Interaktionsprotokolle erschließt Qwen Code das volle Potenzial von Qwen3-Coder für den praktischen Einsatz in der agentenbasierten Entwicklung. Zudem unterstützt das Modell die Integration mit dem Claude-Code-Interface, was die Umsetzung von Programmieraufgaben für Entwickler zusätzlich erleichtert.
Qwen3-Coder wurde auf einem umfangreichen Datensatz trainiert, bestehend aus Quellcode und allgemeinem Textmaterial. Das Modell unterstützt standardmäßig ein Kontextfenster von 256.000 Tokens, das auf bis zu 1 Million Tokens erweiterbar ist – ideal für die Analyse und Bearbeitung großer Codebasen in einer einzigen Sitzung.
Die Leistungsfähigkeit des Modells ergibt sich nicht nur aus seiner Skalierung in Bezug auf Tokenanzahl, Kontextlänge und synthetische Trainingsdaten. Entscheidend sind auch fortschrittliche Verfahren im Post-Training, darunter das Long-Horizon Reinforcement Learning (Agent RL). Diese Technik ermöglicht es dem Modell, reale Softwareprobleme über mehrstufige Interaktionen mit externen Tools zu lösen. In der Folge erreicht Qwen3-Coder eine SOTA-Performance unter allen Open-Source-Modellen im Benchmark „SWE-Bench Verified“, der die Fähigkeit von KI-Systemen zur Lösung realer Softwarefehler bewertet – ganz ohne zusätzliche Optimierung in der Test- oder Inferenzphase.
Agentenbasierte KI transformiert die Programmierung
Agentenbasierte KI-Modelle wie Qwen3-Coder verändern die Softwareentwicklung grundlegend: Sie ermöglichen automatisiertere, effizientere und zugänglichere Programmierprozesse. Mit seiner Open-Source-Verfügbarkeit, den ausgeprägten agentenbasierten Fähigkeiten und der Kompatibilität mit gängigen Entwicklungswerkzeugen positioniert sich Qwen3-Coder als wertvolle Ressource für Entwickler weltweit.
Das Modell Qwen3-Coder-480B-A35B-Instruct ist ab sofort auf Hugging Face und GitHub verfügbar. Entwickler können zudem über Qwen Chat oder über kosteneffiziente APIs in Model Studio, der generativen KI-Entwicklungsplattform von Alibaba, auf das Modell zugreifen.
Qwen-basierte Programmiermodelle wurden bereits über 20 Millionen Mal weltweit heruntergeladen. Auch Tongyi Lingma, der KI-Coding-Assistent von Alibaba Cloud auf Basis von Qwen, wird demnächst mit den erweiterten agentenbasierten Funktionen von Qwen3-Coder aufgerüstet. Seit seiner Einführung im Juni 2024 hat das Feature „AI Programmer“ – mit Funktionen wie Code-Vervollständigung, Optimierung, Debugging-Hilfe, Snippet-Suche und automatisierter Erstellung von Unit Tests – bereits mehr als 3 Milliarden Codezeilen generiert.

Be the first to comment