Qwen 3.6 Max ist das stärkste Modell von Alibaba
Die künstliche Intelligenz schlägt ihren Vorgänger deutlich. Besonders bei eigenständigen Agenten-Aufgaben belegen die Daten einen starken Fortschritt.

Das Entwicklerteam von Qwen präsentiert mit Qwen 3.6 Max eine frühe Vorschau auf sein stärkstes proprietäres KI-Modell. Die Vorabversion bringt deutliche Leistungssteigerungen bei komplexen Programmieraufgaben, dem Weltwissen und der präzisen Befehlsbefolgung.
Harte Zahlen bei Code und Wissen
Das Modell setzt neue Bestwerte in etablierten Leistungstests. Im Programmier-Benchmark SWE-bench Pro erreicht Qwen 3.6 Max einen Wert von 57.3. Bei Terminal-Bench 2.0 erzielt die künstliche Intelligenz einen Score von 65.4.
Damit übertrifft die neue Version den direkten Vorgänger Qwen 3.6 Plus deutlich. Besonders bei Aufgaben, die eigenständiges Handeln als KI-Agent erfordern, zeigen die Daten einen klaren Fortschritt. Im Test SkillsBench verzeichnet das Entwicklerteam einen Zuwachs auf insgesamt 55.6 Punkte.
Auch beim allgemeinen Weltwissen legt das System zu. Im Benchmark SuperGPQA steht am Ende ein Ergebnis von 73.9. Bei der exakten Befehlsbefolgung, gemessen im ToolcallFormatIFBench, landet das Modell bei 86.1 Punkten. Damit lässt Qwen 3.6 Max auch Konkurrenten wie Claude 4.5 Opus in mehreren Disziplinen hinter sich.
Beachten muss man allerdings, dass nicht mit dem aktuellen Opus 4.7 verglichen wird.
Quelle: Alibaba
Neuer Parameter für längere Kontextverarbeitung
Interessierte testen das KI-Modell direkt im Qwen Studio. Eine Integration über die Programmierschnittstelle im Alibaba Cloud Model Studio bereiten die Entwickler aktuell vor.
Mit der Veröffentlichung führt das Team den neuen API-Parameter »preserve_thinking« ein. Diese Funktion bewahrt die analytischen Gedankengänge der KI über sämtliche Chat-Runden hinweg. Entwickler nutzen dieses Feature, um komplexe Aufgabenstellungen über einen längeren Zeitraum stabil zu bearbeiten.
Die Entwicklung des Systems läuft während der aktuellen Vorschau-Phase kontinuierlich weiter. Zukünftige Updates sollen weitere Leistungsverbesserungen bringen.
