Ein Alibaba Baer

Qwen 3.6 Max ist das stärkste Modell von Alibaba

Die künstliche Intelligenz schlägt ihren Vorgänger deutlich. Besonders bei eigenständigen Agenten-Aufgaben belegen die Daten einen starken Fortschritt.

Andreas Becker Nano Banana
Ein Alibaba Baer

Das Entwicklerteam von Qwen präsentiert mit Qwen 3.6 Max eine frühe Vorschau auf sein stärkstes proprietäres KI-Modell. Die Vorabversion bringt deutliche Leistungssteigerungen bei komplexen Programmieraufgaben, dem Weltwissen und der präzisen Befehlsbefolgung.

Harte Zahlen bei Code und Wissen

Das Modell setzt neue Bestwerte in etablierten Leistungstests. Im Programmier-Benchmark SWE-bench Pro erreicht Qwen 3.6 Max einen Wert von 57.3. Bei Terminal-Bench 2.0 erzielt die künstliche Intelligenz einen Score von 65.4.

Damit übertrifft die neue Version den direkten Vorgänger Qwen 3.6 Plus deutlich. Besonders bei Aufgaben, die eigenständiges Handeln als KI-Agent erfordern, zeigen die Daten einen klaren Fortschritt. Im Test SkillsBench verzeichnet das Entwicklerteam einen Zuwachs auf insgesamt 55.6 Punkte.

Auch beim allgemeinen Weltwissen legt das System zu. Im Benchmark SuperGPQA steht am Ende ein Ergebnis von 73.9. Bei der exakten Befehlsbefolgung, gemessen im ToolcallFormatIFBench, landet das Modell bei 86.1 Punkten. Damit lässt Qwen 3.6 Max auch Konkurrenten wie Claude 4.5 Opus in mehreren Disziplinen hinter sich.

Beachten muss man allerdings, dass nicht mit dem aktuellen Opus 4.7 verglichen wird.

Quelle: Alibaba

Neuer Parameter für längere Kontextverarbeitung

Interessierte testen das KI-Modell direkt im Qwen Studio. Eine Integration über die Programmierschnittstelle im Alibaba Cloud Model Studio bereiten die Entwickler aktuell vor.

Mit der Veröffentlichung führt das Team den neuen API-Parameter »preserve_thinking« ein. Diese Funktion bewahrt die analytischen Gedankengänge der KI über sämtliche Chat-Runden hinweg. Entwickler nutzen dieses Feature, um komplexe Aufgabenstellungen über einen längeren Zeitraum stabil zu bearbeiten.

Die Entwicklung des Systems läuft während der aktuellen Vorschau-Phase kontinuierlich weiter. Zukünftige Updates sollen weitere Leistungsverbesserungen bringen.

Anzeige

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.