Kimi 2.6 ist das beste Open Weight Modell

Die neue Architektur überzeugt durch enorme Ausdauer beim Programmieren und effiziente Agenten-Schwärme.

Andreas Becker21.04.26 Nano Banana

Kurzfassung Quellen

Moonshot AI veröffentlicht mit Kimi K2.6 ein neues Open-Weights-Modell, das weltweit den vierten Platz im Intelligence Index belegt.
Besondere Stärken zeigt das System beim autonomen Programmieren, wo es Code-Basen über 13 Stunden hinweg fehlerfrei optimieren kann.
Eine verbesserte Architektur ermöglicht zudem die parallele Steuerung von bis zu 300 Sub-Agenten für komplexe Workflows.
Trotz einer extrem niedrigen Halluzinationsrate weisen Experten auf einen sehr hohen Bedarf an Reasoning-Token hin.

Das neue Open-Weights-Modell Kimi K2.6 tritt an, um etablierte geschlossene Systeme herauszufordern. Mit starken Werten bei komplexen Programmieraufgaben und autonomen Agenten-Workflows positioniert sich die Veröffentlichung direkt hinter den Branchenführern von OpenAI, Google und Anthropic.

Technische Basis und Programmierfähigkeiten

Unter der Haube arbeitet eine Mixture-of-Experts-Architektur. Insgesamt verfügt das Modell über eine Billion Parameter, von denen 32 Milliarden bei einer Anfrage aktiv sind. Entwickler greifen auf ein langes Kontextfenster von 256.000 Token zurück. Zudem verarbeitet das System neben Text auch Bilder und Videos nativ.

In internen wie externen Programmier-Benchmarks erzielt die KI starke Ergebnisse. Bei der Evaluierung SWE-Bench Pro erreicht das System einen Wert von 58,6 Prozent. Im Terminal-Bench 2.0 stehen 66,7 Prozent zu Buche. Damit schließt die quelloffene Variante spürbar zur geschlossenen Konkurrenz auf.

Quelle: kimi

Autonome Abläufe über viele Stunden

Eine besondere Neuerung betrifft Aufgaben, die einen langen Atem erfordern. Sogenanntes Long-Horizon Coding erlaubt es dem Modell, über viele Stunden hinweg eigenständig an Projekten zu arbeiten. Entwickler können dem System beispielsweise die Optimierung veralteter Code-Basen überlassen. Dabei bewältigt die KI tausende Werkzeugaufrufe fehlerfrei.

Ein Praxistest belegt das Potenzial dieser Ausdauer eindrucksvoll. Das Modell überarbeitete autonom eine acht Jahre alte Open-Source-Finanzsoftware. Über einen Zeitraum von 13 Stunden führte Kimi K2.6 mehr als tausend Werkzeugaufrufe durch und passte 4.000 Codezeilen präzise an. Das Resultat war eine Steigerung des Datendurchsatzes um mehr als das Doppelte.

Auch bei Nischen-Sprachen wie Zig zeigt das System eine zuverlässige Generalisierung. Bei der lokalen Bereitstellung eines Sprachmodells auf einem Mac verbesserte Kimi K2.6 die Verarbeitungsgeschwindigkeit signifikant. Solche komplexen Eingriffe demonstrieren ein tiefes Verständnis für Systemarchitekturen und Leistungsengpässe.

Koordinierte Schwärme und externe Evaluierung

Einzelne Prompts genügen dem System, um ganze Netzwerke aus Sub-Agenten zu erschaffen. Diese Agent-Swarm-Architektur zerlegt große Aufgaben dynamisch in kleine Teilbereiche. Bis zu 300 spezialisierte Agenten arbeiten anschließend parallel an der Lösung komplexer Probleme. Dabei führen sie bis zu 4.000 koordinierte Schritte gleichzeitig aus.

Unabhängige Auswertungen des Dienstes Artificial Analysis ordnen den technischen Sprung ein. Im entsprechenden Intelligence Index erobert die Neuerscheinung den vierten Platz weltweit. Lediglich die geschlossenen Modelle der Branchenführer liegen noch knapp davor. Eine geringe Halluzinationsrate von 39 Prozent sichert dabei zuverlässige Antworten. Bei Unsicherheit verweigert die KI lieber die Aussage, anstatt Fakten zu erfinden.

Quelle: artificialanalysis

Diese Leistungsfähigkeit fordert jedoch hohe Ressourcen. Für komplexe Argumentationsketten nutzt die Architektur rund 160 Millionen Reasoning-Token. Das liegt leider auch im Bereich der Top-Modelle.

Quelle: artificialanalysis

Erste Fachexperten bewerten das Open-Weights-Modell als solide, verweisen jedoch auf Schwächen. Der KI-Forscher Ethan Mollick urteilt: »Basierend auf dem Gefühl scheint der Abstand zwischen geschlossenen und offenen Spitzenmodellen ungefähr derselbe zu sein wie eh und je.«

Twitter Beitrag - Cookies links unten aktivieren.

Kimi 2.6 Thinking seems very good for an open weights model, but many rough edges compared to closed SoTA.

The Lem Test resulted in a 74 page thinking trace... and an okay-ish answer.

It did an okay TiKZ unicorn, an adequate twigl shader for a neogothic city in the waves, etc. pic.twitter.com/aO14euf0Dw
— Ethan Mollick (@emollick) April 21, 2026

Proaktive Agenten und Benutzeroberflächen

Neben Backend-Optimierungen meistert das Modell auch die Erstellung sichtbarer Strukturen. Aus simplen Textvorgaben generiert Kimi K2.6 vollständige Front-End-Layouts für Webseiten. Die Entwürfe beinhalten ästhetische Designentscheidungen, interaktive Elemente und komplexe Scroll-Animationen. Dank der nativen Bild- und Videofunktionen bindet das System passende Medien direkt in das Layout ein.

Quelle: kimi

Zukünftig sollen Menschen und KI in sogenannten Claw Groups noch enger verzahnt arbeiten. In dieser Struktur fungiert das Modell als adaptiver Koordinator zwischen verschiedenen menschlichen und maschinellen Akteuren. Stockt ein Prozess bei einem Sub-Agenten, erkennt das System die Unterbrechung. Es verteilt die Aufgabe um oder formuliert das Zwischenziel neu.

Proaktive Agenten laufen dabei kontinuierlich im Hintergrund. Ein Testlauf im Bereich der Systemüberwachung dauerte fünf volle Tage an. Ohne menschliches Eingreifen bearbeitete die KI eingehende Fehlermeldungen, überwachte Metriken und löste Systemwarnungen eigenständig auf. Diese dauerhafte Zuverlässigkeit markiert einen wichtigen Schritt für offene KI-Architekturen.