MiniMax M3: Günstiger und besser als die US-Konkurrenz?

Das neue KI-Modell M3 überzeugt bei der Programmierung. Ein riesiges Kontextfenster und kluge Agenten-Funktionen setzen neue Maßstäbe.

Andreas Becker01.06.26 GPT-Images-2.0

Kurzfassung Quellen

MiniMax hat das neue KI-Modell M3 veröffentlicht, das besonders auf komplexe Programmieraufgaben und autonome Agenten-Funktionen spezialisiert ist.
Eine neu entwickelte Architektur ermöglicht ein extrem großes Kontextfenster von einer Million Token bei gleichzeitig deutlich reduziertem Rechenaufwand.
Das System verarbeitet Text, Bilder sowie Videos nativ und kann sogar eigenständig Desktop-Anwendungen bedienen.
Entwickler können das Modell über eine API oder verschiedene Abonnement-Pläne ab 20 US-Dollar im Monat nutzen.

Das KI-Unternehmen MiniMax hat heute das neue Modell M3 veröffentlicht. Das System kombiniert umfangreiche Programmierfähigkeiten, native Multimodalität und ein Kontextfenster von einer Million Token. Das Modell konkurriert damit direkt mit den leistungsstärksten Modellen wie GPT-5.5 und Gemini 3.1 Pro.

Fokus auf autonome Programmieraufgaben

MiniMax M3 legt den Schwerpunkt auf die Softwareentwicklung und den Einsatz als eigenständiger Agent. Das Modell generiert nicht nur einfachen Programmcode, sondern bewältigt langfristige Projektaufgaben. Dabei orientiert sich das System stark an der realen Arbeitsweise von Programmierern. Es kann Anforderungen klären, Lösungswege diskutieren und Arbeitsaufträge während eines Projekts dynamisch anpassen.

In verschiedenen Leistungstests liefert das System überdurchschnittliche Resultate. Beim Benchmark SWE-Bench Pro, der die Programmierfähigkeiten misst, erreicht MiniMax M3 einen Wert von 59,0 Prozent. Damit lässt es die Modelle GPT-5.5 und Gemini 3.1 Pro hinter sich. Einzig Opus 4.7 ist noch stärker. Beim Test Terminal-Bench 2.1 sichert sich das neue Modell mit 66,0 Prozent ebenfalls einen guten Platz. Opus 4.7 erreicht hier fast identische 66.1 Prozent, GPT-5.5 allerdings starke 78.2 Prozent.

Quelle: MiniMax

Komplexe Praxistests und Optimierungen

Die Entwickler haben das Modell mehreren Härtetests unterzogen. Bei der Optimierung einer CUDA-Komponente für spezielle Nvidia-Grafikkarten arbeitete das System rund 24 Stunden völlig selbstständig. Das Modell startete lediglich mit einer Aufgabenbeschreibung und ohne eine funktionierende Referenzlösung.

In dieser Zeit führte das Programm 147 Leistungstests und knapp 2.000 interne Funktionsaufrufe durch. Im Gegensatz zu anderen Modellen, die solche Versuche frühzeitig abbrechen, suchte MiniMax M3 beharrlich nach neuen Lösungsansätzen. Am Ende steigerte das System die Hardware-Auslastung von ursprünglich 7,6 Prozent auf 71,3 Prozent. Das entspricht einer mehr als neunfachen Geschwindigkeitssteigerung.

Auch beim Training eigener kleiner Modelle über den PostTrainBench zeigte das System seine Stärken. Das Modell steuerte den Vorgang von der Datensynthese über das Training bis hin zur Auswertung komplett autark. Das System erreichte dabei einen Wert von 0,37 Punkten und positionierte sich dicht hinter Opus 4.7 und GPT-5.5.

Quelle: MiniMax

Effizienz durch veränderte Architektur

Ein entscheidendes technisches Merkmal von MiniMax M3 ist die sogenannte MiniMax Sparse Attention Architektur, kurz MSA. Diese Technik stellt den reibungslosen Umgang mit dem riesigen Kontextfenster von einer Million Token sicher. Bei älteren Architekturen stieg der Rechenaufwand mit wachsender Textlänge überproportional an.

MSA teilt die eingehenden Daten sehr präzise in einzelne Blöcke auf. Das System liest jeden Block nur ein einziges Mal. Dadurch sinkt der Rechenaufwand laut Angaben der Entwickler enorm. Bei voller Auslastung des Kontextfensters benötigt das Modell nur ein Zwanzigstel der Rechenleistung im Vergleich zur Vorgängerversion. Das sorgt für eine deutlich beschleunigte Verarbeitung von großen Datenmengen in der Praxis.

Quelle: MiniMax

Bild, Video und Desktop-Steuerung

Das System lernt von Beginn an mit gemischten Datensätzen. Diese native Multimodalität sorgt dafür, dass das Modell Bilder, Videos und Texte tiefgreifend miteinander verknüpft. Im OmniDocBench-Test, der genau diese Kombination prüft, erzielt MiniMax M3 bessere Werte als der Konkurrent Gemini 3.1 Pro.

Das Modell verarbeitet zudem hochgeladene Videodateien und analysiert Grafiken in wissenschaftlichen Publikationen. Eine weitere Besonderheit ist die Fähigkeit, einen Computer-Desktop zu bedienen. Das System kann Programme öffnen, Dateien verschieben oder Excel-Tabellen auslesen. Diese visuelle Steuerung ermöglicht den unkomplizierten Einsatz als digitaler Assistent bzw. KI-Agent für herkömmliche Büroaufgaben.

Das klappt übrigens ähnlich wie bei Computer Use von OpenAI jetzt auch per Smartphone.

Veröffentlichung und Preisgestaltung

Nutzer greifen entweder über die Chatoberfläche oder über die API auf das Modell zu. Die Kosten belaufen sich dabei auf 2,40$ pro 1M Output Token. Bei sehr großen Kontextfenstern ab 512.000 Token verdoppelt sich dieser Preis auf 4,80$. Für die ersten sieben Tage gewährt der Hersteller einen Rabatt von 50 Prozent auf das kleinere Kontextfenster.