Gemini 3 Benchmark Leak
In Canva und Cursor bereits verfügbar und in Benchmarks deutlich vor GPT-5.1!

Google holt zum Gegenschlag aus. Ohne große Ankündigung tauchte das neue Modell Gemini 3 heute Morgen in den Auswahlmenüs von Cursor und Canva auf. Parallel veröffentlichte Daten zeigen einen massiven Vorsprung gegenüber den erst kürzlich erschienenen Modellen GPT-5.1 und Claude Sonnet 4.5. Der Preis scheint trotzdem nur sehr leicht zu steigen im Gegensatz zu Gemini 2.5 Pro. Ein offizieller Release dürfte noch heute erfolgen.
Lautloser Start in Produktiv-Tools
Die Verfügbarkeit in Software wie dem Code-Editor Cursor ist kein Versehen mehr. Nutzer wählen das Modell dort bereits regulär aus und arbeiten damit. Dieser Schritt deutet auf eine sofortige Verfügbarkeit hin, womit Google direkt auf die jüngsten Veröffentlichungen von OpenAI und Anthropic reagiert. Die begleitenden Benchmark-Werte untermauern diesen Anspruch eindrucksvoll.
In der Tabelle vergleicht sich Gemini 3 Pro direkt mit den aktuellen Marktführern GPT-5.1 und Claude Sonnet 4.5. Die Ergebnisse zeichnen ein klares Bild. Google hat die Zeit genutzt und zieht in fast allen Disziplinen deutlich an der Konkurrenz vorbei. Besonders in Bereichen, in denen GPT-5.1 zuletzt Standards setzte, legt Gemini 3 noch eine Schippe drauf.
Quelle: Leak
Quantensprung in Mathematik und Logik
Der Blick auf die "Hard Skills" überrascht selbst Experten. Im Test "Humanity's Last Exam", der akademisches Schlussfolgern auf höchstem Niveau prüft, erreicht Gemini 3 Pro 37,5 Prozent. Das etablierte GPT-5.1 kommt hier auf 26,5 Prozent, während Sonnet 4.5 weit abgeschlagen liegt. Noch extremer fällt der Unterschied in der "MathArena Apex" aus.
Dieser Benchmark enthält extrem schwierige Wettbewerbsmathematik. Während GPT-5.1 und Sonnet 4.5 hier mit Werten um die 1 Prozent fast vollständig versagen, erzielt Gemini 3 Pro 23,4 Prozent. Das ist kein kleiner Zuwachs, sondern eine völlig neue Leistungsklasse. Offenbar hat Google einen Weg gefunden, komplexe logische Ketten stabil zu halten, wo andere Modelle halluzinieren oder abbrechen.
Quelle: Google AI Studio - Preise leicht höher als bei Gemini 2.5
Der neue König der Agenten
Auch bei der eigenständigen Aufgabenbearbeitung dominiert das neue Modell. Der "Vending-Bench 2" simuliert langwierige Agenten-Aufgaben und bewertet das Ergebnis in einem fiktiven Geldwert. Gemini 3 Pro erwirtschaftet hier im Schnitt 5.478 Dollar. Zum Vergleich: GPT-5.1 schafft lediglich 1.473 Dollar. Das zeigt eine enorm verbesserte Handlungsplanung über lange Zeiträume hinweg.
Für Softwareentwickler liefert der "LiveCodeBench Pro" die entscheidende Kennzahl. Mit einem Elo-Rating von 2.439 verweist Google das OpenAI-Modell (2.243 Elo) auf den zweiten Platz. Die Kombination aus mathematischer Präzision und Coding-Kompetenz macht Gemini 3 zum derzeit mächtigsten Werkzeug am Markt. Google scheint damit die Führung im KI-Rennen am heutigen Tag vorerst zurückerobert zu haben.

