Gemini 3.5 Flash schlägt 3.1 Pro

Das Modell ist nicht nur stärker, sondern mit 289 Token pro Sekunde auch unglaublich schnell.

Andreas Becker19.05.26 GPT-Images-2.0

Kurzfassung Quellen

Google zeigt detaillierte Benchmark-Ergebnisse für das KI-Modell Gemini 3.5 Flash.
Besonders beim Programmieren und bei autonomen Arbeitsabläufen übertrifft die Neuerscheinung den Vorgänger deutlich.
Das ältere Gemini 3.1 Pro behält jedoch bei abstrakter Logik und langen Kontexten knapp die Führung.
Für höchste Ansprüche erscheint bereits im kommenden Monat das neue Flaggschiff Gemini 3.5 Pro.

Google hat heute das neue KI-Modell Gemini 3.5 Flash für alle Nutzer veröffentlicht. Die Architektur übertrifft das bisherige Modell Gemini 3.1 Pro spürbar und liefert Ergebnisse in einer bisher unerreichten Geschwindigkeit.

Enorme Ausgabegeschwindigkeit

Ein zentraler Aspekt der Neuentwicklung ist das extrem hohe Tempo bei der Textgenerierung. Laut den veröffentlichten Benchmarks erreicht Gemini 3.5 Flash eine Ausgabegeschwindigkeit von beachtlichen 289 Token pro Sekunde.

Damit verarbeitet das KI-Modell Informationen mehr als viermal so schnell wie vergleichbare Konkurrenzprodukte. Claude Opus 4.7 und GPT-5.5 landen hier bei lediglich 67 beziehungsweise 71 Token pro Sekunde.

Auch der direkte Vorgänger Gemini 3.1 Pro fällt mit 135 Token pro Sekunde deutlich zurück. Diese Schnelligkeit beschleunigt besonders rechenintensive Prozesse im Alltag der Anwender.

Quelle: Google

Benchmarks belegen den Leistungssprung

Die offiziellen Benchmarks zeigen spürbare Verbesserungen in fast allen relevanten Anwendungsbereichen. Besonders bei komplexen Programmieraufgaben und der automatisierten Nutzung von Tools schneidet die neue Version hervorragend ab.

Im Terminal-Bench 2.1 für Code-Generierung erzielt das KI-Modell einen Wert von 76,2 Prozent. Bei agentenbasierten Arbeitsabläufen klettert das Ergebnis im MCP Atlas auf 83,6 Prozent.

Gleichzeitig verzeichnet das Modell bei realen Expertenaufgaben einen deutlichen Anstieg. Der sogenannte GDPval-AA Elo-Wert steigt auf 1656 Punkte und distanziert Gemini 3.1 Pro damit klar.

Quelle: Google

Grenzen bei Logik und Ausblick

Trotz der starken Leistung decken die Tabellen weiterhin Schwachstellen auf. Bei rein akademischen Logikrätseln wie dem ARC-AGI-2 schneidet das ältere Gemini 3.1 Pro mit 77,1 Prozent besser ab als der Neuling mit 72,1 Prozent.

Auch bei der Verarbeitung von extrem langen Kontexten behält die alte Pro-Variante die Nase vorn. Im MRCR v2 Benchmark erreicht Flash 77,3 Prozent, während die Vorgängergeneration starke 84,9 Prozent liefert.

Google adressiert genau diese anspruchsvollen Logikaufgaben bereits in wenigen Wochen. Das leistungsstärkere Modell Gemini 3.5 Pro erscheint im nächsten Monat.