Ein Flash Programmierer bei Google

Gemini 3.5 Flash schlägt 3.1 Pro

Das Modell ist nicht nur stärker, sondern mit 289 Token pro Sekunde auch unglaublich schnell.

Andreas Becker GPT-Images-2.0
Ein Flash Programmierer bei Google

Google hat heute das neue KI-Modell Gemini 3.5 Flash für alle Nutzer veröffentlicht. Die Architektur übertrifft das bisherige Modell Gemini 3.1 Pro spürbar und liefert Ergebnisse in einer bisher unerreichten Geschwindigkeit.

Enorme Ausgabegeschwindigkeit

Ein zentraler Aspekt der Neuentwicklung ist das extrem hohe Tempo bei der Textgenerierung. Laut den veröffentlichten Benchmarks erreicht Gemini 3.5 Flash eine Ausgabegeschwindigkeit von beachtlichen 289 Token pro Sekunde.

Damit verarbeitet das KI-Modell Informationen mehr als viermal so schnell wie vergleichbare Konkurrenzprodukte. Claude Opus 4.7 und GPT-5.5 landen hier bei lediglich 67 beziehungsweise 71 Token pro Sekunde.

Auch der direkte Vorgänger Gemini 3.1 Pro fällt mit 135 Token pro Sekunde deutlich zurück. Diese Schnelligkeit beschleunigt besonders rechenintensive Prozesse im Alltag der Anwender.

Quelle: Google

Benchmarks belegen den Leistungssprung

Die offiziellen Benchmarks zeigen spürbare Verbesserungen in fast allen relevanten Anwendungsbereichen. Besonders bei komplexen Programmieraufgaben und der automatisierten Nutzung von Tools schneidet die neue Version hervorragend ab.

Im Terminal-Bench 2.1 für Code-Generierung erzielt das KI-Modell einen Wert von 76,2 Prozent. Bei agentenbasierten Arbeitsabläufen klettert das Ergebnis im MCP Atlas auf 83,6 Prozent.

Gleichzeitig verzeichnet das Modell bei realen Expertenaufgaben einen deutlichen Anstieg. Der sogenannte GDPval-AA Elo-Wert steigt auf 1656 Punkte und distanziert Gemini 3.1 Pro damit klar.

Quelle: Google

Grenzen bei Logik und Ausblick

Trotz der starken Leistung decken die Tabellen weiterhin Schwachstellen auf. Bei rein akademischen Logikrätseln wie dem ARC-AGI-2 schneidet das ältere Gemini 3.1 Pro mit 77,1 Prozent besser ab als der Neuling mit 72,1 Prozent.

Auch bei der Verarbeitung von extrem langen Kontexten behält die alte Pro-Variante die Nase vorn. Im MRCR v2 Benchmark erreicht Flash 77,3 Prozent, während die Vorgängergeneration starke 84,9 Prozent liefert.

Google adressiert genau diese anspruchsvollen Logikaufgaben bereits in wenigen Wochen. Das leistungsstärkere Modell Gemini 3.5 Pro erscheint im nächsten Monat.

Anzeige

KI-Wissen mit menschlicher Note

Wir arbeiten wie die großen Magazine: KI-gestützt, aber jeder Text wird von echten Menschen geprüft und optimiert. Was uns unterscheidet? Bei uns gibt es keine Paywall!

Jeder Beitrag zählt – auch das Teilen.