Ein Roboter zeigt Gemini 3.1 Pro

Googles neues Sprachmodell deklassiert die Konkurrenz

In aktuellen Benchmarks hängt Gemini 3.1 Pro die Modelle von OpenAI und Anthropic deutlich ab und setzt neue Standards.

Andreas Becker Nano Banana
Ein Roboter zeigt Gemini 3.1 Pro

Google verdrängt mit dem neuen Sprachmodell Gemini 3.1 Pro die Konkurrenten OpenAI und Anthropic von den Spitzenplätzen etablierter KI-Benchmarks. Das System ist gezielt auf komplexe Programmieraufgaben optimiert und liefert als unerwartetes Resultat deutlich weniger fehlerhafte Fakten, sogenannte Halluzinationen.

Anmerkung: Am 20.02 mit weiteren Informationen ergänzt.

Fokus auf abstrakte Problemlösung

Google positioniert das Modell gezielt für komplexe Anwendungsfälle. Die Software zieht nun deutlich präziser eigenständige logische Schlüsse. Sie strukturiert umfangreiche Datensätze besser und wandelt kreative Vorgaben direkter in funktionierenden Programmcode um.

Als Beispiel nennt der Konzern die Aufgabe, die literarische Stimmung eines Romans in eine moderne Web-Oberfläche zu übersetzen. Dies gelingt der KI laut Google nun ohne mühsame Zwischenschritte.

Diese neue Architektur bildet auch das Fundament für "Gemini 3 Deep Think". Google hatte diesen spezialisierten Ableger für die wissenschaftliche Forschung bereits in der Vorwoche vorgestellt. Nun fließen die technischen Fortschritte von Gemini 3.1 Pro auch in die regulären Produkte für Endkunden und Entwickler ein.

Anzeige

Gesamtperformance und weniger Halluzinationen

Im "Artificial Analysis Intelligence Index v4.0", der verschiedene Benchmarks bündelt, setzt sich Gemini 3.1 Pro mit 57 Punkten an die absolute Spitze. Damit verdrängt das Google-Modell Claude Opus 4.6 (53 Punkte) und Claude Sonnet 4.6 (51 Punkte) auf die nachfolgenden Plätze. Der Vorgänger Gemini 3 Pro landete in dieser Auswertung lediglich bei 48 Punkten.

Quelle: artificialanalysis

Gleichzeitig behebt Google die wohl größte Schwäche der Vorgängerversion. Beim "AA-Omniscience"-Test, der die Anfälligkeit für erfundene Fakten misst, reduziert Gemini 3.1 Pro die Halluzinationsrate auf 50 Prozent. Zum Vergleich: Gemini 3 Pro lag hier noch bei sehr hohen 88 Prozent. Das neue Modell agiert bei der Faktenwiedergabe somit auf einem deutlich verlässlicheren Niveau und schließt zur Spitzengruppe auf.

Quelle: artificialanalysis

Leistungssprung in den Benchmarks

Die technischen Fortschritte spiegeln sich deutlich in aktuellen Leistungstests wider. Beim anspruchsvollen Benchmark "ARC-AGI-2", der die Fähigkeit zur Lösung völlig neuer Logikmuster bewertet, erreicht Gemini 3.1 Pro einen Wert von 77,1 Prozent. Damit verdoppelt das Modell das Ergebnis des Vorgängers Gemini 3 Pro (31,1 Prozent) und verweist Konkurrenten wie Opus 4.6 (68,8 Prozent) sowie GPT-5.2 (52,9 Prozent) auf die hinteren Plätze.

Ähnlich dominant zeigt sich die KI beim Test "Humanity's Last Exam" für akademisches Denken, wo sie ohne zusätzliche Hilfsmittel 44,4 Prozent erzielt und damit sowohl das eigene Vorgängermodell als auch die Top-Modelle der Mitbewerber übertrifft.

Auch bei der Code-Generierung und der autonomen Websuche verzeichnet Google messbare Zuwächse. Im Bereich des kompetitiven Programmierens ("LiveCodeBench Pro") steigert sich Gemini 3.1 Pro auf ein Elo-Rating von 2887 und lässt GPT-5.2 (2393) deutlich hinter sich. Bei autonomen Suchaufgaben ("BrowseComp") erreicht das neue Modell 85,9 Prozent und schlägt Opus 4.6 (84,0 Prozent) knapp.

Lediglich beim "SWE-Bench Verified" für agentenbasiertes Programmieren ordnet sich die Google-KI mit 80,6 Prozent minimal hinter Opus 4.6 (80,8 Prozent) ein, verbessert sich aber spürbar gegenüber der Version 3 Pro.

Quelle: Google

Preise und Verfügbarkeit

Trotz der gestiegenen Leistung hält Google die Kosten stabil. Die Preise für die API-Nutzung bleiben identisch zum Vorgänger Gemini 3 Pro. Für Eingaben bei einer Kontextlänge von bis zu 200.000 Token berechnet Google zwei US-Dollar pro Million Token, die entsprechende Ausgabe kostet zwölf US-Dollar.

Quelle: openrouter

Entwickler greifen ab sofort über das Google AI Studio und Vertex AI auf Gemini zu.

Privatnutzer erhalten ebenfalls Zugang, sofern sie ein kostenpflichtiges Abonnement besitzen. Gemini 3.1 Pro wird aktuell mit höheren Nutzungslimits in der Gemini-App sowie in NotebookLM für Kunden der Tarife Google AI Pro und Ultra ausgerollt.

Anzeige

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.