Ein eleganter Panther ist effizient unterwegs

98 % günstiger als der Vorgänger

xAI stellt Grok 4 Fast vor und will damit die hohen Kosten für Spitzen-KI radikal senken – bei fast identischer Leistung.

Kurzfassung | Andreas Becker, 21.09.25

gpt-image-1 | All-AI.de

EINLEITUNG

Das KI-Wettrüsten geht in die nächste Runde, doch diesmal stehen nicht nur reine Leistungsdaten im Fokus. Mit Grok 4 Fast schickt xAI, das Unternehmen von Elon Musk, ein neues Sprachmodell ins Rennen, das bei nahezu gleicher Performance wie das bisherige Spitzenmodell Grok 4 eine drastisch höhere Effizienz verspricht. Dieser Schritt zielt direkt auf die hohen Betriebskosten ab, die eines der größten Hemmnisse für den breiten Einsatz von Spitzen-KI darstellen.

NEWS

Gleiche Leistung, deutlich geringere Kosten

Der Kern der Neuerung liegt in einer optimierten Architektur. Grok 4 Fast benötigt für vergleichbare Ergebnisse im Schnitt 40 Prozent weniger sogenannte "Thinking Tokens" als sein Vorgänger. Diese Reduzierung des Rechenaufwands schlägt sich direkt in den Kosten nieder, die laut xAI um bis zu 98 Prozent sinken können. Möglich wird dies durch ein hybrides Design, das einfache Anfragen und komplexe Denkprozesse in einem einzigen Modell vereint, anstatt wie bisher zwischen unterschiedlichen Modellen zu wechseln.

In etablierten Benchmarks wie GPQA Diamond oder AIME 2025 muss sich das neue Modell nicht verstecken und liegt auf einem ähnlichen Niveau wie Grok 4. Besonders hervorzuheben ist jedoch die Fähigkeit des Modells, eigenständig auf externe Werkzeuge wie einen Webbrowser oder eine Code-Ausführungsumgebung zuzugreifen. Diese "Agenten-Fähigkeiten" wurden gezielt trainiert und führen dazu, dass Grok 4 Fast in spezialisierten Benchmarks, die solche Aufgaben bewerten, sogar besser abschneidet als sein Vorgänger und Konkurrenten wie OpenAIs Websuche-Modell.

Quelle: xAI

Neue Architektur und Fokus auf praktische Anwendung

Im Gegensatz zu früheren Versionen, die auf getrennte Modelle für einfache und komplexe Aufgaben setzten, integriert Grok 4 Fast beide Fähigkeiten in einer einzigen Architektur. Das Verhalten des Modells wird dabei über den System-Prompt gesteuert, was die Latenz und die Kosten für Entwickler reduziert. xAI stellt das Modell über seine API in zwei Varianten bereit, die beide auf ein beeindruckendes Kontextfenster von zwei Millionen Token zugreifen können.

Die aggressive Preisgestaltung, die je nach Nutzung bei nur 0,20 US-Dollar pro einer Million Input-Token startet, unterstreicht die Strategie von xAI. Das Unternehmen will nicht nur in den Leistungs-Benchmarks an der Spitze mitspielen, sondern KI auch für anspruchsvolle, hochfrequente Aufgaben wie Websuchen und interaktive Agenten wirtschaftlich attraktiv machen. Mit der Veröffentlichung auf Plattformen wie OpenRouter und Vercel wird zudem die Zugänglichkeit für Entwickler weiter erhöht.

MITMACHEN

KURZFASSUNG

xAI hat Grok 4 Fast vorgestellt, ein neues KI-Modell, das die Leistung von Grok 4 bei deutlich geringeren Kosten bietet.
Durch eine optimierte Architektur sinkt der Rechenaufwand um 40%, was die Kosten pro Aufgabe um bis zu 98% reduzieren kann.
Das Modell wurde speziell für die Nutzung von Tools wie der Websuche trainiert und übertrifft hier sogar Konkurrenten.
Grok 4 Fast verfügt über ein Kontextfenster von 2 Millionen Token und eine neue hybride Architektur, die es effizienter macht.