GPT-5.4 im Detail: OpenAI vereint Coding und Computersteuerung

Das neue Sprachmodell verarbeitet bis zu eine Million Token und löst Aufgaben durch ein sichtbares Reasoning-System.

Andreas Becker05.03.26 Nano Banana

Kurzfassung Quellen

OpenAI veröffentlicht GPT-5.4, das erstmals logisches Denken, Programmieren und Computersteuerung in einem Modell vereint.
Die neue "Thinking"-Funktion macht den Planungsprozess der KI in ChatGPT sichtbar und ermöglicht direkte Korrekturen durch den Nutzer.
Das Modell erhält wegen seiner Fähigkeiten zur Automatisierung von Cyberangriffen die hohe Sicherheitsstufe "High Capability".
Neue API-Funktionen wie die "Tool Search" senken den Token-Verbrauch drastisch, während die Grundpreise für Entwickler steigen.

OpenAI hat mit GPT-5.4 und der leistungsstärkeren Variante GPT-5.4 Pro eine neue Modellgeneration veröffentlicht. Die KI vereint erstmals logisches Denken, die starken Programmierfähigkeiten des kürzlich erschienenen Modells GPT-5.3-Codex sowie die direkte Bedienung von Desktop-Rechnern in einer einzigen Architektur.

Transparenter Denkprozess und clevere API

In der Benutzeroberfläche von ChatGPT arbeitet das System ab sofort unter dem Namen "GPT-5.4 Thinking". Bei einer komplexen Anfrage rechnet die KI nicht im Verborgenen, sondern erstellt zunächst einen detaillierten und sichtbaren Plan. Anwender lesen diese Zwischenschritte und greifen bei Bedarf sofort in den Lösungsansatz ein.

Wenn das Modell in eine falsche Richtung argumentiert oder programmiert, lässt sich der Gedankengang vor der finalen Textausgabe anpassen. Ein komplett neuer Prompt ist dafür nicht mehr notwendig.

Zusätzlich profitieren Entwickler von einer neuen Funktion namens "Tool Search" in der Programmierschnittstelle (API). Bisher mussten Programmierer alle externen Funktionsdefinitionen in den Prompt laden, was viel Speicherplatz verbrauchte. GPT-5.4 erhält nun nur eine sehr kurze Liste der verfügbaren Funktionen und ruft die genauen Definitionen erst ab, wenn es sie wirklich für die Aufgabe benötigt. Laut Messungen senkte dieser Ansatz den Token-Verbrauch in speziellen Tests um fast die Hälfte.

Agenten steuern den Computer

GPT-5.4 verfügt über Fähigkeiten zur nativen Computersteuerung. Autonome KI-Agenten greifen eigenständig auf Desktop-Betriebssysteme zu und simulieren Tastaturanschläge sowie Mauseingaben. Das Modell orientiert sich dabei über hochauflösende Screenshots, da ein neuer Bilddetail-Modus Grafiken mit bis zu 10,24 Megapixeln im Originalformat verarbeiten kann. Agenten öffnen somit verschiedene Software-Programme, lesen Werte ab und führen Aktionen aus.

OpenAI demonstriert diese Kombination aus visueller Wahrnehmung und Programmierung mit einem experimentellen Skill namens "Playwright". In einer Vorführung erschuf die KI auf Basis eines einzigen Prompts eine komplette, isometrische Freizeitpark-Simulation inklusive Wegfindung für die simulierten Besucher. Damit die Agenten bei solchen stundenlangen Aufgaben nicht den inhaltlichen Faden verlieren, verarbeitet GPT-5.4 bis zu eine Million Token gleichzeitig.

Quelle: OpenAI

Ergebnisse der neuen Benchmarks

Die offiziellen Leistungsdaten zeigen branchenweite Verbesserungen. Beim anspruchsvollen Test für abstraktes Problemlösen (ARC-AGI-1) erreicht GPT-5.4 einen Wert von 93,7 Prozent. Die Pro-Version erzielt hier 94,5 Prozent.

OpenAI positioniert das System stark für die professionelle Büroarbeit. Beim hauseigenen GDPval-Benchmark, der komplexe Aufgaben aus 44 verschiedenen Berufen simuliert, erreicht das Modell 83,0 Prozent. Interessanterweise schlägt das Standard-Modell in dieser spezifischen Disziplin die teurere Pro-Version. Auch bei Investment-Banking-Aufgaben liefert GPT-5.4 starke 87,3 Prozent. Um diese Zielgruppe im Unternehmensumfeld direkt anzubinden, veröffentlichte OpenAI parallel ein neues ChatGPT-Add-in für Tabellenkalkulationen in Excel.

Besonders beim Programmieren (SWE-Bench Pro) zeigt sich eine effizientere Arbeitsweise. GPT-5.4 erreicht hier eine Erfolgsquote von 57,7 Prozent bei einer Latenz von etwa 1000 Sekunden. Ein neuer Schnellmodus für Codex soll die Verarbeitungsgeschwindigkeit sogar um das 1,5-Fache steigern, ohne die Ausgabequalität zu senken.

Quelle: OpenAI

Erkenntnisse aus der System Card

Ein wichtiger Aspekt der Veröffentlichung ist die begleitende System Card. Das Dokument stuft GPT-5.4 im Bereich der Cybersicherheit als "High Capability" ein. Es ist das erste allgemeine Reasoning-Modell mit dieser hohen Klassifikation.

Diese Einstufung bedeutet, dass die KI theoretisch in der Lage ist, bestehende Hürden für Cyberangriffe zu überwinden. Das System könnte End-to-End-Angriffe auf IT-Infrastrukturen automatisieren oder selbstständig relevante Sicherheitslücken in Netzwerken finden.

Um Missbrauch zu verhindern, ändert OpenAI das technische Schutzkonzept. Anstatt verdächtige Nutzer bei kritischen Anfragen auf ein schwächeres Modell herunterzustufen, scannt ein zweistufiges Überwachungssystem jede Nachricht. Die Software setzt nun Echtzeit-Blocker ein und unterbricht die Ausgabe sofort, sobald die KI eine bösartige Absicht im Prompt erkennt oder selbst gefährlichen Code generiert.

Hohe Preise für die Pro-Version

Entwickler nutzen die neuen Schnittstellen ab sofort. Die Preise spiegeln dabei den Leistungsunterschied der Varianten wider. Für das Standard-Modell GPT-5.4 berechnet OpenAI 2,50 US-Dollar pro einer Million Input-Token. Für generierte Output-Token fallen 15,00 US-Dollar an. Werden Input-Daten im System zwischengespeichert (Cached Input), sinkt der Preis auf 0,25 US-Dollar.

Die Variante GPT-5.4 Pro ist für extrem rechenintensive Unternehmensanwendungen gedacht. Der Input liegt bei 30,00 US-Dollar, während der Output mit 180,00 US-Dollar pro einer Million Token berechnet wird. OpenAI argumentiert, dass die Modelle durch ihre hohe Effizienz insgesamt weniger Token für die Lösungsfindung verbrauchen und die gestiegenen Grundpreise dadurch in der Praxis ausgleichen.