Warum Nvidia für KI wieder auf CPUs setzt

Mit der neuen Vera-Architektur stellt der Hersteller ein Rack vor, das passgenau für sehr schnelle Single-Thread-Leistung konzipiert ist.

Andreas Becker17.03.26 Nano Banana

Kurzfassung Quellen

Nvidia hat ein neues Rack-System vorgestellt, das ausschließlich mit 256 flüssigkeitsgekühlten Vera-Prozessoren bestückt ist.
Die Hardware wurde speziell für die hohen Anforderungen von agentischer KI und Reinforcement Learning entwickelt.
Mit über 22.000 Kernen und extrem schnellem LPDDR5X-Speicher entlasten die CPUs herkömmliche GPUs bei Bewertungszyklen.
Erste Server-Systeme mit der neuen Architektur sollen in der zweiten Jahreshälfte auf den Markt kommen.

Nvidia rückt bei der Hardware für künstliche Intelligenz wieder klassische Prozessoren in den Mittelpunkt und präsentiert ein reines CPU-Rack mit 256 flüssigkeitsgekühlten Chips der neuen Vera-Generation. Das System ist speziell für die hohen Anforderungen von agentischer KI und Reinforcement Learning konzipiert.

Die Rolle der CPU im KI-Zeitalter

Agentische KI-Systeme arbeiten zunehmend selbstständig, planen voraus und treffen eigene Entscheidungen. Für diese komplexen Abläufe benötigen die Systeme schnelle Reaktionszeiten und eine starke Single-Thread-Leistung. Genau hier kommen klassische Prozessoren wieder ins Spiel.

Beim sogenannten Reinforcement Learning, also dem maschinellen Lernen durch Belohnung, müssen kontinuierlich Ergebnisse bewertet werden. Klassische GPUs stoßen bei diesen kleinteiligen, ständigen Bewertungszyklen oft an architektonische Grenzen, da sie primär für die parallele Verarbeitung riesiger Datenmengen ausgelegt sind.

Die neue Vera-CPU übernimmt daher eine spezialisierte Rolle. Sie orchestriert die Agenten, verarbeitet die Daten und liefert die Bewertungen ohne Verzögerung an das System zurück. Laut den technischen Daten arbeiten die neuen Chips bei diesen Workloads bis zu 50 Prozent schneller als bisherige Server-Prozessoren. Zudem verdoppelt sich die Energieeffizienz bei diesen spezifischen Rechenaufgaben.

Technische Spezifikationen des Racks

Das vorgestellte Server-Rack bündelt 256 Vera-CPUs und nutzt eine moderne Flüssigkeitskühlung. Insgesamt arbeiten in einem einzigen Schrank 22.528 sogenannte Olympus-Kerne, die 45.056 Threads gleichzeitig verarbeiten können. Jeder einzelne Prozessor verfügt dabei über 88 Kerne.

Ein entscheidender Faktor für die Geschwindigkeit ist die direkte Anbindung an den Arbeitsspeicher. Das System nutzt speziellen LPDDR5X-Speicher, der eine extrem hohe Datenübertragungsrate ermöglicht und die Latenz niedrig hält.

Für das gesamte Rack stehen 400 Terabyte Speicher zur Verfügung. Die gesamte Speicherbandbreite liegt bei 300 Terabyte pro Sekunde. Dieser Aufbau verhindert, dass der Datenfluss bei komplexen Rechenoperationen ins Stocken gerät. Die Prozessoren laufen dadurch dauerhaft unter Volllast, ohne auf neue Datenpakete warten zu müssen.

Industrie bereitet den Einsatz vor

Das CPU-Rack lässt sich nahtlos über schnelle Netzwerkschnittstellen mit bestehenden Systemen verbinden. Der Hersteller setzt dabei auf die hauseigene MGX-Architektur, welche eine standardisierte Basis für verschiedene Server-Konfigurationen im Rechenzentrum bietet.

Zahlreiche Hardware-Produzenten und große Cloud-Anbieter planen bereits den breiten Einsatz der neuen Chips in ihren Anlagen. Durch die modulare Bauweise lassen sich die neuen Racks unkompliziert in die bestehende Infrastruktur integrieren. Die ersten Systeme mit den flüssigkeitsgekühlten Vera-Prozessoren sollen in der zweiten Jahreshälfte ausgeliefert werden.