Google DeepMinds neuer 3D-Turbo für Gemini enthüllt
Warum die Übernahme von Common Sense Machines das fehlende Puzzleteil für echtes räumliches Verständnis ist.

Google integriert das US-Startup Common Sense Machines in die DeepMind-Sparte. Mit der Akquisition sichert sich der Konzern die Schlüsseltechnologie, um aus flachen 2D-Bildern räumliche 3D-Objekte zu generieren – ein entscheidender Baustein für das räumliche Verständnis zukünftiger Gemini-Versionen.
Vom 2D-Bild zum 3D-Mesh
Der Asset-Turbo Google hat das im US-amerikanischen Cambridge (Massachusetts) ansässige Startup Common Sense Machines (CSM) vollständig übernommen. CSM hat sich mit seiner Plattform "Cube" einen Namen gemacht, die mittels KI aus einfachen 2D-Bildern oder Text-Prompts voll funktionsfähige 3D-Modelle (Meshes) generiert. Wo Grafiker früher Stunden für das Modellieren, Texturieren und Riggen einer einzelnen Figur brauchten, erledigt CSM dies in Minuten.
Das Team aus dem MIT-Umfeld wird direkt in die DeepMind-Forschung integriert. Auch wenn CSM primär einzelne Objekte erstellt, ist diese Technologie das fehlende Puzzleteil für Googles Ambitionen in Richtung "World Models". Damit eine KI wie Gemini die physische Welt wirklich simulieren kann, muss sie erst einmal verstehen, dass ein Bild nicht nur aus Pixeln besteht, sondern aus räumlichen Objekten mit Vorder- und Rückseiten. CSM liefert die automatisierte Masse an 3D-Daten, die für dieses Training notwendig ist.
Anzeige
Implikationen für Spieleentwicklung und Robotik
Für die Industrie löst dies einen der größten Flaschenhälse: die Erstellung von "Digital Assets". Spieleentwickler und Architekten benötigen riesige Bibliotheken an 3D-Objekten – von der Kaffeetasse bis zum Charakter. Googles Integration dieser Technologie könnte die Erstellung solcher Assets in der Cloud drastisch vereinfachen.
Auch für die Robotik ist dieser Schritt essenziell. Roboter müssen Objekte greifen und manipulieren. Die Algorithmen von CSM helfen der KI, aus dem Kamerabild eines Roboters sofort auf die 3D-Form des Gegenstandes zu schließen. Dies verbessert die Navigation und Interaktion in unstrukturierten Umgebungen massiv.
Aggressive Einkaufstour gegen den Fachkräftemangel
Die Übernahme ist Teil einer breiteren Offensive. Parallel bestätigte Google den Einstieg bei Akana AI, einem Forschungslabor für neuartige Lernalgorithmen. Diese Serie von kleineren "Acqui-hires" – dem Aufkauf von Firmen primär wegen ihrer Talente – zeigt Googles Strategie für 2026: Statt riskanter Megafusionen kauft man gezielt spezialisiertes Know-how für multimodale KI ein, um rechtliche Hürden zu umschiffen und die Innovationsgeschwindigkeit gegen OpenAI und Co. hochzuhalten.