Ein Roboter in der Wüste

Lyra 2.0 generiert persistente 3D-Welten

Der generative Ansatz verhindert das Vergessen von Geometrie bei langen Kamerafahrten in virtuellen Umgebungen.

Andreas Becker Lyra 2
Ein Roboter in der Wüste

Forscher haben mit Lyra 2.0 eine neue Methode entwickelt, um persistente und erkundbare 3D-Welten in großem Maßstab zu generieren. Das KI-Modell löst bekannte Probleme wie das Vergessen von Räumen und strukturelle Verzerrungen bei langen virtuellen Kamerafahrten.

Schluss mit Spatial Forgetting und Drift

Bisherige Modelle zur Videogenerierung scheitern oft an ausgedehnten Erkundungstouren. Kehrt die Kamera an einen bereits besuchten Ort zurück, erfinden die Systeme die Umgebung häufig neu. Dieses Phänomen ist als Spatial Forgetting bekannt.

Gleichzeitig sammeln sich bei der fortlaufenden Generierung kleine Fehler an. Solche Ungenauigkeiten summieren sich über die Zeit und verzerren die Geometrie der simulierten Welt zusehends. Dieses Temporal Drifting verhinderte bisher die zuverlässige Erstellung von großen, konsistenten 3D-Umgebungen.

Quelle: Google

Geometrie-Routing und selbstkorrigierendes Training

Lyra 2.0 adressiert diese Schwächen auf zwei technischen Ebenen. Um das räumliche Vergessen zu stoppen, speichert das Modell die 3D-Geometrie für jeden Frame ab. Es nutzt diese Daten rein für das sogenannte Information Routing.

Das System ruft auf diese Weise relevante, vergangene Bilder ab und stellt dichte Verknüpfungen zu neuen Blickwinkeln her. Die finale optische Ausgestaltung der Oberfläche übernimmt anschließend weiterhin der generative Teil des KI-Modells.

Quelle: Google

Gegen das zeitliche Abdriften setzen die Entwickler auf ein spezielles Training. Sie füttern Lyra 2.0 gezielt mit fehlerhaften, eigenen Ausgaben der Vergangenheit. Das Modell lernt dadurch, Abweichungen in der Geometrie aktiv zu korrigieren, anstatt sie einfach in den nächsten Frame fortzuschreiben.

Im Ergebnis liefert der Ansatz stabile 3D-Strukturen, die direkt für Echtzeit-Rendering genutzt werden können. Die automatisierte Erstellung interaktiver, persistenter Umgebungen erhält damit eine verlässliche technische Basis.

Anzeige

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.