Veo 2 & Imagen 3: Google zeigt, was KI-Videos und Bilder können

Von cineastischen 4K-Videos bis zu lebendigen Kunststilen – Google präsentiert seine fortschrittlichsten KI-Modelle.

Kurzfassung | Caramba, 18.12.24
Google Veo
Quelle: Google | All-AI.de

Worum geht es?

Google DeepMind hebt die Messlatte erneut: Mit den KI-Modellen Veo 2 und Imagen 3 setzt das Unternehmen neue Maßstäbe in der Video- und Bildgenerierung. Hochauflösende Videos, lebendige Bilder und präzise Kunststile – Google zeigt, wie weit generative KI bereits ist.

News

Veo 2: KI-Videos in 4K und mit cineastischer Präzision

Das Videomodell Veo 2 erlaubt es, Videos in beeindruckender 4K-Auflösung zu erstellen und dabei cinematografische Effekte wie Kameraeinstellungen oder spezielle Linsentypen zu simulieren. Zudem kann die Videolänge auf mehrere Minuten ausgedehnt werden – eine deutliche Weiterentwicklung im Vergleich zu bisherigen Modellen.

Besonderer Fokus lag auf der Reduzierung von sogenannten Halluzinationen: Veo 2 minimiert Fehler wie überzählige Finger oder unpassende Details und erreicht realistischere Physik bei Bewegungen. Damit wird die KI deutlich verlässlicher bei komplexen Szenen.

In Vergleichstests mit Metas MovieGenBench-Datensatz lieferte Veo 2 überzeugende Ergebnisse. Videos in 720p wurden von menschlichen Bewertern hinsichtlich Prompt-Adhärenz und Gesamtqualität bevorzugt – auch gegenüber OpenAIs Sora Turbo. Google bleibt jedoch realistisch: Bei dynamischen, anspruchsvollen Szenen gibt es noch Optimierungspotenzial.

Aktuell ist Veo 2 nur über ausgewählte Plattformen wie YouTube, Vertex AI und VideoFX verfügbar. 2025 soll das Tool breiter eingesetzt werden, etwa für YouTube Shorts. Ein unsichtbares SynthID-Wasserzeichen markiert die generierten Videos, um sie als KI-Erzeugnisse zu kennzeichnen.

Imagen 3: Bessere Farben und feinere Details

Parallel zu Veo 2 stellt Google sein verbessertes Bildmodell Imagen 3 vor. Das Tool liefert präzisere Bilder mit verbesserter Farbbalance, lebendigeren Texturen und einer realistischeren Darstellung feiner Details.

Eine Stärke von Imagen 3 liegt in der Darstellung verschiedener Kunststile: Ob Fotorealismus, Anime oder abstrakte Kunst – das Modell überzeugt durch Vielseitigkeit und Qualität. Google hebt hervor, dass besonders die Darstellung von reichhaltigen Texturen verbessert wurde.

Imagen 3 ist ab sofort in mehr als 100 Ländern verfügbar und kann über Googles ImageFX-Tool genutzt werden. Auch im Gemini-Chat spielt Imagen 3 eine Rolle, wobei Google noch keine Details zu einer vollständigen Integration bekannt gab.

Konkurrenz belebt die Entwicklung

Mit Veo 2 und Imagen 3 stärkt Google seine Position im Bereich generativer Medien und tritt verstärkt gegen Konkurrenten wie OpenAI (Sora, DALL·E) und Midjourney an. Die klare Ausrichtung auf technische Präzision und kreative Vielfalt zeigt, dass der Markt für KI-Modelle dynamischer denn je ist.

Ausblick

Veo 2 und Imagen 3 markieren einen wichtigen Schritt in der KI-gestützten Mediengenerierung. Videos mit cineastischer Qualität und Bilder, die unterschiedliche Stile perfekt interpretieren, eröffnen neue Möglichkeiten für Kreative und Unternehmen.

Profilbild Caramba

Short

  • Google präsentiert die KI-Modelle Veo 2 für 4K-Videos und Imagen 3 für präzisere Bildgenerierung mit lebendigen Details.
  • Veo 2 verbessert cineastische Effekte, Bewegungsphysik und minimiert visuelle Fehler, während Imagen 3 vielseitige Kunststile beherrscht.
  • Beide Tools sind gezielt für Kreative und Unternehmen entwickelt, um hochwertige Medien effizient zu produzieren.
  • Veo 2 wird 2025 breiter verfügbar sein und mit SynthID-Wasserzeichen versehen, um Transparenz bei KI-Inhalten zu gewährleisten.
  • Mit diesen Modellen konkurriert Google verstärkt mit OpenAI und Midjourney um die Führung im Bereich generativer KI-Medien.

Kommentieren, diskutieren und teilen!

Anmelden