Google Whisk: Bilder generieren war noch nie so intuitiv

Einfach Bilder kombinieren und Neues erschaffen – Whisk bringt kreative Freiheit auf ein neues Level.

Kurzfassung | Caramba, 18.12.24
Google Whisk
Google | All-AI.de

Worum geht es?

Google Labs präsentiert „Whisk“ – ein neues KI-Tool, das Bilder nicht mit langen Textbeschreibungen, sondern auf Basis anderer Bilder generiert. Kreative können Motiv, Szene und Stil neu kombinieren und so einzigartige visuelle Konzepte erschaffen.

News

Ein Tool für visuelles Experimentieren

Statt komplizierter Text-Prompts steht bei Whisk das Bild selbst im Fokus: Nutzer ziehen einfach Bilder für Motiv, Szene und Stil in die Anwendung. Die KI kombiniert diese Elemente anschließend zu neuen, kreativen Bildern. Zusätzlich können Nutzer die Ergebnisse mit kurzen Textbeschreibungen verfeinern.

Googles Sprachmodell – vermutlich das neue Gemini 2.0 Flash – analysiert die eingegebenen Bilder und erstellt detaillierte Beschreibungen. Diese Daten werden dann an das Bildgenerierungsmodell „Imagen 3“ übergeben, das die finalen Bilder produziert. Dabei geht es nicht um exakte Replikate, sondern um visuelle Interpretationen.

Inspiration statt Perfektion

Google betont, dass Whisk bewusst nur die Essenz der hochgeladenen Bilder erfasst. Dadurch entstehen kreative Variationen, die von den Erwartungen der Nutzer abweichen können. Ein Motiv könnte eine neue Größe, andere Farben oder Details wie Frisur und Hautton annehmen.

Für Projekte, bei denen exakte Übereinstimmung entscheidend ist, erlaubt Whisk den Zugriff auf die generierten Prompts. Diese können jederzeit angepasst werden, um das Ergebnis zu optimieren.

Ein Werkzeug für Kreative

Laut Google richtet sich Whisk an Künstler und Designer, die neue Ideen schnell visualisieren möchten. Erste Tests zeigen, dass Whisk weniger ein Bildbearbeitungsprogramm als vielmehr ein kreatives Spielzeug ist. Nutzer beschreiben es als praktische Möglichkeit, Dutzende von Optionen durchzuspielen, bevor sie das beste Ergebnis herunterladen.

Die Geschwindigkeit der Generierung hängt noch von der Serverauslastung ab, könnte sich aber mit der weiteren Entwicklung verbessern. Google sieht Whisk als Teil eines kreativen Prozesses, der neue Ansätze für visuelles Design bietet.

Begrenzter Start und Konkurrenz zu Midjourney

Whisk ist bisher nur in den USA unter labs.google/whisk verfügbar. Nutzer aus anderen Ländern haben keinen Zugang, können das Tool aber vermutlich in Zukunft testen, falls es sich als Erfolg erweist.

Auch Konkurrenzanbieter wie Midjourney experimentieren mit neuen Konzepten: Deren „Patchwork“-Funktion ermöglicht ebenfalls kreative Bildkombinationen und deutet auf eine wachsende Nachfrage nach solchen Tools hin.

Ausblick

Mit Whisk bietet Google ein vielversprechendes Werkzeug für Designer und Kreative. Die Möglichkeit, Bilder intuitiv zu kombinieren, könnte den kreativen Workflow erheblich vereinfachen. Ob Whisk langfristig erfolgreich ist, hängt davon ab, wie gut es die Balance zwischen kreativer Freiheit und Präzision findet.

Profilbild Caramba

Short

  • Google Labs stellt „Whisk“ vor, ein KI-Tool, das Bilder auf Basis von anderen Bildern statt Textbeschreibungen generiert.
  • Whisk kombiniert Elemente wie Motiv, Szene und Stil, um kreative Bildvariationen zu erstellen.
  • Das Tool richtet sich an Designer und Künstler, die schnell neue visuelle Konzepte ausprobieren möchten.
  • Whisk ist aktuell nur in den USA verfügbar und konkurriert mit Anbietern wie Midjourney.
  • Google positioniert Whisk als kreatives Experiment, das zukünftig zum Produkt reifen könnte.

Kommentieren, diskutieren und teilen!

Anmelden