Nano Banana Vollversion erschienen mit 11 Bildformaten
Beim Gemini Flash 2.5 Image Model sind jetzt 21:9, 16:9, 5:4, 4:3, 3:2, 1:1 sowie deren Umkehrungen auswählbar.

Nano Banana | All-AI.de
EINLEITUNG
Wer mit KI-Bildgeneratoren arbeitet, kannte das Problem: Man wünschte sich ein Bild im Breitbildformat und erhielt trotzdem nur ein Quadrat. Google behebt dieses Ärgernis nun mit einem wichtigen Update. Das unter dem Spitznamen "Nano Banana" bekannt gewordene Modell Gemini 2.5 Flash Image ist jetzt für den breiten Einsatz verfügbar und bringt elf verschiedene Seitenverhältnisse mit. Damit reagiert das Unternehmen direkt auf eine der meistgenannten Forderungen seiner Nutzer und macht einen entscheidenden Schritt in Richtung professioneller Anwendung.
NEWS
Vom Quadrat zur Kinoleinwand
Die wohl wichtigste Neuerung ist die Implementierung von elf verschiedenen Seitenverhältnissen, die Nutzern deutlich mehr kreative Freiheiten geben. Das Spektrum reicht von filmischen Formaten wie 21:9 und 16:9 über klassische Fotoformate bis hin zu Hochkant-Optionen wie 9:16, die für Social-Media-Anwendungen unerlässlich sind. Damit wird ein kritischer Fehler behoben, der zuvor trotz präziser Anweisungen oft nur quadratische Bilder mit 1024x1024 Pixeln lieferte.
Diese erweiterte Vielfalt ermöglicht es Entwicklern und Kreativen, Inhalte gezielt für verschiedene Plattformen und Zwecke zu erstellen, ohne umständliche Nachbearbeitung. Ob für eine Präsentation, einen Blogartikel oder eine Instagram-Story – das gewünschte Format lässt sich nun direkt bei der Generierung festlegen. Google stellt das Modell über seine Programmierschnittstellen, das AI Studio und die Unternehmensplattform Vertex AI zur Verfügung.
Quelle: Google - Im Gemini Studio bereits auswählbar
Intelligente Bildbearbeitung setzt neue Maßstäbe
Neben den neuen Formaten überzeugt Gemini 2.5 Flash Image mit fortschrittlichen Bearbeitungsfunktionen. Das System kann mehrere Bilder nahtlos miteinander verschmelzen und passt dabei Beleuchtung und Texturen intelligent an. Besonders hervorzuheben ist die Fähigkeit, die Konsistenz von Charakteren über mehrere Bilder hinweg beizubehalten – ein Merkmal, das für erzählerische Projekte entscheidend ist. Änderungen lassen sich zudem durch einfache Textbefehle steuern, ohne dass unbeabsichtigte Bildbereiche verändert werden.
Erste Unternehmen nutzen diese Fähigkeiten bereits. Die Firma Cartwheel etwa kombiniert das Modell mit einem 3D-Werkzeug, um Künstlern präzise Kontrolle über die Darstellung von Figuren aus jedem Kamerawinkel zu geben. Der Spieleentwickler Volley setzt die KI für die Bildgenerierung in Echtzeit während des Spiels ein und profitiert von der hohen Geschwindigkeit des Modells, das Ergebnisse in unter zehn Sekunden liefert.
Quelle: Google - jetzt als Vollversion
Preisdruck und verbleibende Grenzen
Im direkten Wettbewerb positioniert sich Google auch preislich attraktiv. Mit rund vier Cent pro Bild ist die Generierung etwa 40 Prozent günstiger als bei OpenAIs Konkurrenzmodell. Eine kostenlose Variante im Google AI Studio erlaubt bis zu 500 Anfragen pro Tag für Testzwecke. Trotz der Fortschritte bleiben jedoch technische Hürden bestehen. Die maximale Auflösung von 1024 Pixeln limitiert die Nutzung für hochauflösende Druckanwendungen. Zudem hat das Modell noch Schwierigkeiten mit der korrekten Darstellung kleinerer Textdetails. Alle erstellten Bilder werden mit einem digitalen Wasserzeichen versehen, um sie klar als KI-generiert zu kennzeichnen.
MITMACHEN
Hat Dir der Beitrag gefallen oder geholfen? Dann hilf uns mit einem Klick weiter - dauert nur Sekunden.
Teile diesen Beitrag
Folge uns auf Social Media
Unterstütze uns direkt
KI-Tools sind teuer – unser Wissen bleibt kostenlos. Spende einmalig via PayPal oder werde YouTube-Mitglied (ab 0,99 €). Dafür liefern wir täglich News, ehrliche Tests und praxisnahe Anleitungen. Danke dir!
KURZFASSUNG
- Google hat Gemini 2.5 Flash Image für den Produktionseinsatz freigegeben und unterstützt nun zehn verschiedene Seitenverhältnisse für flexible Bildgenerierung.
- Das System ermöglicht fortschrittliche Bildbearbeitung mit Charakterkonsistenz, Multi-Bild-Fusion und natürlichsprachlichen Befehlen bei Latenzzeiten unter zehn Sekunden.
- Unternehmen wie Cartwheel und Volley nutzen bereits erfolgreich die neuen Funktionen für kreative Anwendungen und Echtzeit-Spielerlebnisse.
- Mit einem Preis von 0,039 US-Dollar pro Bild positioniert sich Google kostengünstiger als Konkurrenten, wobei 500 kostenlose tägliche Anfragen für Entwickler verfügbar sind.