Schockierend gut: GPT-4o macht ChatGPT zum Bildmagier

Schockierend gut: GPT-4o macht ChatGPT zum Bildmagier

Mit GPT-4o entsteht aus Worten beeindruckende visuelle Kunst. Top Qualität und unendliche Möglichkeiten

Mann und Frau vor einer Tafel
Quelle: OpenAI | All-AI.de

EINLEITUNG

OpenAI hat seine KI-Anwendung ChatGPT um eine neue Funktion erweitert: Nutzer können jetzt direkt Bilder generieren. Möglich macht das das neue Modell GPT-4o, das sogenannte "omnimodale" Fähigkeiten besitzt. Aber was genau bedeutet das, und wie gut funktioniert die Technik in der Praxis?

NEWS

Wie GPT-4o Bilder erstellt

GPT-4o arbeitet anders als klassische Bildgeneratoren. Statt ein Bild komplett in einem einzigen Prozess zu erzeugen – wie es bei den verbreiteten Diffusionsmodellen der Fall ist – geht GPT-4o Schritt für Schritt vor. Es baut Bilder zeilenweise auf, vergleichbar mit dem Schreiben eines Textes. Dieser autoregressive Ansatz kann präzisere Ergebnisse liefern, etwa bei der Darstellung von Text innerhalb eines Bildes oder bei der korrekten Zuordnung von Details wie Farben oder Kleidung.

Der Vorteil: komplexe Inhalte lassen sich genauer umsetzen. Der Nachteil: die Generierung dauert etwas länger. Trotzdem ist der Ansatz ein Schritt in Richtung vielseitigerer und kontrollierbarer KI-Bildgenerierung.

Quelle: OpenAI

Für wen die Funktion verfügbar ist

ChatGPT mit Bildfunktion steht inzwischen allen Nutzern zur Verfügung – auch ohne kostenpflichtiges Abo. Zwar macht OpenAI keine genauen Angaben zur Anzahl der nutzbaren Bilder pro Tag, aber die Begrenzungen orientieren sich vermutlich an früheren DALL·E-Limits. Laut OpenAI könnten sich diese Grenzen künftig dynamisch anpassen, abhängig von der Auslastung.

Update: Einige Nutzer berichten, dass die neue Funktion bereits funktioniert. Es gibt aber auch einige Nutzer, die noch keine Bilder erstellen können oder Fehlermeldungen bekommen. Das sollte sich aber in nächster Zeit normalisieren.

Kontrolle, aber keine sichtbaren Wasserzeichen

OpenAI verspricht Maßnahmen gegen missbräuchliche Nutzung: Inhalte mit Gewalt, Nacktheit oder ähnlichen Themen sollen automatisch geblockt werden. Außerdem enthalten die generierten Bilder Metadaten, die sie als KI-Erzeugnisse kennzeichnen. Sichtbare Wasserzeichen sucht man aber vergeblich.

Rechtlich bleiben die Bilder Eigentum der Nutzenden – sie können laut OpenAI für eigene Projekte genutzt werden, solange die allgemeinen Nutzungsbedingungen eingehalten werden. Insgesamt soll das Modell aber nicht mehr so restriktiv vorgehen wie das DALLE3 Modell.

AUSBLICK

Was das neue Feature bedeutet

Mit GPT-4o bringt OpenAI Bildgenerierung direkt in die Textoberfläche von ChatGPT. Das dürfte für viele Anwendungen neue Möglichkeiten eröffnen – sei es in der Werbung, bei der Ideenfindung oder für einfache Illustrationen. Besonders interessant ist der neue Modus für alle, die präzise Kontrolle über ihre KI-Bilder brauchen, zum Beispiel bei der Textdarstellung oder der Wiedererkennbarkeit von Objekten.

In Kombination mit der bestehenden Textverarbeitung könnte GPT-4o künftig Werkzeuge ersetzen, die bislang nur einzeln funktionierten – und damit neue Standards für kreative Workflows setzen.

Profilbild Caramba

UNTERSTÜTZUNG

Hat dir ein Artikel gefallen oder ein Tutorial geholfen? Du kannst uns weiterhelfen, indem du diese Seite weiterempfiehlst, uns auf Youtube abonnierst oder dich per Paypal an den Serverkosten beteiligst. Wir sind für jede Unterstützung dankbar. Danke.

KURZFASSUNG

  • OpenAI hat ChatGPT mit der neuen GPT-4o-Technologie ausgestattet, die nun auch Bildgenerierung ermöglicht.
  • Das Modell arbeitet "omnimodal" und verwendet einen autoregressiven Bildaufbau für mehr Präzision.
  • Alle Nutzer – auch in der Gratisversion – können auf die neue Funktion zugreifen.
  • Sicherheitsmaßnahmen wie Inhaltsblocker und Metadaten sorgen für Transparenz und Schutz vor Missbrauch.

QUELLEN