Alibaba Bildgenerator funktioniert wie ChatGPT

Bildgenerierung, Bearbeitung und Analyse in einem – wird dieses KI-Modell der neue Standard im Kampf gegen GPT-4o?

gpt-image-1 | All-AI.de

EINLEITUNG

Alibaba stellt mit Qwen VLo ein multimodales KI-Modell vor, das Bildgenerierung, -bearbeitung und -analyse kombiniert. Technisch ambitioniert, aber strategisch überraschend: Statt Open Source gibt es nun geschlossene Lizenzbedingungen. Wie viel Kontrolle verträgt ein KI-System, das Kreativität fördern soll?

NEWS

Bilder in Echtzeit – ohne Diffusion

Qwen VLo erzeugt Bilder nicht über Diffusionsverfahren, sondern schrittweise von links oben nach rechts unten. Das erlaubt gezieltere Eingriffe und wirkt sich positiv auf Bildqualität und Kontextverständnis aus. Besonders bei längeren Texteingaben bleiben die Resultate kohärent und präzise – ein Vorteil gegenüber vielen Vorgängern. Ein ähnliches Verfahren kennen wir bisher nur vom ChatGPT Bildgenerator.

Die Steuerung erfolgt rein über Spracheingaben, sowohl auf Chinesisch als auch auf Englisch. Damit lassen sich Hintergründe verändern, Objekte einfügen oder Stile anpassen. Selbst Kombinationen aus mehreren Bildern sind möglich. Die Interaktion bleibt dabei intuitiv, die Umsetzung effizient – trotz experimentellem Status.

Quelle: Alibaba

Mehr als ein Malprogramm

Qwen VLo ist nicht nur kreativ, sondern auch analytisch stark. Es erstellt Segmentierungen, erkennt Tiefenverhältnisse und unterstützt variable Seitenverhältnisse – etwa extrem breite oder schmale Formate. Noch ist das Modell im Preview-Modus, aber schon jetzt erkennbar ist das Potenzial für E-Commerce, Design und Bildung.

Der Zugriff erfolgt über den Browserdienst Qwen Chat. Erste Nutzer berichten von beeindruckender Flexibilität, aber auch gelegentlichen Fehlern. Klar ist: Das Modell lernt weiter – und entwickelt sich im Betrieb aktiv fort.

Quelle: Alibaba

Offenheit war gestern

Frühere Qwen-Modelle waren Open Source. Qwen VLo ist es nicht. Die Gewichte sind nur eingeschränkt lizenziert nutzbar, was viele Entwickler enttäuschen dürfte. Die Entscheidung zeigt einen klaren Strategiewechsel: mehr Kontrolle, weniger Community. Ob das der Qwen-Reihe schadet oder sie schützt, wird sich zeigen.

Gerade kleinere Entwickler und akademische Projekte könnten das Nachsehen haben. Denn ohne offenen Zugang sinkt die Möglichkeit zur Integration, Anpassung und Forschung. Gleichzeitig sichert sich Alibaba einen Vorsprung, den es nicht leichtfertig teilen will.

AUSBLICK

Sehr interessant

Gleiches Verfahren wie ChatGPT, viele Bearbeitungsfunktionen und jetzt müssen nur noch die Benchmark-Ergebnisse stimmen... der einzige Wehrmutstropfen ist, dass es nicht mehr OpenSource ist.

DEIN VORTEIL - DEINE HILFE

KURZFASSUNG

Alibaba hat mit Qwen VLo ein neues multimodales KI-Modell vorgestellt, das Bilder generieren, bearbeiten und analysieren kann.
Im Gegensatz zu früheren Qwen-Versionen sind die Modellgewichte diesmal nicht offen zugänglich.
Das System erlaubt präzise Steuerung durch schrittweise Bildkonstruktion und unterstützt mehrere Sprachen sowie flexible Formate.
Der strategische Wandel hin zu proprietären Lizenzen könnte das Entwickler-Ökosystem nachhaltig verändern.
Qwen VLo positioniert sich als starker Konkurrent zu GPT‑4o und Gemini im globalen KI-Wettbewerb.