Alibaba Bildgenerator funktioniert wie ChatGPT
Bildgenerierung, Bearbeitung und Analyse in einem – wird dieses KI-Modell der neue Standard im Kampf gegen GPT-4o?

gpt-image-1 | All-AI.de
EINLEITUNG
Alibaba stellt mit Qwen VLo ein multimodales KI-Modell vor, das Bildgenerierung, -bearbeitung und -analyse kombiniert. Technisch ambitioniert, aber strategisch überraschend: Statt Open Source gibt es nun geschlossene Lizenzbedingungen. Wie viel Kontrolle verträgt ein KI-System, das Kreativität fördern soll?
NEWS
Bilder in Echtzeit – ohne Diffusion
Qwen VLo erzeugt Bilder nicht über Diffusionsverfahren, sondern schrittweise von links oben nach rechts unten. Das erlaubt gezieltere Eingriffe und wirkt sich positiv auf Bildqualität und Kontextverständnis aus. Besonders bei längeren Texteingaben bleiben die Resultate kohärent und präzise – ein Vorteil gegenüber vielen Vorgängern. Ein ähnliches Verfahren kennen wir bisher nur vom ChatGPT Bildgenerator.
Die Steuerung erfolgt rein über Spracheingaben, sowohl auf Chinesisch als auch auf Englisch. Damit lassen sich Hintergründe verändern, Objekte einfügen oder Stile anpassen. Selbst Kombinationen aus mehreren Bildern sind möglich. Die Interaktion bleibt dabei intuitiv, die Umsetzung effizient – trotz experimentellem Status.
Quelle: Alibaba
Mehr als ein Malprogramm
Qwen VLo ist nicht nur kreativ, sondern auch analytisch stark. Es erstellt Segmentierungen, erkennt Tiefenverhältnisse und unterstützt variable Seitenverhältnisse – etwa extrem breite oder schmale Formate. Noch ist das Modell im Preview-Modus, aber schon jetzt erkennbar ist das Potenzial für E-Commerce, Design und Bildung.
Der Zugriff erfolgt über den Browserdienst Qwen Chat. Erste Nutzer berichten von beeindruckender Flexibilität, aber auch gelegentlichen Fehlern. Klar ist: Das Modell lernt weiter – und entwickelt sich im Betrieb aktiv fort.
Quelle: Alibaba
Quelle: Alibaba
Offenheit war gestern
Frühere Qwen-Modelle waren Open Source. Qwen VLo ist es nicht. Die Gewichte sind nur eingeschränkt lizenziert nutzbar, was viele Entwickler enttäuschen dürfte. Die Entscheidung zeigt einen klaren Strategiewechsel: mehr Kontrolle, weniger Community. Ob das der Qwen-Reihe schadet oder sie schützt, wird sich zeigen.
Gerade kleinere Entwickler und akademische Projekte könnten das Nachsehen haben. Denn ohne offenen Zugang sinkt die Möglichkeit zur Integration, Anpassung und Forschung. Gleichzeitig sichert sich Alibaba einen Vorsprung, den es nicht leichtfertig teilen will.
AUSBLICK
DEIN VORTEIL - DEINE HILFE
Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung.
Teile diesen Beitrag
Folge uns auf Social Media
Keine KI-News mehr verpassen und direkt kommentieren!
Unterstütze uns direkt
Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support!
KURZFASSUNG
- Alibaba hat mit Qwen VLo ein neues multimodales KI-Modell vorgestellt, das Bilder generieren, bearbeiten und analysieren kann.
- Im Gegensatz zu früheren Qwen-Versionen sind die Modellgewichte diesmal nicht offen zugänglich.
- Das System erlaubt präzise Steuerung durch schrittweise Bildkonstruktion und unterstützt mehrere Sprachen sowie flexible Formate.
- Der strategische Wandel hin zu proprietären Lizenzen könnte das Entwickler-Ökosystem nachhaltig verändern.
- Qwen VLo positioniert sich als starker Konkurrent zu GPT‑4o und Gemini im globalen KI-Wettbewerb.