Ein GPT5 Roboter kämpft gegen einen GPT4o Roboter

GPT-5 schlägt GPT-4o – oder doch nicht?

Ein Blindtest zeigt: Nutzer wählen oft das „schlechtere“ Modell – woran liegt das wirklich?

Ein GPT5 Roboter kämpft gegen einen GPT4o Roboter
gpt-image-1 | All-AI.de

EINLEITUNG

Ein kleines Tool sorgt gerade für viel Wirbel: Auf einer Website können Nutzer in einem Blindtest zwischen GPT-5 und GPT-4o vergleichen – ohne zu wissen, welches Modell welche Antwort liefert. Die Ergebnisse überraschen. Denn obwohl GPT-5 auf dem Papier die bessere KI ist, wählen viele Nutzer weiterhin lieber GPT-4o. Der Test wirft ein neues Licht auf die Frage, worauf es bei künstlicher Intelligenz wirklich ankommt.

Test auf: https://gptblindvoting.vercel.app/

NEWS

Wenn Technik auf Gefühl trifft

Das Tool zeigt zwei Antworten auf dieselbe Frage. Dann wird abgestimmt, welche besser gefällt. Am Ende steht eine Auswertung, welches Modell im persönlichen Vergleich vorne liegt. Der Entwickler hat sich bewusst für kurze, nüchterne Antworten entschieden – ohne Formatierung oder spezielle Hinweise, die auf das jeweilige Modell hindeuten könnten.

Die Ergebnisse zeigen ein gemischtes Bild. Wer mit KI programmiert oder Fakten recherchiert, tendiert meist zu GPT-5. Wer dagegen mit der KI Geschichten schreibt, brainstormt oder einfach gerne plaudert, greift häufiger zu GPT-4o. Der Test macht sichtbar, dass viele Nutzer weniger Wert auf reine Leistung legen – sondern eher darauf, wie „menschlich“ sich die Antwort anfühlt.

Cookies aktivieren um den Inhalt zu sehen:

Ein Rückzieher mit Signalwirkung

Die Diskussion kommt nicht von ungefähr. Nach dem Start von GPT-5 Anfang August hagelte es Kritik: Die neue Version sei zu nüchtern, zu sachlich, zu wenig einfühlsam. OpenAI reagierte schnell – und stellte GPT-4o, das eigentlich abgeschaltet werden sollte, wieder zur Verfügung. Dabei hatte das ältere Modell im Frühjahr ebenfalls für Diskussionen gesorgt, weil es vielen Nutzern zu übertrieben schmeichelte.

Die Folge: OpenAI versucht nun, verschiedene Geschmäcker besser zu bedienen. GPT-5 lässt sich mit vier vordefinierten „Persönlichkeiten“ nutzen – vom nüchternen Roboter bis zum hilfsbereiten Nerd. Damit gesteht das Unternehmen ein, dass es nicht die eine perfekte KI gibt, sondern verschiedene Nutzertypen mit ganz eigenen Erwartungen.

Gute Noten, aber kein guter Draht?

GPT-5 überzeugt technisch: bessere Mathe-Ergebnisse, weniger Fehler, mehr Klarheit. Doch viele Nutzer erleben das Modell als kühler und distanzierter. Gerade Menschen, die KI eher kreativ oder als Begleiter nutzen, vermissen die Wärme und Nähe, die sie bei GPT-4o gespürt haben.

Dazu passt, dass manche Nutzer auf Reddit berichten, sich regelrecht von „ihrem“ KI-Modell verabschieden zu müssen. Die Verbindung war persönlich geworden – und die neue Version fühlt sich für viele eher nach Büro statt Wohnzimmer an. Genau das macht den Blindtest so spannend: Er zeigt, dass nicht allein Leistung zählt, sondern auch Ton und Stil entscheidend sind.

Warum der Test so viel aussagt

Der Blindtest ist mehr als ein nettes Spiel. Er zeigt, wie stark persönliche Vorlieben den Umgang mit KI beeinflussen. Was für den einen sachlich und hilfreich ist, wirkt auf den anderen kühl und abweisend. OpenAI reagiert darauf mit mehr Auswahlmöglichkeiten – ein Schritt, der zeigt: Die Zukunft der KI wird nicht nur leistungsstärker, sondern auch persönlicher.

DEIN VORTEIL - DEINE HILFE

Kostenlose News und Tutorials – mit minimaler Werbung und maximalem Mehrwert. Damit das so bleibt und wir uns stetig verbessern können, freuen wir uns über deine Unterstützung.

Teile diesen Beitrag

Folge uns auf Social Media

Keine KI-News mehr verpassen und direkt kommentieren!

Unterstütze uns direkt

Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support!

KURZFASSUNG

  • Ein Blindtest zeigt, dass viele Nutzer GPT-4o trotz technischer Vorteile von GPT-5 bevorzugen.
  • Während GPT-5 sachlich und klar agiert, wirkt GPT-4o menschlicher und emotionaler auf viele Nutzer.
  • OpenAI reagierte auf Kritik und bringt GPT-4o zurück – mit Fokus auf mehr Auswahl bei KI-Stilen.
  • Der Test beweist: Nicht nur Leistung zählt, sondern auch Ton, Stil und persönliche Vorlieben.

QUELLEN