Ein Roboter drückt auf ein Knopf um Britannica zu kopieren

Urheberrechtsstreit: Lexikon-Gigant verklagt OpenAI

Britannica und Merriam-Webster fordern Schadensersatz von OpenAI. ChatGPT soll Lexikontexte wörtlich kopieren und falsche Quellen nennen.

Andreas Becker16.03.26 Nano Banana

Kurzfassung Quellen

Die Encyclopedia Britannica und Merriam-Webster verklagen OpenAI vor einem New Yorker Bundesgericht wegen massenhafter Urheberrechtsverletzungen.
Die Verlage werfen dem Entwickler vor, fast 100.000 Artikel ohne Lizenz für das Training von ChatGPT genutzt zu haben.
Der Chatbot gibt geschützte Texte nahezu wortgleich wieder und nennt Britannica zudem fälschlicherweise als Quelle für KI-Halluzinationen.
Die Kläger fordern Schadensersatz und eine gerichtliche Unterlassungsanordnung, um die unautorisierte Nutzung ihrer Daten dauerhaft zu stoppen.

Die Encyclopedia Britannica und ihre Tochtergesellschaft Merriam-Webster haben in New York eine weitreichende Klage gegen OpenAI eingereicht. Die Verlage werfen dem Entwicklerstudio vor, fast 100.000 geschützte Artikel ohne Erlaubnis für das Training von ChatGPT genutzt zu haben.

Chatbot liefert exakte Kopien und falsche Fakten

Laut der offiziellen Klageschrift gibt der Chatbot auf entsprechende Prompts nahezu wortgleiche Kopien der Lexikon- und Wörterbucheinträge wieder. Diese direkten Antworten innerhalb der App ziehen Nutzer von den eigentlichen Webseiten der Verlage ab. Dadurch entgehen den Betreibern wichtige Einnahmen.

Zusätzlich zur Urheberrechtsverletzung werfen die Kläger OpenAI eine direkte Verletzung von Markenrechten vor. ChatGPT erzeugt regelmäßig sogenannte Halluzinationen, also völlig frei erfundene Fakten. Dabei nennt die Software in einigen Fällen Britannica als offizielle Quelle für diese falschen Aussagen. Der Traditionsverlag sieht dadurch seinen Ruf als verlässliche Informationsquelle in Gefahr und befürchtet eine Täuschung der Nutzer.

So speichern Algorithmen die Texte ab

Der Konflikt beleuchtet ein zentrales technisches Problem aktueller KI-Modelle. Während des Trainings analysieren die Algorithmen Milliarden von Texten und passen dabei ihre internen Parameter, die sogenannten Modellgewichte, an. Diese Zahlenwerte bilden das eigentliche Wissen des neuronalen Netzes und steuern die spätere Textgenerierung.

Wenn ein Modell bestimmte Daten sehr häufig verarbeitet, lernt es diese Texte fast auswendig. Die Informationen stecken dann fest in den Parametern des Sprachmodells. Genau dieser Vorgang stellt für Britannica eine illegale Vervielfältigung dar. Die Kläger argumentieren, dass OpenAI das gesammelte Wissen nicht nur analysiert, sondern die urheberrechtlich geschützten Werke faktisch kopiert und im System abspeichert.

Lexikonverlag verlangt finanzielle Entschädigung

Die Lexikonherausgeber fordern vor dem Bundesgericht in Manhattan einen nicht näher bezifferten Schadensersatz. Zudem verlangen sie eine offizielle Unterlassungsanordnung. Diese richterliche Anordnung soll OpenAI die weitere Nutzung der Texte rechtlich verbieten.

Das aktuelle Verfahren erhöht den juristischen Druck auf die gesamte KI-Branche. Britannica reichte bereits im Vorjahr eine ähnliche Klage gegen den Suchmaschinen-Anbieter Perplexity ein. Auch andere große Medienhäuser streiten aktuell vor Gericht über den kommerziellen Umgang mit Trainingsdaten. Die anstehenden Urteile in den USA legen zukünftig fest, ob Tech-Konzerne das offene Internet weiterhin kostenlos als Datenquelle für ihre Modelle nutzen dürfen.