Ein Wal klaut Geld von Google

Wie DeepSeek zur Weltspitze wurde – mit fremden Daten?

Ein chinesisches KI-Modell verblüfft mit Power. Aber hat DeepSeek dabei bei der Konkurrenz abgekupfert?

Ein Wal klaut Geld von Google
gpt-image-1 | All-AI.de

EINLEITUNG

Das chinesische KI-Unternehmen DeepSeek sorgt mit seinem neuesten Modell für Aufsehen. Es erzielt beeindruckende Ergebnisse in Benchmarks und scheint die Lücke zu den etablierten Playern wie Google und OpenAI zu schließen. Doch hinter der Fassade des rasanten Aufstiegs verdichten sich die Anzeichen, dass der Erfolg nicht allein auf eigener Innovationskraft beruhen könnte. Experten und Entwickler äußern einen schweren Verdacht: DeepSeek soll seine Modelle systematisch mit den Daten der Konkurrenz trainiert haben, zuletzt offenbar mit Ausgaben von Googles leistungsfähigem Gemini-Modell. Es ist nicht das erste Mal, dass solche Vorwürfe laut werden und sie werfen eine grundlegende Frage auf: Wie gelingt es dem chinesischen Aufsteiger, in so kurzer Zeit zur Weltspitze aufzuschließen, und welche Rolle spielen dabei die Daten der Konkurrenz?

NEWS

Spuren im System: Die Indizienkette gegen DeepSeek

Die jüngsten Anschuldigungen entzündeten sich am neuesten Modell von DeepSeek mit der Kennung R1-0528. Mehrere KI-Forscher bemerkten auffällige Parallelen zu den Modellen von Google. Ein australischer Entwickler namens Sam Paech wies auf X darauf hin, dass die Wortwahl und die Formulierungen des DeepSeek-Modells stark denen von Googles Gemini 2.5 Pro ähneln. Das allein wäre noch kein schlagender Beweis. Doch ein weiterer, anonymer Entwickler untermauerte den Verdacht mit einer genaueren Analyse. Er stellte fest, dass die sogenannten "Traces", also die internen Gedankengänge, die ein Modell zur Lösungsfindung generiert, fast identisch mit denen von Gemini zu sein scheinen. Diese Spuren sind für das Training von KI-Modellen extrem wertvoll und ihre Ähnlichkeit ist ein starkes Indiz dafür, dass DeepSeek hier nicht nur vom gleichen öffentlichen Datensatz gelernt hat.

Cookies aktivieren um den Inhalt zu sehen:

Ein bekanntes Muster: Die Vorgeschichte mit OpenAI

Die aktuellen Vorwürfe passen in ein Muster, das schon länger zu beobachten ist. Bereits im Dezember 2024 fiel Entwicklern auf, dass sich ein früheres Modell von DeepSeek in manchen Antworten als ChatGPT ausgab. Dies nährte den Verdacht, dass das Modell auf gestohlenen Chatprotokollen von OpenAI trainiert wurde. OpenAI selbst, in enger Partnerschaft mit Microsoft, bestätigte später, verdächtige Aktivitäten auf seinen Entwickler-Schnittstellen (APIs) festgestellt zu haben. Große Datenmengen sollen über Konten abgeflossen sein, die man DeepSeek zuordnet. Die dahinterstehende Methode nennt sich "Destillation". Dabei wird ein großes, leistungsfähiges Modell, der "Lehrer", genutzt, um ein kleineres Modell, den "Schüler", zu trainieren. Man füttert das Lehrermodell mit Anfragen und nutzt dessen hochwertige Antworten als Trainingsdaten für das eigene, kleinere System. Diese Praxis ist zwar technisch nicht illegal, verstößt aber klar gegen die Nutzungsbedingungen von Anbietern wie OpenAI und Google, die die Verwendung ihrer Modellausgaben zum Training konkurrierender KI-Systeme explizit verbieten.

Wettrüsten im Verborgenen: Der Kampf um die Trainingsdaten

Warum sollte ein finanzstarkes Unternehmen wie DeepSeek ein solches Risiko eingehen? Der KI-Forscher Nathan Lambert liefert eine plausible Erklärung: DeepSeek habe zwar viel Geld, aber möglicherweise nicht genug Zugang zu den extrem teuren und raren Hochleistungschips (GPUs), die für das Training von Grund auf nötig sind. Das "Abzapfen" der Konkurrenz über deren APIs wäre somit eine Abkürzung, um Rechenleistung effektiv zuzukaufen und schneller voranzukommen. Die großen US-Konzerne haben auf diese verdeckte Kriegsführung längst reagiert. OpenAI verlangt für den Zugang zu seinen fortschrittlichsten Modellen eine Identitätsprüfung und hat China von der Liste der unterstützten Länder gestrichen. Google und Anthropic haben damit begonnen, die wertvollen "Traces" ihrer Modelle nur noch zusammengefasst auszugeben, um eine direkte Destillation zu erschweren. Diese Abwehrmaßnahmen zeigen, wie ernst die Branchenführer die Gefahr der Industriespionage nehmen und dass die Vorwürfe gegen DeepSeek mehr sind als nur haltlose Spekulationen.

AUSBLICK

Zwischen Innovation und Industriespionage

Der Fall DeepSeek wirft ein grelles Licht auf die Grauzonen der globalen KI-Entwicklung. Das Ringen um technologische Überlegenheit wird mit immer härteren Bandagen geführt, wobei die Grenzen zwischen cleverer Abkürzung und klarem Regelbruch zunehmend verschwimmen. Während die USA und China einen erbitterten Wettlauf um die Vormachtstellung austragen, wird der Schutz des geistigen Eigentums zur zentralen Herausforderung. Die Gegenmaßnahmen der US-Konzerne sind ein klares Signal, dass man die unerlaubte Nutzung der eigenen, teuer entwickelten Modelle nicht länger dulden wird. Am Ende geht es nicht nur um die Frage, wer das beste Modell baut, sondern auch darum, nach welchen Regeln gespielt wird. Die Antwort darauf wird die KI-Landschaft nachhaltiger prägen als jeder einzelne Benchmark-Erfolg.

Profilbild Caramba

UNSER ZIEL

Wir wollen hauptberuflich über Künstliche Intelligenz berichten und dabei immer besser werden. Du kannst uns auf dem Weg unterstützen!

Teile diesen Beitrag

Folge uns auf Social Media

Keine KI-News mehr verpassen und direkt kommentieren!

Unterstütze uns direkt

Mit einer YouTube-Mitgliedschaft (ab 0,99 €) oder einmalig über PayPal. So helft ihr uns, unabhängig neue Tools zu testen und noch mehr Tutorials für euch zu erstellen. Vielen Dank für euren Support!

KURZFASSUNG

  • Das chinesische Unternehmen DeepSeek steht unter Verdacht, seine KI-Modelle mit Ausgaben von Googles Gemini-Modell trainiert zu haben.
  • Bereits zuvor gab es Hinweise auf die Nutzung gestohlener ChatGPT-Daten durch Destillationstechniken.
  • Führende US-Konzerne reagieren mit Sicherheitsmaßnahmen, um ihre Trainingsdaten vor Industriespionage zu schützen.
  • Der Fall DeepSeek beleuchtet die zunehmenden Spannungen im globalen KI-Wettrüsten zwischen China und den USA.

QUELLEN