Meta-Deal mit News Corp: 50 Millionen Dollar jährlich für KI-Daten
Der Tech-Konzern sichert sich die Rechte an Artikeln des Wall Street Journals. Die Texte dienen dem Training kommender KI-Modelle.

Meta sichert sich die Rechte an den umfangreichen Publikationen des Medienkonzerns News Corp für das Training seiner hauseigenen KI-Modelle. Der mehrjährige Lizenzvertrag kostet den Technologiekonzern bis zu 50 Millionen US-Dollar pro Jahr.
Hochwertige Fakten für smarte Algorithmen
Bisher sammelten Entwickler oft frei zugängliche Texte aus dem Internet, was zunehmend zu juristischen Auseinandersetzungen mit Urhebern führt. Mit diesem Abkommen wählt Meta nun einen rechtssicheren Weg.
Das Unternehmen kauft gezielt lizenzierte Inhalte ein, um die Qualität seiner Sprachmodelle zu verbessern. News Corp, das Mutterunternehmen von Zeitungen wie dem Wall Street Journal, stellt dafür sein riesiges Textarchiv sowie tagesaktuelle Artikel bereit. Diese strukturierten Informationen helfen der KI dabei, aktuelle Ereignisse und komplexe Zusammenhänge präziser abzubilden.
Für die Algorithmen fungieren professionell recherchierte Texte als hochwertiges Trainingsmaterial. Arbeiten Modelle mit verifizierten Fakten, sinkt die Wahrscheinlichkeit für erfundene Antworten, sogenannte Halluzinationen. Zudem ermöglicht der Deal Meta, die Nachrichten potenziell für zukünftige Echtzeit-Suchfunktionen oder als direkte Informationsquelle innerhalb seiner Chatbots zu nutzen.
Anzeige
Neues Geschäftsmodell für Medienhäuser
Für die Verlage entsteht durch solche Kooperationen eine lukrative Einnahmequelle. Anstatt sich lediglich gegen das ungefragte Auslesen ihrer Webseiten durch Web-Crawler zu wehren, verkaufen sie ihre Artikel nun direkt als Rohmaterial.
Ein Vertreter von News Corp bezeichnete die eigenen Medieninhalte kürzlich als einen wertvollen Input für die gesamte Branche. Diese Einschätzung spiegelt sich in dem Preis von 50 Millionen US-Dollar jährlich klar wider.
Meta entwickelt mit der Llama-Familie bekannte Open-Source-Modelle, die von Entwicklern weltweit genutzt werden. Hochwertige Trainingsdaten sind entscheidend, um die Leistung dieser Modelle im Vergleich zur Konkurrenz hoch zu halten. Ob die lizenzierten News-Corp-Daten exklusiv für interne Meta-Produkte verwendet oder auch in die Entwicklung der frei verfügbaren Modelle fließen, geht aus den bisherigen Details nicht eindeutig hervor.
Die Vereinbarung unterstreicht eine deutliche Entwicklung in der Tech-Industrie. Führende Entwickler setzen immer stärker auf vertraglich abgesicherte Datensätze, um ihre Modelle zu optimieren und gleichzeitig rechtliche Konflikte zu vermeiden. Die langfristige Integration dieser Informationsquellen bildet eine stabile Grundlage für die nächste Generation von KI-Diensten.