81 TB Bücher für KI? Meta gerät wegen massiven Downloads in die Kritik

Meta hat heimlich massenhaft Bücher heruntergeladen, um KI-Modelle zu trainieren – war das nur ein „technisches Versehen“?

Kurzfassung | Branda, 08.02.25
Meta Roboter dursucht Bücher
Flux Schnell | All-AI.de

EINLEITUNG

Meta steht derzeit im Fokus einer Kontroverse, nachdem bekannt wurde, dass das Unternehmen über 81,7 Terabyte an Büchern mittels Torrent heruntergeladen hat. Diese Praxis wirft Fragen hinsichtlich der Nutzung urheberrechtlich geschützter Werke für die Entwicklung von KI-Modellen auf.

NEWS

Alles erlaubt wegen "KI"?

Interne E-Mails von Meta-Mitarbeitern, die im Rahmen eines Rechtsstreits mit einer Gruppe von Autoren veröffentlicht wurden, offenbaren, dass das Unternehmen Bücher von Plattformen wie Internet Archive, Z-Library und Libgen bezogen hat. Um die eigene Beteiligung zu verschleiern, wurden die Downloads nicht über die firmeneigene Infrastruktur durchgeführt, und das Seeding – das Bereitstellen der heruntergeladenen Daten für andere Nutzer – wurde auf ein Minimum reduziert. Ein Ingenieur bemerkte dazu: "Torrenting über einen Firmenlaptop fühlt sich nicht richtig an."

Meta verteidigt sich mit dem Argument, dass die Verwendung dieser Daten für das Training von Sprachmodellen unter den "Fair Use"-Grundsatz falle und somit keine Urheberrechtsverletzung darstelle. Allerdings könnte das aktive Seeding der Werke als illegale Verbreitung gewertet werden, was die rechtliche Situation für Meta weiter verkompliziert.

Diese Entwicklungen werfen ein Schlaglicht auf die Methoden großer Tech-Unternehmen bei der Beschaffung von Trainingsdaten für KI-Modelle. Die Balance zwischen technologischem Fortschritt und der Wahrung von Urheberrechten bleibt ein zentrales Thema in der Diskussion um künstliche Intelligenz.

UNTERSTÜTZUNG

Hat dir ein Artikel gefallen oder ein Tutorial geholfen? Du kannst uns weiterhelfen, indem du diese Seite weiterempfiehlst, uns auf Youtube abonnierst oder dich per Paypal an den Serverkosten beteiligst. Wir sind für jede Unterstützung dankbar. Danke.

KURZFASSUNG

  • Meta hat über 81,7 Terabyte an Büchern aus fragwürdigen Quellen wie Z-Library und Libgen per Torrent heruntergeladen, um sie für KI-Training zu nutzen.
  • Interne E-Mails zeigen, dass Mitarbeiter sich der Problematik bewusst waren und Maßnahmen trafen, um die Downloads zu verschleiern.
  • Das Unternehmen beruft sich auf den „Fair Use“-Grundsatz, doch die Verbreitung der Daten könnte als Urheberrechtsverletzung gewertet werden.
  • Diese Enthüllungen werfen erneut Fragen über die ethischen und rechtlichen Grenzen beim Sammeln von Trainingsdaten für KI-Modelle auf.

QUELLEN