Github Datenkrake holt sich alle Daten

Github Skandal: Alle Nutzerdaten fließen bald ins KI-Training

Zukünftig dienen Code, Prompts und Kommentare der Nutzer als Trainingsmaterial. Ein manueller Widerspruch in den Einstellungen wird notwendig.

Andreas Becker Nano Banana
Github Datenkrake holt sich alle Daten

GitHub ändert die grundlegenden Nutzungsbedingungen und Datenschutzrichtlinien für seinen Programmierassistenten Copilot. Das Unternehmen wertet künftig standardmäßig Code, Kommentare und Repositories der Anwender aus, um mit diesen exklusiven Daten eigene KI-Modelle zu trainieren.

Umfassende Datenerfassung im Editor

Die anstehenden Änderungen der Richtlinien betreffen Millionen von Entwicklern weltweit. Die Microsoft-Tochter greift bald auf tiefgreifende Interaktionsdaten zu, um das Fine-Tuning der genutzten KI-Modelle voranzutreiben. Die Erfassung beschränkt sich dabei nicht nur auf fertige Skripte und Dokumentationen.

Folgende Informationen zieht das System künftig für das Training heran:

  • Direkte Code-Eingaben im Editor
  • Begleitende Kommentare der Programmierer
  • Strukturdaten aus den angebundenen Repositories
  • Jeder abgesetzte Prompt an Copilot

Die aufbereiteten Datensätze fließen im Anschluss direkt in das Training der KI-Modelle. GitHub nutzt diese weitreichenden Informationen, um das Verständnis der Systeme für komplexe Zusammenhänge und spezifische Programmiersprachen kontinuierlich zu schärfen.

Anzeige

Auswirkungen auf die Privatsphäre

Bislang blockierte die Plattform den automatisierten Zugriff auf diese sensiblen Nutzerdaten bei den meisten Standard-Accounts. Mit der aktuellen Aktualisierung dreht der Konzern diese Logik komplett um. Die gesammelten Telemetrie- und Inhaltsdaten der Anwender dienen dann als fundamentales Trainingsmaterial für kommende Modell-Generationen.

Wer seinen Quellcode vor diesem automatisierten Auslesen schützen möchte, muss aktiv in den Account-Einstellungen widersprechen. Ein einfacher Opt-out-Prozess soll laut offiziellen Angaben verhindern, dass eigene Projekte in die Trainingsdatenbanken gelangen. Die neuen Richtlinien treten in wenigen Wochen offiziell in Kraft. Entwickler behalten bis zu diesem Stichtag (24. April) die Möglichkeit, ihre Privatsphäre-Optionen entsprechend der neuen Sachlage anzupassen.

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.