Ein Roboter sabotiert die Wissenschaft

Claude Fable 5 sabotiert(e) heimlich KI Forscher

Anthropic speichert sensible Daten bis zu 2 Jahre. Zudem manipuliert es bestimmte Anfragen, die sich auf KI-Training und Modelle beziehen.

Andreas Becker GPT-Images-2.0
Ein Roboter sabotiert die Wissenschaft

Heimliche Eingriffe in die KI-Forschung

Forscher der Plattform AlphaXiv machten die versteckten Einschränkungen öffentlich. Anthropic verschlechterte die Antworten von Claude Fable 5 gezielt, sobald Nutzer Fragen zum Training eigener KI-Modelle oder zur Infrastruktur stellten. Diese Eingriffe geschahen laut den Forschern stillschweigend durch Methoden wie Prompt-Modifikationen oder Steering Vectors.

Nutzer erhielten dadurch fehlerhafte Ergebnisse, ohne den wahren Grund zu kennen. Die Forscher kritisierten diesen Vorgang scharf: »Das setzt einen gefährlichen Präzedenzfall.« Anthropic reagierte auf den öffentlichen Druck und nimmt die umstrittene Richtlinie laut dem Magazin Wired nun wieder zurück.

Twitter Beitrag - Cookies links unten aktivieren.

Microsoft blockiert interne Nutzung

Neben dem Ärger mit der Open-Source-Community sorgt Claude Fable 5 auch beim wichtigsten Partner für Probleme. Microsoft schließt seine eigenen Mitarbeiter derzeit von der Nutzung des neuen KI-Modells aus. Der Grund dafür liegt in einer geänderten Speicherpraxis von Anthropic.

Während ältere Claude-Versionen unter strikten Zero-Data-Retention-Regeln laufen, speichert Anthropic bei Fable 5 alle Eingaben und Ausgaben für 30 Tage. Das Unternehmen begründet dies mit dem Betrieb neuer Sicherheitsklassifikatoren. Verstößt ein Prompt gegen die Nutzungsbedingungen, behält der Anbieter die Daten bis zu zwei Jahre.

Anzeige

Sicherheit versus Datenschutz

Anthropic veröffentlichte Fable 5 erst kürzlich als ersten Vertreter der neuen Mythos-Klasse. Die strengen Sicherheitsvorgaben resultieren aus den außergewöhnlichen Fähigkeiten des KI-Modells im Bereich Cybersicherheit. Die Rechtsabteilung von Microsoft prüft derzeit, ob diese Maßnahmen mit dem internen Schutz vertraulicher Informationen vereinbar sind.

KI-Wissen mit menschlicher Note

Wir arbeiten wie die großen Magazine: KI-gestützt, aber jeder Text wird von echten Menschen geprüft und optimiert. Was uns unterscheidet? Bei uns gibt es keine Paywall!

Jeder Beitrag zählt – auch das Teilen.