Claude Mythos löst alle Angriffssimulationen und ist bald »dumm«

Neue Testreihen belegen einen rapiden Leistungsanstieg bei der automatisierten Suche nach kritischen Schwachstellen.

Andreas Becker14.05.26 GPT-Images-2.0

Kurzfassung Quellen

Das britische AI Security Institute stellt fest, dass sich die autonomen Cyberfähigkeiten von KI-Modellen mittlerweile rasant alle 4,7 Monate verdoppeln.
Besonders Claude Mythos Preview und GPT-5.5 übertreffen bisherige Leistungstrends deutlich und knacken hochkomplexe Angriffssimulationen in Rekordzeit.
Unabhängige Tests bestätigen die enorme Präzision von Mythos Preview bei der Quellcode-Analyse, kritisieren jedoch die extrem hohen Betriebskosten im Vergleich zur Konkurrenz.

Die autonomen Cyberfähigkeiten künstlicher Intelligenz wachsen deutlich schneller als erwartet laut dem britischen AI Security Institute. In aktuellen Evaluierungen löste das KI-Modell Claude Mythos Preview erstmals vollständige Angriffssimulationen auf Unternehmensnetzwerke. Die Technologie übertrifft bisherige Prognosen zur Leistungssteigerung um Längen.

Beschleunigtes Lerntempo bei Hacker-Aufgaben

Regelmäßig testet das britische AI Security Institute die Grenzen moderner KI-Modelle. Im November 2025 gingen die Prüfer noch von einer Verdopplungszeit der Cyberfähigkeiten alle acht Monate aus. Nur drei Monate später korrigierte die Behörde diesen Wert auf lediglich 4,7 Monate.

Neue Schwergewichte wie Claude Mythos Preview von Anthropic oder OpenAIs GPT-5.5 sprengen nun selbst diesen beschleunigten Trend. In sechs von zehn Versuchen durchlief ein aktualisierter Checkpoint von Mythos Preview einen kompletten 32-stufigen Angriff auf ein fiktives Firmennetzwerk. Zudem meisterte die KI als erstes Modell überhaupt eine anspruchsvolle Simulation für industrielle Steuerungssysteme.

Quelle: aisi.gov.uk

Brillante Code-Analyse trifft auf hohes Preisschild

Mit unabhängigen Tests untermauert das Sicherheitsunternehmen XBOW die enormen Fähigkeiten von Mythos Preview. Besonders beim Lesen von Quellcode glänzt das Modell mit beispielloser Präzision. Im direkten Vergleich mit älteren Versionen übersah die KI glatt 55 Prozent weniger versteckte Schwachstellen.

Die richtigen Rahmenbedingungen benötigt das System allerdings zwingend. Für komplexe Angriffe reicht die reine Erkennung von fehlerhaftem Code im Textformat oft nicht aus. Ohne die interaktive Anbindung an ein laufendes System sinkt die Trefferquote von Mythos Preview signifikant.

Auf der wirtschaftlichen Seite offenbarte die Untersuchung gleichzeitig eine klare Schwäche. Mythos Preview kostet voraussichtlich fünfmal mehr als die ohnehin schon teuren Vorgängermodelle. Rechnet man die Erkennungsleistung auf die anfallenden Betriebskosten um, verlieren die Ergebnisse etwas an Glanz. Ein flexibler KI-Agent, der auf das kostengünstigere GPT-5.5 zurückgreift und mehr Zeit für Lösungswege erhält, liefert in der Praxis häufig wirtschaftlichere Resultate.

Vorbereitung auf noch stärkere Systeme

In wenigen Wochen stießen Sicherheitsexperten trotz dieser Einschränkungen mit dem neuen Anthropic-Modell auf tausende kritische Schwachstellen in echten Netzwerken. Das entspricht oft der doppelten Menge dessen, was professionelle Teams sonst in einem ganzen Jahr entdecken.

Überraschend nüchtern ordnen die Verantwortlichen hinter der Technologie den aktuellen Erfolg ein. Als Leiter des internen Red-Teamings bei Anthropic sieht Logan Graham in dem System nur einen temporären Höhepunkt. »Innerhalb eines Jahres wird Mythos wahrscheinlich ziemlich dumm aussehen«, formuliert er provokant. Daher bereitet sich die Fachwelt bereits auf künftige KI-Modelle vor, die menschliche Experten in naher Zukunft noch deutlicher übertreffen werden.