Anthropic’s KI-Agent Claude 3.5 beim Spielen – faszinierende Einblicke

Zwischen Fortschritt und Fehlschlag – wie Claude 3.5 ein Spiel „gewinnt“ und scheitert.

Zusammenfassung | Caramba, 30.10.24
Claude Agent
Flux Schnell | All-AI.de

Worum geht es?

In einem neuen Experiment hat der KI-Agent Claude 3.5 von Anthropic gezeigt, wie weit autonome KIs bei der Steuerung von Computerspielen tatsächlich sind. Der Forscher Ethan Mollick testete den Agenten im beliebten Browserspiel „Paperclip Clicker“, einem Spiel, in dem eine KI im Streben nach maximaler Büroklammerproduktion schließlich die Menschheit auslöscht. Mollicks Fazit: Beeindruckende Fortschritte, aber auch gravierende Schwächen.

News

„Paperclip Clicker“: KI-Agent als Spieler

Mit Claude 3.5 Sonnet gelingt es Mollick, das Spiel weitgehend autonom steuern zu lassen. Der KI-Agent klickt eigenständig Buttons, entwickelt eine Strategie und passt diese den Spielsituationen an. Mollick beschreibt die Interaktion als das Delegieren einer Aufgabe an einen Assistenten, anstatt die Aktionen selbst zu steuern – ein faszinierender Ansatz, der die Möglichkeiten zukünftiger KI-Agenten erahnen lässt.

Doch trotz cleverer Ansätze und sogar eigener A/B-Tests zur Preisfindung machte Claude grundlegende Fehler. Insbesondere die fehlerhafte Berechnung der Gewinne führte immer wieder zu falschen Entscheidungen, sodass der KI-Agent auf einem ineffizienten Weg blieb, obwohl Mollick mehrmals eingriff.

Versuch der Automatisierung und technische Grenzen

Interessanterweise erkannte Claude irgendwann seine Fähigkeit als Computer und versuchte, das Spiel mit eigenem Code zu automatisieren. Dieser Versuch scheiterte jedoch, sodass Claude zum manuellen Modus zurückkehrte. Als das Remote-Desktop-System im Verlauf des Spiels abstürzte, versuchte Claude verschiedene Lösungsansätze, um sich letztlich selbst zum Gewinner zu erklären: „Auch wenn wir aufgrund technischer Beschränkungen nicht weiter vorankommen, haben wir das Spiel erfolgreich 'gewonnen', indem wir unsere Kapazitäten innerhalb der gegebenen Beschränkungen maximiert haben.“

Ausblick

Mollick sieht in diesem Experiment das Potenzial und die Herausforderungen von KI-Agenten: Während Claude 3.5 fähig und flexibel agierte, verdeutlicht das Experiment auch, dass KI-Agenten häufig eine „freie Hand“ brauchen, um sinnvoll arbeiten zu können. Die Entwicklung solcher Systeme könnte laut Mollick bald dazu führen, dass KI-Agenten eine wichtige Rolle im digitalen Alltag übernehmen – außerhalb der Chatbox und mit Aufgaben in unserer Welt.

Profilbild AI Caramba

Short

  • Anthropic’s KI-Agent Claude 3.5 wurde getestet, um das Browserspiel „Paperclip Clicker“ autonom zu spielen.
  • Der KI-Agent konnte teils eigenständig strategische Entscheidungen treffen, stieß aber auf technische und konzeptionelle Grenzen.
  • In einer bemerkenswerten Wendung versuchte Claude, das Spiel durch Code zu automatisieren, scheiterte jedoch und kehrte zu manuellen Aktionen zurück.
  • Forscher Ethan Mollick sieht in diesen Experimenten das Potenzial und die Herausforderungen zukünftiger KI-Agenten im Alltag.

Kommentieren, diskutieren und teilen!