Claude führt zwei neue geniale Funktionen ein

Anthropic bringt für Claude Agents die »Dreaming« und »Outcomes« Funktion und verbessert damit die Benchmarks deutlich.

Andreas Becker06.05.26 Nano Banana

Kurzfassung Quellen

Nach vorherigen Leaks hat Anthropic die Funktion »Dreaming« für Claude Managed Agents offiziell veröffentlicht.
KI-Modelle analysieren damit im Hintergrund vergangene Konversationen, um typische Muster zu erkennen und ihr Gedächtnis zu optimieren.
Eine neue Qualitätskontrolle namens Outcomes prüft generierte Ergebnisse zudem über ein separates Modell nach strengen Kriterien auf Richtigkeit.
Zusätzlich lassen sich komplexe Aufgaben künftig über eine Orchestrierung auf mehrere parallel arbeitende Sub-Agenten aufteilen.

Nach wochenlangen Spekulationen um einen Leak ist die Funktion »Dreaming« für Claude nun offiziell bestätigt. Anthropic integriert das neue Gedächtnissystem in seine Managed Agents, womit die KI-Modelle Muster aus vergangenen Sitzungen analysieren und sich selbstständig verbessern.

Automatisierte Selbstreflexion durch Dreaming

Im Hintergrund durchsucht das neue Konzept abgelaufene Konversationen und Speicherstände. Dabei extrahiert das Modell wiederkehrende Arbeitsabläufe oder typische Fehler. Darüber legen Entwickler fest, ob die KI-Modelle diesen Lernprozess vollautomatisch im Speicher ablegen oder eine manuelle Freigabe verlangen.

Im Zusammenspiel mit dem regulären Gedächtnis entsteht so eine dynamische Wissensdatenbank. Während ein Agent im laufenden Betrieb Informationen sammelt, verfeinert die Dreaming-Funktion diese Daten in den Ruhephasen. Das hält den Kontext für langfristige Aufgaben präzise.

Quelle: Anthropic

Strenge Qualitätskontrolle mit Outcomes

Neben dem Langzeitgedächtnis führt der Anbieter eine neue Bewertungsfunktion namens »Outcomes« ein. Dafür definieren Entwickler einen genauen Maßstab für erfolgreiche Antworten. Anschließend prüft ein separates Modell das Ergebnis in einem eigenen Kontextfenster.

Erfüllt die generierte Antwort die Kriterien nicht, benennt die Kontrollinstanz die Fehlerquellen. Daraufhin unternimmt der Agent einen neuen Versuch. Interne Benchmarks belegen diesen Effekt: Bei der Erstellung von Präsentationen stieg die Erfolgsquote um 10,1 Prozent, bei Textdokumenten um 8,4 Prozent gegenüber einfachen Prompting-Schleifen.

Arbeitsteilung unter KI-Modellen

Für besonders umfangreiche Aufträge steht nun die sogenannte Multiagent Orchestration bereit. Dabei zerlegt ein Haupt-Agent komplexe Anfragen in kleine Einzelschritte. Diese Teilaufgaben delegiert er an spezialisierte Sub-Agenten, die parallel auf einem gemeinsamen Dateisystem arbeiten.

Ein Einsatzbeispiel liefert das Unternehmen Spiral, welches ein kleines Modell für die Kommunikation nutzt. Die eigentliche Textproduktion übernehmen dann mehrere große KI-Modelle gleichzeitig im Hintergrund. Über den finalen Abschluss des gesamten Prozesses informiert am Ende ein Webhook.