Claude führt zwei neue geniale Funktionen ein
Anthropic bringt für Claude Agents die »Dreaming« und »Outcomes« Funktion und verbessert damit die Benchmarks deutlich.

Nach wochenlangen Spekulationen um einen Leak ist die Funktion »Dreaming« für Claude nun offiziell bestätigt. Anthropic integriert das neue Gedächtnissystem in seine Managed Agents, womit die KI-Modelle Muster aus vergangenen Sitzungen analysieren und sich selbstständig verbessern.
Automatisierte Selbstreflexion durch Dreaming
Im Hintergrund durchsucht das neue Konzept abgelaufene Konversationen und Speicherstände. Dabei extrahiert das Modell wiederkehrende Arbeitsabläufe oder typische Fehler. Darüber legen Entwickler fest, ob die KI-Modelle diesen Lernprozess vollautomatisch im Speicher ablegen oder eine manuelle Freigabe verlangen.
Im Zusammenspiel mit dem regulären Gedächtnis entsteht so eine dynamische Wissensdatenbank. Während ein Agent im laufenden Betrieb Informationen sammelt, verfeinert die Dreaming-Funktion diese Daten in den Ruhephasen. Das hält den Kontext für langfristige Aufgaben präzise.
Quelle: Anthropic
Strenge Qualitätskontrolle mit Outcomes
Neben dem Langzeitgedächtnis führt der Anbieter eine neue Bewertungsfunktion namens »Outcomes« ein. Dafür definieren Entwickler einen genauen Maßstab für erfolgreiche Antworten. Anschließend prüft ein separates Modell das Ergebnis in einem eigenen Kontextfenster.
Erfüllt die generierte Antwort die Kriterien nicht, benennt die Kontrollinstanz die Fehlerquellen. Daraufhin unternimmt der Agent einen neuen Versuch. Interne Benchmarks belegen diesen Effekt: Bei der Erstellung von Präsentationen stieg die Erfolgsquote um 10,1 Prozent, bei Textdokumenten um 8,4 Prozent gegenüber einfachen Prompting-Schleifen.
Anzeige
Arbeitsteilung unter KI-Modellen
Für besonders umfangreiche Aufträge steht nun die sogenannte Multiagent Orchestration bereit. Dabei zerlegt ein Haupt-Agent komplexe Anfragen in kleine Einzelschritte. Diese Teilaufgaben delegiert er an spezialisierte Sub-Agenten, die parallel auf einem gemeinsamen Dateisystem arbeiten.
Ein Einsatzbeispiel liefert das Unternehmen Spiral, welches ein kleines Modell für die Kommunikation nutzt. Die eigentliche Textproduktion übernehmen dann mehrere große KI-Modelle gleichzeitig im Hintergrund. Über den finalen Abschluss des gesamten Prozesses informiert am Ende ein Webhook.

