Das KI-Modell Fugo Ultra greift Claude Fable 5 an
Das Start-up Sakana AI nutzt einen cleveren Multi-Agenten-Pool. Komplexe Aufgaben werden völlig autonom aufgeteilt und gelöst.

Das japanische Start-up Sakana AI hat mit Sakana Fugu ein Sprachmodell veröffentlicht, das als Multi-Agenten-Orchestrator agiert. Über eine Programmierschnittstelle koordiniert es dynamisch einen Pool spezialisierter Sprachmodelle. Die Variante Fugu Ultra erreicht das Niveau führender Spitzenmodelle.
Dynamische Orchestrierung im Hintergrund
Das neue Sprachmodell von Sakana AI ruft eigenständig spezialisierte Sprachmodelle aus einem flexiblen Agenten-Pool auf. Bei eingehenden Anfragen entscheidet Fugu selbstständig, ob es die Aufgabe direkt löst oder ein Team aus Experten-Modellen zusammenstellt. Die Auswahl, Delegation, Verifikation und Synthese der Teilergebnisse erfolgen vollständig intern, sodass der Nutzer über eine einzige OpenAI-kompatible Programmierschnittstelle auf die gesammelte Leistung zugreift.
Das technologische Fundament basiert auf den Forschungsarbeiten »Trinity« und »The Conductor«, die auf der Fachkonferenz ICLR 2026 vorgestellt wurden. Statt auf starre, vordefinierte Abläufe setzt Sakana AI auf gelernte Koordination. Dadurch verbessert sich die Leistungsfähigkeit des Orchestrator-Modells automatisch, sobald neue Sprachmodelle in den zugrundeliegenden Pool integriert werden.
Quelle: Sakana
Zwei Modellvarianten für die Praxis
Sakana AI bietet den Orchestrator in zwei Ausführungen an, um unterschiedliche Anforderungen an Geschwindigkeit und Detailtiefe abzudecken. Das Basismodell Fugu ist auf geringe Latenzzeiten optimiert und eignet sich für alltägliche Aufgaben wie die Überprüfung von Quelltexten oder interaktive Chatbot-Dienste. Unternehmen mit strengen Compliance-Vorgaben können bei diesem Modell gezielt einzelne Anbieter oder Sprachmodelle aus dem verfügbaren Pool ausschließen.
Für komplexe, mehrstufige Problemstellungen ist hingegen Fugu Ultra konzipiert. Dieses Modell nutzt einen tieferen Pool spezialisierter Agenten, um ein Höchstmaß an Genauigkeit zu gewährleisten. Erste Testnutzer setzten das Modell bereits für wissenschaftliche Arbeiten, Patentrecherchen sowie detaillierte Analysen im Bereich der Cybersicherheit ein. In internen Experimenten übertraf Fugu Ultra etablierte Spitzenmodelle zudem bei der Vorhersage von Finanzzeitreihen und der Analyse mechanischer Konstruktionen.
Starke Ergebnisse in Benchmark-Tests
In den veröffentlichten Leistungstests positioniert sich Fugu Ultra auf Augenhöhe mit führenden Modellen wie Fable 5 oder Mythos Preview von Anthropic. Im anspruchsvollen Testverfahren »SWE Bench Pro« erzielt Fugu Ultra einen Wert von 73,7 Punkten, während das Basismodell Fugu auf 59,0 Punkte kommt. Zum Vergleich: Das etablierte Modell Opus 4.8 erreicht hier 69,2 Punkte, Gemini 3.1 Pro liegt bei 54,2 Punkten und GPT 5.5 dokumentiert 58,6 Punkte.
Auch in anderen Kategorien wie »LiveCodeBench Pro« mit 90,8 Punkten oder »GPQA-D« mit 95,5 Punkten behauptet sich das Spitzenmodell von Sakana AI im vorderen Feld. Bemerkenswert ist dabei, dass sich die genannten Spitzenmodelle von Anthropic selbst gar nicht im Agenten-Pool von Fugu befinden, da sie nicht öffentlich zugänglich sind. Berichte aus der Praxis untermauern diese Zahlen: Ein Softwareentwickler hob hervor, dass Fugu Ultra bei einer Code-Überprüfung mehr als zwanzig Fehler aufdeckte, wo andere Modelle lediglich drei Probleme erkannten.
Strategischer Schutz vor Abhängigkeiten
Neben den reinen Leistungswerten positioniert das in Tokio ansässige Start-up das Modell als strategische Absicherung gegen die Abhängigkeit von einzelnen Technologieanbietern. Sakana AI verweist hierbei auf aktuelle Exportkontrollen, die den Zugriff auf Anthropics Spitzenmodelle Fable und Mythos reglementieren. Solche regulatorischen oder außenpolitischen Verschiebungen können den Zugang zu kritischen Infrastrukturen über Nacht einschränken oder blockieren.
Da der Agenten-Pool von Fugu vollständig austauschbar ist, kann das Modell bei Ausfällen oder Sperren eines Anbieters die Anfragen dynamisch auf andere verfügbare Sprachmodelle umleiten. Diese Resilienz soll Organisationen und Ländern helfen, ihre digitale Souveränität zu wahren, ohne auf Spitzenleistungen verzichten zu müssen. Beide Modellvarianten stehen über eine einheitliche Programmierschnittstelle im Abonnement oder über eine nutzungsbasierte Abrechnung bereit.


