Google DeepMind: 200.000 Dollar für AGI-Tests

Entwickler entwerfen neue kognitive Benchmarks für Sprachmodelle. Der Wettbewerb bietet einen Preispool von 200.000 US-Dollar.

Andreas Becker17.03.26 Nano Banana

Kurzfassung Quellen

Google DeepMind startet einen globalen Hackathon auf der Plattform Kaggle mit einem Preisgeld von 200.000 US-Dollar.
Teilnehmer müssen neue Benchmarks für fünf kognitive Schwachstellen von Sprachmodellen entwickeln, darunter Metakognition und Aufmerksamkeit.
Der Wettbewerb verlangt ein hohes Tempo und endet bereits am 16. April 2026 mit der finalen Einreichung der Tests.
Ein besonderes Merkmal ist die Bewertungsphase, in der die Entwickler die Benchmarks der Konkurrenz auch gegenseitig prüfen.

Die Bewertung von künstlicher Intelligenz erfordert neue Maßstäbe. Google DeepMind präsentiert ein kognitives Framework, das den Fortschritt zur Artificial General Intelligence (AGI) präzise misst. Gleichzeitig startet das Unternehmen einen Kaggle-Hackathon für dynamische Benchmarks.

Intelligenz präzise messen

Bisherige Tests für große Sprachmodelle stoßen zunehmend an ihre Grenzen. Ein bestandener Test belegt oft nur eine gigantische Datenspeicherung, beweist aber kein echtes Verständnis. Das neue kognitive Framework von Google DeepMind verschiebt den Fokus deshalb von der reinen Wissensabfrage auf spezifische kognitive Fähigkeiten.

Das Konzept rückt die tatsächliche Problemlösung in den Mittelpunkt. Im Fokus steht, wie ein Modell lernt, eigenständig schlussfolgert und sich an völlig neue Situationen anpasst. Dafür unterteilt das Framework verschiedene intellektuelle Fähigkeiten in klare Stufen. So erkennen Forscher exakt, an welchen komplexen Zusammenhängen das Reasoning noch scheitert. Der Ansatz trennt strikt zwischen der bloßen Leistung bei einer Einzelaufgabe und der allgemeinen Anpassungsfähigkeit einer KI.

Quelle: Google

Fokus auf fünf Kernbereiche

Ein theoretisches Konzept benötigt praktische Prüfverfahren. Google DeepMind lagert die Entwicklung der konkreten Tests deshalb an die globale Entwickler-Community aus und nutzt dafür die neue Community-Benchmarks-Plattform von Kaggle.

Kaggle definiert die Anforderungen an die Data Scientists klar. Sie entwickeln neue Evaluationsmethoden für fünf spezifische kognitive Fähigkeiten, bei denen Sprachmodelle aktuell die größten Schwächen zeigen. Dazu gehören das Lernen selbst, die Metakognition, die Aufmerksamkeit, die exekutiven Funktionen sowie die soziale Kognition.

Diese fünf Bereiche bilden das Fundament für eine echte künstliche allgemeine Intelligenz. Entwickler testen ihre neuen Capability-Benchmarks direkt gegen aktuelle Modelle. Diese offene Strategie verhindert, dass ein einzelnes Unternehmen die Kriterien allein diktiert.

Straffer Zeitplan und hohes Preisgeld

Für die Entwicklung der Tests lobt Google DeepMind einen Preispool von insgesamt 200.000 US-Dollar aus. Der Wettbewerb verlangt ein hohes Tempo von den Teilnehmern und folgt einem strikten Ablauf:

März 2026: Offizieller Startschuss des Hackathons.
April 2026: Letzte Frist für die finalen Einreichungen der Benchmarks.
April bis 31. Mai 2026: Hauptphase der Bewertung.
Mai 2026: Deadline für Teilnehmer, um die Tests der Konkurrenz zu bewerten.
Juni 2026: Geplante Bekanntgabe der offiziellen Ergebnisse.

Kaggle behält sich vor, die Bewertungsphase je nach Anzahl der Einreichungen flexibel anzupassen. Das resultierende System liefert der gesamten Tech-Branche dann einen dynamischen Standard. Forscher und Entwickler erhalten ein präzises Instrument, um den tatsächlichen Fortschritt in Richtung AGI objektiv zu dokumentieren.