Google DeepMind knackt 56 Jahre alte Rätsel

AlphaProof Nexus beweist ungelöste Probleme der Mathematik. Es arbeitet fehlerfrei dank ständiger Code Überprüfung.

Andreas Becker25.05.26 GPT-Images-2.0

Kurzfassung Quellen

Google DeepMinds KI-Modell AlphaProof Nexus hat neun seit Jahrzehnten ungelöste Erdős-Probleme bewiesen.
Die Kombination aus dem Sprachmodell Gemini 3.1 Pro und dem Lean-Compiler verhindert Logikfehler automatisch.
Ein erfolgreicher mathematischer Beweis kostet die Entwickler nur wenige hundert US-Dollar an reiner Rechenleistung.
Die Studie zeigt, dass einfache Feedback-Schleifen der KI-Modelle zunehmend komplexe Spezialarchitekturen einholen.

Google DeepMind hat mit AlphaProof Nexus ein KI-Modell präsentiert, das neun ungelöste Erdős-Probleme der Mathematik selbstständig bewiesen hat. Die Architektur kombiniert das Sprachmodell Gemini 3.1 Pro mit der Verifizierungssprache Lean und filtert so Logikfehler automatisch heraus. Einige der gelösten Aufgaben galten seit 56 Jahren als offene Fragen der Forschung.

Compiler verhindert mathematische Halluzinationen

Große KI-Modelle erzeugen bei komplexen Beweisen häufig subtile Denkfehler, die von Experten aufwendig korrigiert werden müssen. AlphaProof Nexus löst dieses Problem durch einen formalen Filter. Das KI-Modell formuliert seine Lösungsansätze in Lean, woraufhin ein Compiler jeden einzelnen logischen Schritt direkt auf Korrektheit prüft.

Wenn das KI-Modell einen Beweis erfindet, der in der Fachliteratur nicht existiert, schlägt der Code-Check sofort fehl. Erst wenn der Lean-Compiler den gesamten Beweis ohne Fehlermeldung akzeptiert, ist die Aufgabe gelöst. Dadurch fungiert das KI-Modell gleichzeitig als Lösungsfinder und diagnostisches Instrument, das Ungenauigkeiten in bestehenden Problemstellungen erkennt.

Quelle: Google - Funktionsweise

Geringe Kosten und einfache Architektur

Die Forscher testeten die KI an 353 Erdős-Problemen sowie an 492 ungelösten Vermutungen der Online Encyclopedia of Integer Sequences (OEIS). AlphaProof Nexus lieferte neben den neun Erdős-Lösungen auch 44 gültige OEIS-Beweise. Die Rechenkosten für einen erfolgreichen Beweis beliefen sich auf lediglich wenige hundert US-Dollar.

Die Studie zeigt eine interessante Entwicklung im Aufbau aktueller KI-Modelle auf. Eine simple Basisversion, die nur zwischen Prompting und Compiler-Feedback wechselte, konnte alle neun Erdős-Beweise reproduzieren. Die aufwendige Vollversion mit evolutionärer Suche und zusätzlichen AlphaProof-Komponenten brachte nur bei den extrem schwierigen Aufgaben einen statistischen Vorteil.

Neben den klassischen Beweisen entdeckte das KI-Modell auch einen neuen algorithmischen Parameter in der Optimierungstheorie. Dieser war menschlichen Forschern bisher verborgen geblieben. Die Ergebnisse deuten darauf hin, dass einfache Feedback-Schleifen zunehmend mit spezialisierten Architekturen konkurrieren können.

Quelle: Google - Beispielausgabe

Starke Abhängigkeit von Lean-Bibliotheken

Die Fähigkeiten des KI-Modells unterliegen jedoch klaren technischen Begrenzungen. Erfolge verzeichnet das Projekt primär in der Kombinatorik, der Optimierung und der Zahlentheorie. In diesen Fachbereichen ist die mathematische Bibliothek von Lean bereits sehr ausgereift und bietet dem KI-Modell eine solide Basis.

Fehlt diese Vorarbeit, stößt die KI an ihre Grenzen. Aufgaben, die den Aufbau umfangreicher neuer Theorien erfordern, bleiben vorerst außerhalb der Reichweite. Die Mehrheit der 353 getesteten Erdős-Probleme konnte AlphaProof Nexus daher noch nicht knacken. Das Projekt zeigt dennoch präzise, wie formale Verifizierung die Zuverlässigkeit von KI-Modellen in der Forschung messbar erhöht.