Ein Roboter hat die Weltformel gefunden

OpenAI stellt KI vor die schwerste Mathematik-Aufgabe der Welt

Der First Proof Test prüft künstliche Intelligenz mit völlig neuen Problemen auf Forschungsniveau, fernab von bekannten Trainingsdaten.

Andreas Becker Nano Banana
Ein Roboter hat die Weltformel gefunden

OpenAI hat offizielle Lösungsversuche für den neuen "First Proof"-Wettbewerb veröffentlicht. Dieser Test konfrontiert künstliche Intelligenz gezielt mit ungelösten mathematischen Problemen auf Forschungsniveau, um die tatsächlichen Fähigkeiten im logischen Denken abseits bekannter Trainingsdaten zu überprüfen.

Abkehr vom reinen Auswendiglernen

Der "First Proof"-Test unterscheidet sich grundlegend von bisherigen Benchmarks in der Informatik. Eine Gruppe renommierter Mathematiker hat exklusiv für diese Prüfung komplexe Aufgaben entworfen, die in keiner wissenschaftlichen Datenbank existieren.

Dieses Vorgehen schließt einen entscheidenden Faktor aktueller KI-Modelle aus. Bisherige Sprachmodelle schließen oft erfolgreich bei mathematischen Standardproblemen ab, da sie die Lösungswege während der Trainingsphase verarbeitet und gespeichert haben. Bei "First Proof" fehlt diese Datengrundlage komplett.

Die Systeme müssen folglich echtes Reasoning anwenden. Sie müssen selbstständig tiefgreifende logische Schlüsse ziehen und fehlerfreie formale Beweise über mehrere Schritte hinweg konstruieren.

Anzeige

“We’re currently training a new model for which a primary focus is increasing the level of rigor in its thinking, with the goal that the model can think continuously for many hours and remain highly confident in its conclusions. When the First Proof problems were announced, it seemed like the perfect testbed, so over the weekend I tried it out. Already it was able to solve two of the problems (#9 and #10). As it trained, it became increasingly capable, eventually solving–in our estimation–at least three more. We were particularly pleased when it solved #6 and then, two days later, #4, as those problems were from fields familiar to many of us. It’s pretty incredible to watch a model get tangibly smarter day by day.”

Ungeprüfte Lösungsansätze

OpenAI dokumentiert in den veröffentlichten Dokumenten den genauen Lösungsweg der eigenen Modelle. Das Unternehmen geht dabei davon aus, bei einigen der hochkomplexen Probleme sehr wahrscheinlich korrekte mathematische Beweise gefunden zu haben.

Diese Selbsteinschätzung bleibt vorerst unbestätigt. Eine unabhängige und formale Verifikation der eingereichten Beweise durch die Initiatoren des "First Proof"-Projekts steht aktuell noch aus. Dennoch diskutiert die mathematische Fachwelt die publizierten Lösungswege bereits im Detail, um Schwachstellen oder tatsächliche Durchbrüche in der Argumentationskette der KI zu identifizieren.

Mathematik gilt in der KI-Forschung als der ultimative Härtetest für kognitive Fähigkeiten. Ein Bestehen solcher Prüfungen markiert einen nachvollziehbaren Schritt von der reinen Mustererkennung hin zu Systemen mit echter Problemlösungskompetenz.

Anzeige

KI-Wissen ohne Paywall

Unsere Inhalte sind und bleiben kostenlos. Wenn dir unsere News und Tutorials gefallen oder weiterhelfen, freuen wir uns über eine kleine Unterstützung.

Jeder Beitrag zählt – auch das Teilen.