In einer Arena kämpfen zwei Maschinen gegeneinander

Arena macht mit KI Benchmarks 100 Millionen Dollar Umsatz

Aus einem Studentenprojekt wurde rasend schnell ein hochprofitables Business. Entwickler reißen sich um die echten Nutzerdaten.

Andreas Becker GPT-Images-2.0
In einer Arena kämpfen zwei Maschinen gegeneinander

Arena.ai hat acht Monate nach dem Start seines B2B-Angebots einen hochgerechneten Jahresumsatz von 100 Millionen US-Dollar erreicht. Die Plattform für KI-Benchmarks verkauft mittlerweile tiefgehende Leistungsanalysen direkt an KI-Unternehmen. Das verdeutlicht den extremen finanziellen Wert echter Nutzerdaten bei der Nachjustierung aktueller Modelle.

Vom akademischen Projekt zum Datenlieferanten

Arena startete 2023 als Forschungsprojekt an der UC Berkeley. Die Gründer Anastasios Angelopoulos, Wei-Lin Chiang und Ion Stoica bauten ein Leaderboard auf, das KI-Modelle durch einfache Nutzerabstimmungen bewertet. Besucher der Website geben einen Text ein, erhalten zwei anonyme Antworten und wählen die bessere aus.

Dieses simple Prinzip generierte bisher über 82 Millionen Stimmen aus knapp 700 Millionen Unterhaltungen. Im September 2025 führte Arena auf dieser Basis den Dienst »AI Evaluations« ein.

Anzeige

Millionenumsätze durch Verbrauchsabrechnung

Während das öffentliche Leaderboard weiterhin kostenlos bleibt, zahlen Entwickler für detaillierte Auswertungen der Community-Daten. Die Abrechnung erfolgt dabei nach tatsächlichem Verbrauch, nicht über klassische Abonnements.

Das finanzielle Wachstum verlief seit der Kommerzialisierung steil. Noch im Januar 2026 lag der hochgerechnete Jahresumsatz bei 30 Millionen US-Dollar. Zu diesem Zeitpunkt schloss Arena eine Series-A-Finanzierungsrunde über 150 Millionen US-Dollar ab und erreichte eine Bewertung von 1,7 Milliarden US-Dollar.

Autonome Agenten im Fokus

Mittlerweile verändern sich die Anforderungen an solche Benchmarks, da einfache Chatbots zunehmend von autonom agierenden KI-Agenten abgelöst werden. Arena hat darauf im Mai 2026 mit dem »Agent Mode« reagiert.

Quelle: arena.ai

Dieser testet Modelle bei mehrstufigen Arbeitsabläufen. Er misst gezielt, wie gut sie vorgegebene Ziele erreichen, auf Feedback reagieren und Halluzinationen vermeiden. Der Modus verzeichnet bereits über fünf Millionen Interaktionen pro Monat und wächst wöchentlich um zehn Prozent.

Arena tritt durch diese Auswertungen in direkte Konkurrenz zu Start-ups wie Scale AI oder Mercor. Diese Firmen liefern den KI-Unternehmen ebenfalls Trainingsdaten für die nachträgliche Modelloptimierung.

KI-Wissen mit menschlicher Note

Wir arbeiten wie die großen Magazine: KI-gestützt, aber jeder Text wird von echten Menschen geprüft und optimiert. Was uns unterscheidet? Bei uns gibt es keine Paywall!

Jeder Beitrag zählt – auch das Teilen.