Arena macht mit KI Benchmarks 100 Millionen Dollar Umsatz
Aus einem Studentenprojekt wurde rasend schnell ein hochprofitables Business. Entwickler reißen sich um die echten Nutzerdaten.

Arena.ai hat acht Monate nach dem Start seines B2B-Angebots einen hochgerechneten Jahresumsatz von 100 Millionen US-Dollar erreicht. Die Plattform für KI-Benchmarks verkauft mittlerweile tiefgehende Leistungsanalysen direkt an KI-Unternehmen. Das verdeutlicht den extremen finanziellen Wert echter Nutzerdaten bei der Nachjustierung aktueller Modelle.
Vom akademischen Projekt zum Datenlieferanten
Arena startete 2023 als Forschungsprojekt an der UC Berkeley. Die Gründer Anastasios Angelopoulos, Wei-Lin Chiang und Ion Stoica bauten ein Leaderboard auf, das KI-Modelle durch einfache Nutzerabstimmungen bewertet. Besucher der Website geben einen Text ein, erhalten zwei anonyme Antworten und wählen die bessere aus.
Dieses simple Prinzip generierte bisher über 82 Millionen Stimmen aus knapp 700 Millionen Unterhaltungen. Im September 2025 führte Arena auf dieser Basis den Dienst »AI Evaluations« ein.
Anzeige
Millionenumsätze durch Verbrauchsabrechnung
Während das öffentliche Leaderboard weiterhin kostenlos bleibt, zahlen Entwickler für detaillierte Auswertungen der Community-Daten. Die Abrechnung erfolgt dabei nach tatsächlichem Verbrauch, nicht über klassische Abonnements.
Das finanzielle Wachstum verlief seit der Kommerzialisierung steil. Noch im Januar 2026 lag der hochgerechnete Jahresumsatz bei 30 Millionen US-Dollar. Zu diesem Zeitpunkt schloss Arena eine Series-A-Finanzierungsrunde über 150 Millionen US-Dollar ab und erreichte eine Bewertung von 1,7 Milliarden US-Dollar.
Autonome Agenten im Fokus
Mittlerweile verändern sich die Anforderungen an solche Benchmarks, da einfache Chatbots zunehmend von autonom agierenden KI-Agenten abgelöst werden. Arena hat darauf im Mai 2026 mit dem »Agent Mode« reagiert.
Quelle: arena.ai
Dieser testet Modelle bei mehrstufigen Arbeitsabläufen. Er misst gezielt, wie gut sie vorgegebene Ziele erreichen, auf Feedback reagieren und Halluzinationen vermeiden. Der Modus verzeichnet bereits über fünf Millionen Interaktionen pro Monat und wächst wöchentlich um zehn Prozent.
Arena tritt durch diese Auswertungen in direkte Konkurrenz zu Start-ups wie Scale AI oder Mercor. Diese Firmen liefern den KI-Unternehmen ebenfalls Trainingsdaten für die nachträgliche Modelloptimierung.
