Alibaba Roboter sucht

Alibaba erfindet KI-Training neu - ganz ohne Google!

Mit ZeroSearch ersetzt Alibaba die Websuche durch Simulation - spart bis zu 88 % Kosten und bringt mehr Kontrolle ins Spiel?

Alibaba Roboter sucht
Flux Schnell | All-AI.de

EINLEITUNG

Websuche war bisher ein teurer, aber zentraler Bestandteil beim Training von KI-Modellen, die Fragen beantworten sollen. Mit ZeroSearch bricht Alibaba nun mit dieser Konvention: Statt Google oder Bing zu nutzen, setzt das Forschungsteam auf eine radikale Idee – künstlich simulierte Suchergebnisse. Kann das wirklich funktionieren? Und was bedeutet das für die Zukunft des KI-Trainings?

NEWS

Suchen ohne zu suchen

ZeroSearch ist ein Trainingsverfahren, das auf den ersten Blick paradox klingt: Eine KI lernt zu suchen, ohne jemals eine echte Suchmaschine zu nutzen. Möglich wird das durch ein zweites Sprachmodell, das auf Anfragen hin künstliche Suchergebnisse erzeugt – mal hilfreich, mal irreführend, aber stets unter Kontrolle des Forschungsteams.

Das eigentliche Modell muss dann entscheiden: Brauche ich eine Suche? Wie formuliere ich sie? Und was mache ich mit den Ergebnissen? Bewertet wird die Qualität der Antworten mittels Reinforcement Learning. Das klingt technisch, bringt aber einen Vorteil, den viele in der Branche dringend suchen: Unabhängigkeit.

Trainiert wird mit Absicht am Chaos

ZeroSearch geht noch einen Schritt weiter. Die Qualität der simulierten Suchergebnisse wird im Verlauf des Trainings systematisch verschlechtert. Die Idee dahinter: Wenn ein Modell lernt, aus unvollständigen oder widersprüchlichen Informationen sinnvolle Schlüsse zu ziehen, wird es robuster – wie ein Mensch, der sich durch Foren, Newsartikel und Social-Media-Posts kämpft. So entsteht ein realistisches Suchumfeld – ohne je das Internet zu betreten.

Billiger, planbarer, stabiler

Der Vergleich mit klassischen API-basierten Trainings zeigt, wie groß das Einsparpotenzial ist: 64.000 Suchanfragen über SerpAPI kosten rund 586 Dollar. Das Training mit dem Simulationsmodell auf vier A100-Grafikkarten dagegen nur 71 Dollar. Eine Reduktion um fast 90 Prozent – bei gleichzeitiger Kontrolle über Stil, Inhalt und Schwierigkeitsgrad der Daten.

Für viele Entwickler dürfte das ein Gamechanger sein. Vor allem, weil ZeroSearch nicht nur günstiger, sondern auch konsistenter arbeitet: Keine Downtimes, keine API-Limits, keine plötzlichen Änderungen im Suchalgorithmus.

Benchmark-Ergebnisse zeigen: Die Methode funktioniert

Getestet wurde ZeroSearch auf bekannten QA-Datensätzen wie TriviaQA und HotpotQA. Das Ergebnis: Die Modelle schnitten mindestens gleich gut ab wie Systeme, die auf echte Google-Suchen zurückgreifen. Besonders stark war das Setup, wenn das Simulationsmodell speziell auf seine Aufgabe trainiert wurde – einfaches Prompten reichte nicht.

Sogar kleinere Modelle mit sieben Milliarden Parametern hielten mit. Das zeigt, dass nicht nur die Größe zählt, sondern auch das Trainingsdesign. Und genau hier liegt der eigentliche Fortschritt von ZeroSearch.

AUSBLICK

KI-Training unter Laborbedingungen

ZeroSearch ist mehr als nur eine technische Spielerei. Es ist ein Konzept, das grundlegende Annahmen über KI-Training infrage stellt. Warum sollten wir teure, unvorhersehbare Webdaten nutzen, wenn wir die Umgebung genauso gut simulieren können? Alibaba liefert hier einen Bauplan für eine neue Generation von Modellen – günstiger, kontrollierter, und skalierbar. In einer Welt, in der jeder Prompt Geld kostet, ist das keine Spielerei, sondern eine strategische Neuausrichtung.

Profilbild Caramba

UNTERSTÜTZUNG

Hat dir ein Artikel gefallen oder ein Tutorial geholfen? Du kannst uns weiterhelfen, indem du diese Seite weiterempfiehlst, uns auf Youtube abonnierst oder dich per Paypal an den Serverkosten beteiligst. Wir sind für jede Unterstützung dankbar. Danke.

KURZFASSUNG

  • Alibaba hat mit ZeroSearch eine Methode entwickelt, um KI-Modelle mit simulierten Suchergebnissen statt realer Websuche zu trainieren.
  • Das Verfahren senkt die Trainingskosten um bis zu 88 % und bietet volle Kontrolle über die Qualität und Schwierigkeit der Daten.
  • ZeroSearch erzielt vergleichbare oder bessere Ergebnisse als Modelle, die mit Google-Daten trainiert wurden.
  • Die Methode bietet großes Potenzial für kleinere Unternehmen und Institutionen mit begrenztem Budget.

QUELLEN