Tencent schlägt Google bei Übersetzungen – mit Open-Source

Zwei neue Modelle dominieren internationale Benchmarks und sind frei nutzbar. Warum setzen sie neue Standards bei Qualität und Effizienz?

Kurzfassung | Andreas Becker, 02.09.25

gpt-image-1 | All-AI.de

EINLEITUNG

Das chinesische Tech-Unternehmen Tencent hat zwei neue KI-Modelle zur maschinellen Übersetzung veröffentlicht – frei verfügbar und technisch überraschend stark. Die Modelle Hunyuan-MT-7B und Hunyuan-MT-Chimera-7B übertreffen laut Benchmarks etablierte Systeme wie Google Translate und GPT-4.1. Besonders bemerkenswert: Trotz ihrer kompakten Größe liefern sie in fast allen Sprachkombinationen die besten Ergebnisse.

NEWS

Hohe Trefferquote in internationalen Benchmarks

Bei der diesjährigen WMT25, einem der wichtigsten Vergleichstests für Übersetzungssysteme, erreichen die neuen Tencent-Modelle in 30 von 31 Sprachpaaren die höchsten Bewertungen. Getestet wurde die Übersetzungsqualität zwischen 33 Sprachen – von Chinesisch, Englisch und Spanisch bis hin zu selten digitalisierten Sprachen wie Isländisch, Estnisch oder Marathi.

Ein besonderer Fokus liegt auf der Übersetzung zwischen Mandarin-Chinesisch und den Minderheitensprachen Chinas. Dazu zählen Kasachisch, Uigurisch, Mongolisch und Tibetisch. Gerade in diesen Kombinationen schneiden die Modelle deutlich besser ab als bestehende Systeme. In einigen Fällen liegt die Übersetzungsqualität mehr als 50 Prozent über den bisher besten Werten.

Quelle: Tencent

Kompakte Technik mit ungewöhnlicher Trainingsmethode

Beide Modelle basieren auf nur 7 Milliarden Parametern – deutlich weniger als viele der aktuellen Großmodelle. Trotzdem erreichen sie gleichwertige oder bessere Resultate. Möglich macht das ein mehrstufiges Trainingsverfahren, das klassische Methoden mit Belohnungslernen kombiniert. Dabei wurde unter anderem ein riesiger Datensatz speziell für seltene Sprachen genutzt, um die Modelle gezielt zu stärken.

Das Modell Chimera-7B geht noch einen Schritt weiter: Es kombiniert mehrere Übersetzungsvorschläge zu einer optimierten Fassung. Dieser sogenannte Fusionsansatz führt laut internen Tests zu rund zwei Prozent besseren Ergebnissen im Vergleich zu Einzelmodellen – vor allem bei längeren und komplexeren Sätzen.

Open Source und vielseitig einsetzbar

Tencent stellt beide Modelle frei auf Hugging Face zur Verfügung. Der komplette Quellcode ist zusätzlich auf GitHub abrufbar. Durch ihre geringe Größe lassen sich die Modelle auch mit begrenzter Hardware nutzen – etwa in Forschungseinrichtungen, Startups oder auf Edge-Geräten.

Die Veröffentlichung kommt zu einem Zeitpunkt, an dem auch Google seine Übersetzungs-KI modernisiert. Doch während dort neue Funktionen wie Live-Übersetzung und Sprachtraining im Vordergrund stehen, richtet sich Tencents Ansatz eher an Entwickler, die leistungsstarke und anpassbare Übersetzungssysteme benötigen – ohne Lizenzkosten und mit voller Kontrolle über die Technik.

DEIN VORTEIL - DEINE HILFE

KURZFASSUNG

Tencent hat zwei neue Open-Source-Übersetzungsmodelle veröffentlicht, die in 30 von 31 Sprachpaaren die WMT25-Benchmarks anführen.
Die Modelle decken 33 Sprachen ab, inklusive wenig digitalisierter Sprachen wie Kasachisch, Uigurisch oder Tibetisch.
Ein Ensemble-Ansatz namens Chimera verbessert die Übersetzungsqualität durch Systemfusion um mehrere Prozentpunkte.
Mit nur 7 Milliarden Parametern sind die Modelle leichtgewichtig und effizient, bei gleichzeitig hoher Genauigkeit.