---
title: xAI veröffentlicht Voice Agent Builder für KI-Sprachassistenten
description: Die neue No-Code-Plattform erstellt einsatzbereite Sprach-KIs in unter zwei Minuten. Das System verarbeitet Sprache dabei ohne verzögernde Zwischenschritte.
author: Andreas Becker
url: https://www.all-ai.de/news/news26/xai-voice-agent-builder
---

![Ein Voice Stimme von Elon Musk](https://www.all-ai.de/images/2-news/7-26/xai-sprachagent-1600.webp)

# xAI veröffentlicht Voice Agent Builder für KI-Sprachassistenten

Die neue No-Code-Plattform erstellt einsatzbereite Sprach-KIs in unter zwei Minuten. Das System verarbeitet Sprache dabei ohne verzögernde Zwischenschritte.

[Andreas Becker](https://www.all-ai.de/charaktere)·02.07.26

GPT-Images-2.0

![Ein Voice Stimme von Elon Musk](https://www.all-ai.de/images/2-news/7-26/xai-sprachagent-1600.webp#joomlaImage://local-images/2-news/7-26/xai-sprachagent-1600.webp?width=1600&height=900)

Kurzfassung
 ▾

Quellen
 ▾

- xAI hat den Voice Agent Builder als Beta-Version für Entwickler und Unternehmen veröffentlicht.
- Die No-Code-Plattform erstellt auf Basis von Grok Voice in wenigen Minuten funktionale KI-Sprachassistenten.
- Das System verarbeitet Audiosignale direkt und greift in Echtzeit auf interne Firmendatenbanken zu.
- Die Nutzung kostet fünf US-Cent pro Minute und beinhaltet eine kostenlose Telefonnummer.

- [xAI: Introducing Voice Agent Builder](https://x.ai/news/grok-voice-agent-builder)
- [xAI: Grok Voice](http://x.ai/voice)
- [xAI: Console Voice Agents](http://console.x.ai/voice/agents)
- [X: xAI Announcement](https://x.com/xai/status/2072342803787702422)

xAI hat den Voice Agent Builder in einer Beta-Version veröffentlicht. Die No-Code-Plattform ermöglicht es Unternehmen, funktionale KI-Sprachassistenten auf Basis von Grok Voice in unter zwei Minuten einzurichten. Das System verarbeitet Sprache nativ und reagiert in weniger als einer Sekunde.

#### Direkte Audioverarbeitung

Herkömmliche Sprachassistenten leiten Anrufe oft durch drei separate Schnittstellen für Spracherkennung, Textanalyse und Sprachausgabe. Jeder Hop erhöht die Latenz und die Fehleranfälligkeit. xAI umgeht diesen Umweg. Grok Voice verarbeitet Audioeingaben nativ und antwortet direkt.

Das Modell ist laut Entwicklern auf reale, unsaubere Anrufe trainiert. Es verarbeitet Hintergrundgeräusche, starke Akzente und plötzliche Unterbrechungen durch den Anrufer. Die Plattform unterstützt 25 Sprachen und bietet 80 integrierte Stimmen. Alternativ genügt ein zweiminütiger Audioschnipsel, um eine firmeneigene Markenstimme zu klonen.

Twitter Beitrag - Cookies links unten aktivieren.

> Introducing Voice Agent Builder: a no-code platform to create human-like voice agents with Grok Voice.
>
> Available today at $0.05 / min.[https://t.co/kUkF7zqvfR](https://t.co/kUkF7zqvfR) [pic.twitter.com/OCIq1oDYar](https://t.co/OCIq1oDYar)
>
> — xAI (@xai) [July 1, 2026](https://x.com/xai/status/2072342803787702422?ref_src=twsrc%5Etfw)

#### Echtzeitzugriff auf Datenbanken und Software

Nutzer laden Dokumente wie PDFs, Excel-Listen oder JSON-Dateien direkt in die Plattform. Grok liest diese Informationen während des Telefonats aus, um Fragen zu beantworten.

Der Assistent stößt über Schnittstellen auch externe Aktionen an. Er greift auf Dienste wie Google Calendar, Linear, Notion oder eigene interne Systeme via Model Context Protocol (MCP) zu. Das Modell bucht so selbstständig Termine, prüft den Bestellstatus oder veranlasst Rückerstattungen.

Gerät Grok an seine Grenzen oder berührt ein Thema die vorher definierten Sicherheitsvorgaben, leitet die Software den Anruf nahtlos an einen menschlichen Mitarbeiter weiter.

###### Anzeige

#### Benchmark und Preisgestaltung

Im hauseigenen Testaufbau »τ-voice Bench« erreicht das Modell Grok Voice Think Fast 1.0 eine Erfolgsquote von 67,3 Prozent. Gemini 3.1 Flash Live kommt im selben Test auf 43,8 Prozent, GPT Realtime 1.5 auf 35,3 Prozent.

![xai bench 1](https://www.all-ai.de/images/2-news/7-26/xai-sprachagent-1.webp)

###### Quelle: xAI

xAI berechnet 5 US-Cent pro Minute Audio. Dieser Preis deckt die Nutzung der Stimmen und der Plattform ab. Jedes Konto erhält eine kostenlose Telefonnummer für den Start. Bei produktiver Nutzung der bereitgestellten Nummer kostet die Telefonie einen weiteren US-Cent pro Minute. Unternehmen können ihre bestehenden Nummern über das SIP-Protokoll einbinden.

Der Dienst erfüllt laut eigenen Angaben Sicherheitsstandards wie SOC 2 und die Vorgaben der europäischen DSGVO.
