Googles KI-Agenten übernehmen das Smartphone komplett

Android entwickelt sich mit Gemini Intelligence zum intelligenten Helfer. Updates für den Browser Chrome und Android Auto folgen im Sommer.

Andreas Becker12.05.26 Google

Kurzfassung Quellen

Google bringt mit Gemini Intelligence agentische KI-Funktionen auf Android, die selbstständig mehrstufige Aufgaben über verschiedene Apps hinweg erledigen.
Zu den neuen Features zählen die automatische Erstellung maßgeschneiderter Widgets sowie die Bereinigung gesprochener Sprache beim Diktieren.
Im Browser Chrome übernehmen die KI-Modelle das Surfen und Umbuchen, während Android Auto eine 3D-Navigation und smarte Antwortvorschläge erhält.
Der Datenschutz wird durch strikte lokale Berechnungen, granulare App-Berechtigungen und eine transparente Aufzeichnung aller KI-Aktivitäten gewährleistet.

Google integriert mit Gemini Intelligence weitreichende agentische KI-Funktionen tief in das Android-Betriebssystem. Künftig erledigen die Modelle selbstständig mehrstufige Aufgaben über verschiedene Apps hinweg, wovon auch der Browser Chrome sowie Android Auto profitieren.

Agenten übernehmen die App-Steuerung

Bisher beschränkten sich digitale Assistenten meist auf simple Text- oder Sprachantworten. Nun agiert Gemini proaktiv im Hintergrund und steuert installierte Anwendungen. Anwender erteilen dem System beispielsweise den Auftrag, Lebensmittel von einer Notiz-App direkt in den virtuellen Warenkorb eines Lieferdienstes zu legen oder eine konkrete Fahrt zu buchen.

Oft genügt bereits ein bloßes Foto als Ausgangspunkt. Knipst man eine Hotelbroschüre, sucht das KI-Modell auf Reiseplattformen nach ähnlichen Angeboten für die entsprechende Personengruppe. Solche Prozesse lassen sich live über die Taskleiste mitverfolgen. Das System stoppt automatisch nach Erledigung, wobei stets eine finale Bestätigung für sensible Aktionen wie Käufe erforderlich bleibt.

Den Anfang machen diesen Sommer die Serien Pixel 10 und Galaxy S26. Später im Jahr weitet Google die Verfügbarkeit auf Smartwatches, Brillen und Laptops aus.

Gleichzeitig zieht die generative Benutzeroberflächen-Gestaltung auf den Startbildschirm ein. Über die Funktion »Create My Widget« entwerfen die Modelle nach einer kurzen Textbeschreibung passgenaue Anzeigen. So erhalten Radfahrer etwa ein kompaktes Wetter-Widget, das auf dem Display ausschließlich die Windgeschwindigkeit und den drohenden Niederschlag einblendet.

Quelle: Google

Smarter surfen und fehlerfrei diktieren

Innerhalb des Browsers Chrome erweitert Google die Assistenzfunktionen merklich. Ab Ende Juni unterstützt die Funktion »Auto Browse« beim Navigieren durch das Web und füllt lästige Formulare selbstständig aus. Dabei greift die KI auf lokale Kontextdaten zurück, um etwa passend zu einem gebuchten Konzertticket einen Parkplatz über externe Dienste zu reservieren.

Besonders visuelle Anpassungen ermöglicht die Bildbearbeitung »Nano Banana« direkt im Browser. Damit lassen sich Webseiten-Inhalte zügig in anschauliche Infografiken umwandeln. Auch das virtuelle Möblieren von völlig leeren Wohnungen auf Immobilienportalen funktioniert so auf Knopfdruck.

Ebenfalls ein Update erhält die Spracheingabe Gboard. Das Feature »Rambler« filtert künftig Füllwörter sowie unnötige Versprecher aus diktierten Texten heraus. Selbst beim fließenden Wechsel zwischen mehreren Sprachen innerhalb eines einzigen Satzes strukturiert das KI-Modell die Audioeingabe zu einer flüssig lesbaren Nachricht um.

Entertainment und 3D-Navigation im Fahrzeug

Android Auto profitiert im Rahmen des großen Updates von einer überarbeiteten Oberfläche und tiefgreifender KI-Integration. Eine neue 3D-Ansicht namens »Immersive Navigation« stellt hohe Gebäude und schmale Fahrspuren detailliert dar. Das erleichtert die schnelle Orientierung in unübersichtlichen Kreuzungsbereichen.

Eingehende Textnachrichten analysiert das Feature »Magic Cue« auf ihren inhaltlichen Kontext. Fragt ein Kontakt nach einer genauen Adresse, zieht sich Gemini die entsprechenden Daten aus dem Kalender und schlägt umgehend eine exakte Antwort vor. Parallel dazu lassen sich während der Fahrt konkrete Essensbestellungen per Sprachbefehl delegieren.

Bei geparkten Fahrzeugen verwandelt sich der Innenraum in ein Entertainment-System. Kompatible Autos spielen dann hochauflösende Full-HD-Videos mit flüssigen 60 Bildern pro Sekunde ab. Startet die Fahrt, wechselt das System aus Sicherheitsgründen umgehend und nahtlos in einen reinen Audio-Modus.

Quelle: Google

Datenschutz als notwendiges Fundament

Damit derart tiefe Systemeingriffe sicher ablaufen, finden viele Berechnungen direkt lokal auf dem Endgerät statt. Technologien wie der Private Compute Core schirmen die privaten Daten konsequent ab, während Anwender jederzeit die volle Kontrolle über die erteilten Freigaben behalten.

Eine granulare Rechteverwaltung regelt den exakten Zugriff der Modelle auf einzelne Apps. Ergänzend dokumentiert ein erweitertes Privacy Dashboard sämtliche Aktivitäten der KI aus den vergangenen 24 Stunden lückenlos. Nutzer sehen somit vollkommen transparent ein, wann und wie Gemini im Hintergrund Aufgaben verarbeitet hat.

Wir sind gespannt.