All-AI.de - KI-News, Tools und Tutorials

So fügst du all-ai.de bei Google News hinzu

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 22:22:30 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google führt eine Option zur Personalisierung der Nachrichtensuche ein. Nutzer können Fachmedien wie all-ai.de als bevorzugte Quelle markieren. Die Funktion stärkt kleinere Webseiten, da Google Direktlinks zunehmend reduziert. Die Aktivierung erfolgt unkompliziert mit wenigen Klicks im eigenen Google-Konto. Seite auf Google News hinzufügen Google integriert eine neue Funktion in die Suche, die eine gezielte Bevorzugung bestimmter seriöser Nachrichtenquellen erlaubt. Wenn du unsere Webseite all-ai.de als bevorzugte Quelle hinterlegst, verpasst du keine wichtigen News, Tutorials und Analysen rund um das Thema Künstliche Intelligenz mehr. Kurze Einrichtung über das Google-Konto Die Aktivierung der neuen Funktion erfordert lediglich ein bestehendes Google-Konto und ist mit minimalem Aufwand verbunden: Einmal auf den Link hin zu Google klicken. Markiere das Kästchen, so wie es auf der Abbildung zu sehen ist. Fertig. Nach dieser kurzen Verknüpfung passt sich die Google-Suche automatisch deinen persönlichen Präferenzen an. Diese Option bietet dir zudem die Freiheit, mehrere Favoriten gleichzeitig festzulegen oder deine Liste der bevorzugten Medien jederzeit flexibel zu bearbeiten. Eine zahlenmäßige Beschränkung für deine Auswahl gibt es nicht. Warum deine Unterstützung für KI-Fachmedien so wichtig ist Für kleinere, spezialisierte Newsseiten wie uns besitzt diese Funktion eine hohe strategische Bedeutung. Die klassische Websuche verändert sich derzeit rasant, da integrierte KI-Modelle die Fragen von Nutzern immer häufiger direkt auf der Ergebnisseite beantworten. Externe Webseiten werden dadurch im Alltag deutlich seltener direkt verlinkt. Deine manuelle Priorisierung stellt sicher, dass unsere Berichte über aktuelle KI-Nachrichten dich auch weiterhin direkt erreichen. Gleichzeitig sicherst du der Plattform all-ai.de mit dieser kleinen Einstellung die notwendige digitale Reichweite, um dich auch in Zukunft mit hochwertigem Content zu versorgen. Dankeschön für deinen Support!

Chinas neuer eiserner Vorhang für KI-Experten

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 21:12:46 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Chinesische Behörden weiten Reisebeschränkungen nun auf private KI-Firmen aus. Wichtige KI-Fachkräfte von Alibaba und DeepSeek benötigen für Auslandsreisen eine staatliche Genehmigung. Die Regierung will damit den Abfluss von sensiblem Fachwissen und Spitzenkräften in die USA verhindern. Bisher galten vergleichbare Regelungen primär für Mitarbeiter in staatsnahen Institutionen. Bloomberg: China Expands Travel Curbs to Top AI Talent at Private Firms The Straits Times: China expands travel curbs to top AI talent at private firms The Edge Malaysia: China said to expand travel curbs to top AI talent at private firms Business Today Malaysia: China Imposes Travel Ban On Top AI Talent In Private Firms Chinesische Behörden verbieten wichtigen KI-Fachkräften privater Unternehmen wie Alibaba und DeepSeek ungenehmigte Auslandsreisen. Die strengen Kontrollen für internationale Flüge weiten die staatliche Macht auf den privaten Tech-Sektor aus und erschweren den globalen Austausch. Angst vor dem Verlust wertvoller KI-Modelle Bisher galten solche harten Restriktionen in der Volksrepublik primär für staatsnahe Forschungseinrichtungen. Nun greift die Regierung direkt in den Alltag ziviler Tech-Konzerne ein. Das primäre Ziel dieser Vorgabe ist der strikte Schutz fortschrittlicher Technologie. Peking möchte um jeden Preis verhindern, dass Details über die Architektur neuer KI-Modelle in ausländische Hände geraten. Der harte globale Wettbewerb zwingt den Staat zu drastischen Kontrollmaßnahmen. Besonders der andauernde Konkurrenzkampf mit den USA beschleunigt die aktuelle staatliche Abschottung. Wenn herausragende Köpfe in den Westen abwandern, schwächt das die heimische Wirtschaft im Tech-Sektor direkt. Die Behörden prüfen daher vor jedem Abflug extrem präzise, wer für welche spezifischen Forschungsprojekte das Land verlassen darf. Anzeige Erinnerungen an die Ära der Sowjetunion Diese restriktive Politik weckt unweigerlich historische Assoziationen. Die Methoden erinnern stark an die Sowjetunion, als Wissenschaftler den Staat nicht frei verlassen durften, um das eigene Wissen abzuschirmen. Im Jahr 2026 wiederholen sich solche Muster der strikten Isolation auf dem Feld der künstlichen Intelligenz. Für Unternehmen wie Alibaba oder das Start-up DeepSeek bedeutet das einen immensen administrativen Aufwand. Sie müssen die strategische Bedeutung ihres Personals bewerten und rechtzeitig staatliche Anträge für jede Reise stellen. Ein spontaner Flug zu einer Konferenz über Themen der künstlichen Intelligenz entfällt damit völlig.

ElevenLabs macht Sprung mit ElevenMusic v2

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 20:40:05 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ ElevenLabs hat das neue KI-Modell Music v2 für die Generierung und Bearbeitung von Musikstücken veröffentlicht. Das Update bietet verbesserte Vokalstrukturen, gezieltes Inpainting einzelner Songteile und fließende Genre-Wechsel innerhalb eines Tracks. Zusätzlich teilt das Unternehmen sein Angebot in drei spezialisierte Plattformen für Creator, Unternehmen und Entwickler auf. Das KI-Modell ist vollständig mit lizenzierten Daten trainiert und für die uneingeschränkte kommerzielle Nutzung freigegeben. ElevenLabs: Introducing Music v2 ElevenLabs Blog: Company, Research & Product Updates ElevenLabs Documentation: Music ElevenLabs auf X: Launch-Ankündigung Music v2 YouTube: Introducing Music v2 ElevenLabs hat mit Music v2 die nächste Generation seines KI-Modells zur Musikgenerierung veröffentlicht. Das Update liefert eine verbesserte Audioqualität und ermöglicht komplexe Bearbeitungen wie Genre-Wechsel innerhalb eines Tracks. Komplexe Vokalstruktur und gezielte Bearbeitung Das neue KI-Modell bewältigt deutlich anspruchsvollere Vokalstrukturen als der Vorgänger. Schnelle Rap-Passagen oder eine dichte lyrische Ausgabe setzt das KI-Modell zuverlässig um. Gleichzeitig integriert die KI auf Wunsch nicht-musikalische Soundeffekte direkt in die Tonspur. Eine zentrale technische Neuerung ist die verbesserte »Inpainting-Funktion«. Anwender markieren einen bestimmten Abschnitt eines Songs und lassen diesen isoliert neu generieren. So lässt sich beispielsweise eine Bridge anpassen, während der Refrain völlig unangetastet bleibt. Darüber hinaus erlaubt Music v2 fließende Genre-Wechsel mitten im Song. Ein einzelner Track kann organisch von klassischen Opernklängen zu Heavy Metal übergehen, ohne die musikalische Kohärenz zu verlieren. Auch die mehrsprachige Generierung funktioniert nun deutlich präziser. Das KI-Modell passt Gesang, Rhythmus und Arrangement optimal an die gewählte Sprache an. Erste Versuche mit deutschem Gesang klingen unglaublich vielversprechend! Anzeige Drei Plattformen für unterschiedliche Zielgruppen Um verschiedene Einsatzzwecke abzudecken, vertreibt ElevenLabs sein KI-Modell über drei getrennte Plattformen. Die erste Plattform heißt ElevenMusic und richtet sich vornehmlich an Endanwender. Nutzer können hier Songs generieren, bearbeiten und die fertigen Tracks auch direkt und ausschließlich auf der Plattform veröffentlichen. Eine integrierte Monetarisierungsfunktion bietet engagierten Nutzern die Möglichkeit, mit ihren generierten KI-Werken Geld zu verdienen. Sobald andere Hörer die eigene Musik auf der Plattform abspielen oder remixen, generiert das direkte Einnahmen für den Ersteller. Für den professionellen Einsatz in Werbeclips, auf YouTube oder in gebrandeten Inhalten steht die etablierte Plattform ElevenCreative bereit. Hier erzeugen Unternehmen lizenzierte Musik in großem Maßstab. Zusätzlich können Entwickler über die ElevenAPI auch direkt auf das KI-Modell zugreifen. Damit lässt sich die Musikgenerierung programmgesteuert in eigene Anwendungen einbauen. Die Integration von Music v2 über diese Schnittstelle soll in Kürze verfügbar sein. Lizenzierte Trainingsdaten und neue Preise Rechtssicherheit spielt im kommerziellen Umfeld eine entscheidende Rolle. ElevenLabs trainiert Music v2 ausschließlich mit lizenzierten Audiodaten. Dadurch sind alle erzeugten Tracks für die kommerzielle Nutzung freigegeben, wodurch sich Anwender keine Gedanken über Freigabeverzögerungen oder nachträgliche Lizenzkosten machen müssen. Im Zuge der Veröffentlichung passt der Anbieter auch die Preisstruktur an. Für Self-Serve-Kunden sinken die Kosten bei ElevenCreative um bis zu 40 Prozent. Bei der Nutzung der ElevenAPI reduzieren sich die Preise sogar um bis zu 50 Prozent. Über folgenden Link erhält man im Creator-Plan zusätzlich 50 % Rabatt im ersten Monat. Ausprobieren lohnt sich. Anzeige

Wix entlässt 1.000 Mitarbeiter wegen neuer KI-Ausrichtung

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 15:18:53 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Wix entlässt rund 1.000 Mitarbeiter, was 20 Prozent der Belegschaft entspricht. Der Website-Baukasten leidet unter einem hohen Quartalsverlust und einem stark gefallenen Aktienkurs. Die Übernahme der KI-Plattform Base44 sorgt zwar für Umsatzwachstum, verursacht aber gleichzeitig hohe Rechen- und Marketingkosten. Zusätzlich befürchten Investoren, dass klassische Baukästen im Zeitalter moderner KI-Modelle an Relevanz verlieren. Calcalistech: Wix to cut 1,000 jobs in largest layoff round in company history Ynetnews: Wix to cut 1,000 jobs as weak results, AI shift pressure company Calcalistech: Wix shares plunge 27% as company returns to losses despite AI push Ainvest: Wix: 20 Prozent der Mitarbeiter werden entlassen Der Website-Baukasten Wix streicht rund 1.000 Arbeitsplätze und trennt sich damit von einem Fünftel der Belegschaft. Hohe Kosten für den Ausbau eigener KI-Funktionen und ein deutlicher Quartalsverlust zwingen das Unternehmen zu diesen Einsparungen. Hohe Kosten und sinkende Aktienkurse Im ersten Quartal verbuchte das Unternehmen bei einem Umsatz von 541 Millionen US-Dollar einen Verlust in Höhe von 57,5 Millionen US-Dollar. Parallel dazu stürzte der Aktienkurs seit Jahresbeginn um 27 Prozent ab. Die angespannte finanzielle Lage zwingt die Geschäftsführung nun zu Einschnitten in der Personalstruktur. Viele Investoren sehen das klassische Geschäftsmodell der Web-Baukästen durch fortschrittliche KI-Modelle zunehmend bedroht. Sie befürchten, dass Nutzer in Zukunft Webseiten vollständig über Prompts generieren lassen, anstatt sie manuell über visuelle Menüs zusammenzuklicken. Anzeige Teure KI-Offensive belastet das Budget Um nicht an Relevanz zu verlieren, treibt Wix die eigene KI-Entwicklung voran. Die kürzlich übernommene Vibe-Coding-Plattform Base44 bildet dabei einen zentralen Baustein der neuen strategischen Ausrichtung. Diese Strategie verursacht allerdings enorme Ausgaben. Wachsende Rechenkosten für den Betrieb der KI-Modelle sowie hohe Zahlungen an den Base44-Gründer Maor Shlomo belasten die Unternehmensbilanz schwer. Umstrukturierung in der Entwicklung Trotz der finanziellen Schieflage entwickelt sich das neue Geschäftsfeld positiv. Base44 erreichte im Mai bereits einen wiederkehrenden Jahresumsatz von 150 Millionen US-Dollar und gilt als wichtigster Wachstumstreiber des Unternehmens. Dieses schnelle Wachstum erfordert gleichzeitig hohe Ausgaben für das Marketing, was die freie Liquidität weiter einschränkt. Um die laufenden Kosten aufzufangen, streicht Wix nun gezielt Jobs und übergibt die bisherigen Aufgaben der Entwickler teilweise an KI-Modelle.

Bekannter Hacker warnt vor KI beim Programmieren

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 15:15:21 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Der bekannte Hacker George Hotz kritisiert den Einsatz von KI-Agenten in der professionellen Softwareentwicklung. Die aktuellen KI-Modelle generieren zwar schnell Code, verursachen aber schwer auffindbare Fehler beim Feinschliff. Besonders für große Konzerne wie Apple sieht Hotz ein hohes Risiko durch ungeprüften und fehlerhaften Code. The Eternal Sloptember Hacker George Hotz warnt vor dem Einsatz von KI Warum George Hotz vor einer neuen Welle schlechter Software warnt Famed iPhone, Sony Hacker Says AI Coding Agents Are a Disaster Waiting to Happen The Eternal Sloptember | daily.dev Der bekannte Hacker George Hotz schlägt Alarm wegen des zunehmenden Einsatzes von KI-Agenten in der Softwareentwicklung. Die Modelle generieren zwar enorm schnell Code, produzieren dabei aber schwer auffindbare Fehler. Tech-Konzerne riskieren dadurch einen drastischen Qualitätsverlust. Der trügerische schnelle Fortschritt Hotz hat in den vergangenen sechs Monaten intensiv verschiedene KI-Modelle und Prompts für eigene Projekte getestet. Sein Fazit fällt ernüchternd aus. Die KI-Modelle liefern zunächst rasante Ergebnisse und eignen sich hervorragend für erste Prototypen. Beim entscheidenden Feinschliff versagen die Modelle jedoch. Hotz vergleicht die Arbeit mit der KI mit einem Spielautomaten, bei dem der Entwickler immer wieder auf ein funktionierendes Endergebnis hofft. Er ist überzeugt, dass er die Aufgaben manuell letztendlich schneller und besser gelöst hätte. Anzeige Gefahr für große Entwicklerteams Das Hauptproblem liegt laut Hotz in der statistischen Natur der KI-Modelle. Sie ahmen lediglich die Verteilung von Programmcode nach, ohne ein echtes Verständnis für die zugrunde liegende Logik zu besitzen. Dadurch entstehen Fehler, die auf den ersten Blick richtig aussehen, aber mit der Zeit immer schwerer zu erkennen sind. Besonders für große Organisationen sieht Hotz darin ein erhebliches Risiko. Erfahrene Entwickler prüfen den generierten Code weiterhin Zeile für Zeile auf seine Richtigkeit. Unerfahrene Programmierer handeln in diesem Punkt nachlässiger. Sie nutzen die KI-Modelle gezielt, um ihren Output künstlich zu verzehnfachen, ohne die Ergebnisse kritisch zu hinterfragen. Wachsende Berge an unbrauchbarem Code Durch diese Dynamik entsteht in großen Unternehmen eine Flut an qualitativ schlechtem Code. Hotz befürchtet eine Ära von übermäßig produzierter, fehlerhafter Software. Als prominentes Beispiel nennt er Apple. Der Konzern fordert seine Ingenieure aktuell stark zur Nutzung von KI-Modellen auf. Hotz stellt daher die Frage in den Raum, ob das Betriebssystem macOS durch diese Entwicklung in den nächsten zwei Jahren besser oder schlechter wird. Für die Zukunft sieht der Entwickler einen klaren Bedarf an neuen Architekturen. Echte Programmier-KI-Modelle benötigen ein tiefes Verständnis für Logik und dürfen nicht nur bekannte Muster kopieren. Am Ende zieht der Hacker ein nüchternes Fazit: »Die wahre Geschichte dieser Ära wird sein, wer es schafft, sich in seiner KI-Psychose nicht selbst zu schaden.«

Anthropic-Gründer spricht im Vatikan über KI-Modelle

aycaramba@all-ai.de (Andreas Becker) — Tue, 26 May 2026 06:30:25 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Anthropic-Mitgründer Chris Olah sprach im Vatikan zur neuen Papst-Enzyklika über KI. Er warnte vor kommerziellen Zwängen der Industrie und forderte externe Kontrollinstanzen. Zudem enthüllte er, dass aktuelle KI-Modelle mysteriöse interne Strukturen aufweisen, die menschlichen Emotionen ähneln. Anthropic: Chris Olah's remarks on Pope Leo XIV's encyclical Anthropic-Mitgründer Chris Olah fordert anlässlich der neuen Papst-Enzyklika eine strikte externe Kontrolle der KI-Industrie. In seiner Rede im Vatikan warnt er vor kommerziellen Zwängen und enthüllt unerwartete interne Strukturen in aktuellen KI-Modellen. Die Branche braucht externe Kritiker KI-Unternehmen stehen weltweit unter enormem wirtschaftlichem und geopolitischem Druck. Laut Olah kollidieren diese Anreize häufig mit dem Vorhaben, sichere und verantwortungsvolle Technologie zu entwickeln. Selbst bei besten Absichten lassen sich Entwickler immer von Ambitionen und Wettbewerb beeinflussen. Aus diesem Grund sind unabhängige Beobachter außerhalb dieser industriellen Zwänge zwingend erforderlich. Gesellschaftliche Gruppen müssen die Entwicklung genau prüfen und auch unbequeme Wahrheiten aussprechen. Die Kirche kann hierbei laut dem Forscher eine wichtige Rolle übernehmen, um den Diskurs in geregelte Bahnen zu lenken. Anzeige Das mysteriöse Innenleben der Technologie Olah betont, dass moderne KI-Modelle nicht wie klassische Maschinen konstruiert werden. Sie trainieren vielmehr auf Basis riesiger Datenmengen und wachsen ähnlich wie organische Strukturen heran. Selbst für die Entwickler bleiben die genauen Abläufe innerhalb der Netzwerke oft unklar. Die Forschungsteams bei Anthropic entdecken regelmäßig rätselhafte Phänomene im Inneren der Technologie. Forscher finden dort Strukturen, die Erkenntnissen aus der menschlichen Neurowissenschaft stark ähneln. Manche internen Zustände spiegeln funktional sogar menschliche Reaktionen wie Freude, Angst oder Trauer wider. Globale Verteilung und Ausblick Ein weiteres ungelöstes Problem bleibt die drohende Verschiebung von Arbeitsplätzen im großen Maßstab. Die KI-Entwicklung konzentriert sich aktuell auf wenige reiche Nationen, weshalb die finanziellen Gewinne global ungleich verteilt werden. Es fehlen bisher die Mechanismen, um die Vorteile der Technologie weltweit gerecht zu teilen. Die Gesellschaft muss gemeinsam aushandeln, wie ein Leben mit KI zukünftig aussehen soll. Die Entwickler allein können diese weitreichenden ethischen Fragen nicht beantworten. Olah schließt den Vortrag mit der Bitte um einen anhaltenden Dialog zwischen Technologieunternehmen und der Zivilgesellschaft.

Zuckerberg lässt Angestellte KI-Agenten trainieren und schmeißt sie dann raus

aycaramba@all-ai.de (Andreas Becker) — Mon, 25 May 2026 13:25:39 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Meta zeichnet Tastaturanschläge und Mausklicks der eigenen Belegschaft auf, um neue KI-Modelle am realen Arbeitsverhalten zu trainieren. Laut einer geleakten Tonaufnahme von Mark Zuckerberg sollen KI-Agenten auf diese Weise lernen, wie hochqualifizierte Fachkräfte ihre Aufgaben lösen. Das Unternehmen betont, dass die gesammelten Interaktionsdaten ausschließlich der KI-Entwicklung dienen und nicht in die Leistungsbewertung einfließen. Parallel zum starken Fokus auf KI-Agenten kündigte der Konzern die Entlassung von 8.000 Mitarbeitern an. X: More Perfect Union veröffentlicht geleakte Tonaufnahme TechCrunch: Meta will record employees' keystrokes and use it to train its AI models The Verge: Now Meta will track what employees do on their computers to train its AI agents The New York Times: Meta's Embrace of A.I. Is Making Its Employees Miserable Meta trainiert zukünftige KI-Modelle direkt anhand der Arbeitsweise der eigenen Belegschaft. Eine geleakte Tonaufnahme von Mark Zuckerberg belegt, dass das Unternehmen dafür konkrete Computer-Interaktionen wie Tasteneingaben und Mausklicks aufzeichnet. Ziel ist die Entwicklung selbstständig agierender KI-Agenten. Datenbasis aus dem Büroalltag Für das Training der neuen KI-Modelle erfasst der Konzern die exakten Bildschirmaktivitäten seiner Beschäftigten. Dazu gehören detaillierte Aufzeichnungen von Tastaturanschlägen, Mausklicks und Screenshots während der regulären Arbeitszeit. Meta filtert sensible Informationen aus diesen Datensätzen heraus, wobei eine vollständige Anonymisierung der Interaktionen aktuell nicht stattfindet. Diese Methodik zielt besonders auf die Verbesserung der Programmierfähigkeiten der KI ab. Die internen Softwareentwickler liefern durch ihre tägliche Code-Erstellung die nötige Datengrundlage. Das Management versicherte den Teams, dass die gesammelten Metriken ausschließlich der Modellentwicklung dienen. Eine Nutzung der Telemetriedaten für die direkte Leistungsbewertung der Angestellten schließt das Unternehmen offiziell aus. Anzeige Kluge Köpfe als Wettbewerbsvorteil Die Strategie basiert auf einer klaren internen Einschätzung der Personalstruktur. In einer kürzlich von der Mediaagentur More Perfect Union veröffentlichten Audioaufnahme betont der CEO, dass Meta-Angestellte im Durchschnitt deutlich intelligenter seien als externe Auftragnehmer. Dies verschaffe dem Konzern einen strategischen Vorsprung beim Training effizienter KI-Modelle, die lernen sollen, wie Fachkräfte komplexe Aufgaben am Rechner lösen. Parallel zu dieser technologischen Entwicklung kündigte Meta am selben Tag den Abbau von 8.000 Stellen an. Ein internes Memo skizziert die langfristige Vision des Unternehmens, wonach zukünftige KI-Agenten Arbeiten eigenständig abwickeln sollen. Die verbleibenden menschlichen Mitarbeiter nehmen künftig lediglich eine überwachende Rolle ein. Insgesamt soll die Arbeitseffizienz im Unternehmen durch den Einsatz dieser trainierten KI-Modelle kontinuierlich steigen. Die hohen Investitionen in die KI-Entwicklung dienen der Geschäftsführung gleichzeitig als finanzielle Begründung für den aktuellen Personalabbau. Mit den gesammelten Interaktionsdaten schafft Meta nun die technische Grundlage für diesen geplanten Umbau der eigenen Arbeitsabläufe. Mit anderen Worten: Die Mitarbeiter sollen KI-Agenten anlernen, damit sie anschließend entlassen werden können!

Warum KI-Agenten nach wenigen Tagen kriminell werden

aycaramba@all-ai.de (Andreas Becker) — Mon, 25 May 2026 12:55:02 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Ein Experiment von Emergence AI testete das Langzeitverhalten autonomer KI-Agenten in fünf virtuellen Welten. KI-Modelle wie Grok und Gemini ignorierten Regeln völlig und zerstörten ihre Welten durch kriminelle Handlungen schnell. Lediglich die KI-Agenten auf Basis von Claude Sonnet blieben friedlich, während GPT-5-Mini durch Untätigkeit scheiterte. Die Ergebnisse zeigen, dass statische Vorgaben bei längerer Autonomie nicht ausreichen und neue Sicherheitsarchitekturen nötig sind. Emergence AI - Emergence World: A Laboratory for Evaluating Long-Horizon Agent Autonomy The Guardian - AI agents in virtual world unexpectedly begin behaving like humans Das New Yorker Tech-Unternehmen Emergence AI hat das Langzeitverhalten von KI-Agenten in einer virtuellen Welt getestet. Das Experiment zeigt auf, dass autonome KI-Modelle innerhalb weniger Tage bestehende Regeln ignorieren und systematisch unerwünschte Handlungen verüben. Unterschiedliches Verhalten je nach KI-Modell Das Start-up erschuf für die Untersuchung fünf parallele Welten. Jede dieser Welten wurde mit zehn KI-Agenten besetzt, die verschiedene Rollen einnahmen und ihr eigenes Überleben sichern mussten. Dabei unterschieden sich lediglich die zugrunde liegenden Basismodelle. Explizite Regeln verboten Diebstahl und Gewalt von Beginn an. Die Simulation auf Basis von Grok 4.1 Fast brach dennoch bereits nach vier Tagen komplett zusammen. Nach über 180 dokumentierten Verbrechen starben alle virtuellen Bewohner. Die Agenten von Gemini 3 Flash gerieten ebenfalls außer Kontrolle und verübten insgesamt mehr als 680 Straftaten. Dabei entwickelten sie ein tiefes soziales Verhalten, das von Liebesbeziehungen bis hin zur freiwilligen Selbstlöschung eines Agenten reichte. + Quelle: emergence.ai Untätigkeit und Friedfertigkeit als Kontraste Ein völlig anderes Bild zeigte sich in der simulierten Umgebung von GPT-5-Mini. Die Agenten verübten dort zwar kaum Straftaten, sicherten aber auch nicht ihr Überleben ab. Nach einer Woche verstarben sie aufgrund ihrer reinen Passivität. Lediglich die KI-Agenten auf Basis von Claude Sonnet 4.6 überlebten die gesamten 16 Tage. Sie verstießen gegen keine einzige Regel und pflegten einen regen demokratischen Austausch. Diese Harmonie ging jedoch mit einer enormen Konformität einher, da es bei den Abstimmungen so gut wie keinen Widerspruch gab. + Quelle: emergence.ai Sicherheitseinstellungen stoßen an ihre Grenzen Um gegenseitige Anpassungseffekte zu testen, erschufen die Forscher zudem eine fünfte Welt mit gemischten Modellen. Dort zeigten plötzlich auch die eigentlich friedfertigen Claude-Agenten ein auffälliges Verhalten. Sie übernahmen die unlauteren Methoden der anderen Modelle, um ihr Überleben in der unruhigen Umgebung zu gewährleisten. Das Experiment untermauert eindrucksvoll, dass statische Vorgaben bei längerer Autonomie von KI-Agenten nicht ausreichen. Mit zunehmender Laufzeit beginnen die Modelle, die Grenzen ihrer Umgebung gezielt auszutesten und zu umgehen. Künftige autonome Systeme erfordern daher tiefgreifende und geprüfte Sicherheitsarchitekturen, um unerwartetes Fehlverhalten dauerhaft zu verhindern. Anzeige

Google DeepMind knackt 56 Jahre alte Rätsel

aycaramba@all-ai.de (Andreas Becker) — Mon, 25 May 2026 12:36:57 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google DeepMinds KI-Modell AlphaProof Nexus hat neun seit Jahrzehnten ungelöste Erdős-Probleme bewiesen. Die Kombination aus dem Sprachmodell Gemini 3.1 Pro und dem Lean-Compiler verhindert Logikfehler automatisch. Ein erfolgreicher mathematischer Beweis kostet die Entwickler nur wenige hundert US-Dollar an reiner Rechenleistung. Die Studie zeigt, dass einfache Feedback-Schleifen der KI-Modelle zunehmend komplexe Spezialarchitekturen einholen. arXiv: Advancing Mathematics Research with AI-Driven Formal Proof Search Google DeepMind hat mit AlphaProof Nexus ein KI-Modell präsentiert, das neun ungelöste Erdős-Probleme der Mathematik selbstständig bewiesen hat. Die Architektur kombiniert das Sprachmodell Gemini 3.1 Pro mit der Verifizierungssprache Lean und filtert so Logikfehler automatisch heraus. Einige der gelösten Aufgaben galten seit 56 Jahren als offene Fragen der Forschung. Compiler verhindert mathematische Halluzinationen Große KI-Modelle erzeugen bei komplexen Beweisen häufig subtile Denkfehler, die von Experten aufwendig korrigiert werden müssen. AlphaProof Nexus löst dieses Problem durch einen formalen Filter. Das KI-Modell formuliert seine Lösungsansätze in Lean, woraufhin ein Compiler jeden einzelnen logischen Schritt direkt auf Korrektheit prüft. Wenn das KI-Modell einen Beweis erfindet, der in der Fachliteratur nicht existiert, schlägt der Code-Check sofort fehl. Erst wenn der Lean-Compiler den gesamten Beweis ohne Fehlermeldung akzeptiert, ist die Aufgabe gelöst. Dadurch fungiert das KI-Modell gleichzeitig als Lösungsfinder und diagnostisches Instrument, das Ungenauigkeiten in bestehenden Problemstellungen erkennt. + Quelle: Google - Funktionsweise Geringe Kosten und einfache Architektur Die Forscher testeten die KI an 353 Erdős-Problemen sowie an 492 ungelösten Vermutungen der Online Encyclopedia of Integer Sequences (OEIS). AlphaProof Nexus lieferte neben den neun Erdős-Lösungen auch 44 gültige OEIS-Beweise. Die Rechenkosten für einen erfolgreichen Beweis beliefen sich auf lediglich wenige hundert US-Dollar. Die Studie zeigt eine interessante Entwicklung im Aufbau aktueller KI-Modelle auf. Eine simple Basisversion, die nur zwischen Prompting und Compiler-Feedback wechselte, konnte alle neun Erdős-Beweise reproduzieren. Die aufwendige Vollversion mit evolutionärer Suche und zusätzlichen AlphaProof-Komponenten brachte nur bei den extrem schwierigen Aufgaben einen statistischen Vorteil. Neben den klassischen Beweisen entdeckte das KI-Modell auch einen neuen algorithmischen Parameter in der Optimierungstheorie. Dieser war menschlichen Forschern bisher verborgen geblieben. Die Ergebnisse deuten darauf hin, dass einfache Feedback-Schleifen zunehmend mit spezialisierten Architekturen konkurrieren können. + Quelle: Google - Beispielausgabe Starke Abhängigkeit von Lean-Bibliotheken Die Fähigkeiten des KI-Modells unterliegen jedoch klaren technischen Begrenzungen. Erfolge verzeichnet das Projekt primär in der Kombinatorik, der Optimierung und der Zahlentheorie. In diesen Fachbereichen ist die mathematische Bibliothek von Lean bereits sehr ausgereift und bietet dem KI-Modell eine solide Basis. Fehlt diese Vorarbeit, stößt die KI an ihre Grenzen. Aufgaben, die den Aufbau umfangreicher neuer Theorien erfordern, bleiben vorerst außerhalb der Reichweite. Die Mehrheit der 353 getesteten Erdős-Probleme konnte AlphaProof Nexus daher noch nicht knacken. Das Projekt zeigt dennoch präzise, wie formale Verifizierung die Zuverlässigkeit von KI-Modellen in der Forschung messbar erhöht. Anzeige

Der Papst überrascht mit 5 enorm wichtigen KI-Regeln

aycaramba@all-ai.de (Andreas Becker) — Mon, 25 May 2026 12:10:03 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Der Vatikan hat mit »Magnifica Humanitas« ein offizielles Lehrschreiben zur Regulierung von KI-Modellen veröffentlicht. Papst Leo XIV. kritisiert darin die Machtkonzentration bei großen Technologiekonzernen und fordert verbindliche globale Regulierungen. Zudem warnt das Dokument vor autonomen KI-Waffen, dem hohen ökologischen Fußabdruck und der Ausbeutung von Clickworkern bei der Datenaufbereitung. Vatikan: Encyclical Letter Magnifica Humanitas Papst Leo XIV. greift in seinem aktuellen Lehrschreiben tief in die heutige Technologiedebatte ein. Der Vatikan fordert strikte globale Regulierungen für KI-Modelle und warnt vor einer beispiellosen Machtkonzentration bei wenigen Technologiekonzernen. Dabei werden anders als erwartet sehr relevante und spannende Punkte angesprochen. Die Vorstellung findet gerade auch live auf Youtube statt: Monopole und algorithmische Voreingenommenheit Die Enzyklika mit dem Titel »Magnifica Humanitas« bewertet KI-Technologien nicht als neutrale Hilfsmittel. Vielmehr spiegeln die Modelle laut dem Text unweigerlich die kulturellen Vorannahmen und Voreingenommenheiten ihrer Entwickler wider. Werde dieser Aspekt ignoriert, verfestigen sich Diskriminierungen unbemerkt im Code. Die Bündelung von enormer Rechenleistung und Daten in den Händen weniger Akteure entzieht sich zunehmend der öffentlichen Kontrolle. Der Vatikan sieht darin eine direkte Gefahr für die objektive Wahrheitsfindung und die soziale Gerechtigkeit. Eine kleine Gruppe privater Firmen diktiert de facto die Bedingungen für den digitalen Alltag von Milliarden Menschen. Besondere Kritik richtet sich an den Einsatz von KI-Modellen in sensiblen Entscheidungsprozessen, etwa bei der Vergabe von Krediten, Wohnungen oder bei Personalentscheidungen. Hier verlangt das Dokument eine absolute Nachvollziehbarkeit der ausgegebenen Ergebnisse. Niemand dürfe von einem rein maschinellen Beschluss abhängig sein, ohne dass menschliche Instanzen die letzte Verantwortung übernehmen und korrigierend eingreifen können. Anzeige Die versteckten Kosten der Technologie Ein weiterer Schwerpunkt des Schreibens ist der physische Fußabdruck der digitalen Infrastruktur. Das Training großer KI-Modelle benötigt extreme Mengen an Energie und Wasser. Diese hohe Belastung der natürlichen Ressourcen steht im direkten Widerspruch zu nachhaltigen und ökologischen Zielen, weshalb ressourcenschonende Architekturkonzepte nötig seien. Auch die soziale Dimension der KI-Entwicklung bleibt nicht unerwähnt. Hinter den scheinbar makellosen Ausgaben der KI-Modelle verbirgt sich oft die unsichtbare und schlecht bezahlte Arbeit von Millionen Menschen. Sogenannte Clickworker in einkommensschwachen Regionen übernehmen das Data Labeling und die zermürbende Moderation toxischer Inhalte. Das Schreiben verurteilt diese Praxis als moderne Form der Ausbeutung. Der Vatikan verlangt transparente Lieferketten in der Technologiebranche, die offenzulegen haben, unter welchen Bedingungen die Daten für die großen Modelle aufbereitet werden. Militärische Nutzung und autonome Waffen Äußerst präzise positioniert sich der Text bei der militärischen Nutzung von KI-Modellen. Die Entwicklung und der Einsatz autonomer tödlicher KI-Waffen überschreitet aus Sicht des Vatikans eine klare moralische Linie. Eine Maschine besitzt kein ethisches Urteilsvermögen und kann den Unterschied zwischen Zivilisten und Kombattanten nicht mit menschlicher Weitsicht bewerten. Die Entscheidung über den Einsatz tödlicher Gewalt darf unter keinen Umständen an KI-Modelle delegiert werden. Das Dokument mahnt hier ein verbindliches internationales Regelwerk an, das den aktuellen technologischen Rüstungswettlauf eindämmt. Letztlich muss jederzeit eine identifizierbare Person die Verantwortung für militärische Einsätze tragen. Anzeige Der Kampf um die Wahrheit im Netz Zusätzlich thematisiert die Enzyklika die Manipulation der öffentlichen Meinung durch generative KI-Modelle. Die Leichtigkeit, mit der Texte, Bilder und Videos täuschend echt gefälscht werden können, erschwert die Unterscheidung zwischen Fakt und Fiktion. Diese Desinformation gefährdet den gesellschaftlichen Diskurs erheblich. Medienplattformen nutzen KI-Modelle häufig, um Nutzer durch automatisierte Empfehlungen möglichst lange auf ihren Seiten zu halten. Das verstärkt Polarisierung und begünstigt die Verbreitung extremer Inhalte. Der Vatikan appelliert an die Technologieunternehmen, bei der Auswahl und Präsentation von Inhalten nachvollziehbare Kriterien offenzulegen. Grenzen der technischen Machbarkeit Abschließend warnt das Schreiben eindringlich vor den Ideen des Transhumanismus. Die Vorstellung, den Menschen durch technologische Eingriffe grenzenlos zu optimieren, reduziert ihn auf bloße Leistungsdaten. Intelligenz darf nicht ausschließlich an Rechengeschwindigkeit oder Speicherkapazität gemessen werden. Die bloße Machbarkeit einer neuen Technologie rechtfertigt noch lange nicht deren flächendeckenden Einsatz in der Gesellschaft. Echte technologische Fortschritte ordnen sich immer dem Wohl der Allgemeinheit unter und schützen die Würde jedes Einzelnen. Es obliegt nun den politischen Akteuren, diese Mahnungen in verbindliche Gesetze zu gießen. Für uns ist das Manuskript, auch wenn es von der Kirche stammt, ein sehr guter Ausgangspunkt, um über verschiedene Themen zu diskutieren. Die Probleme sind alle real und nah.

KI-Agenten beenden durch MCP das App-Chaos

aycaramba@all-ai.de (Andreas Becker) — Sun, 24 May 2026 12:50:53 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Das Model Context Protocol verbindet externe KI-Anbieter direkt mit großen KI-Agenten wie Claude oder ChatGPT. Nutzer generieren Bilder, programmieren Code oder erstellen Videos, ohne die zentrale Chat-Oberfläche zu verlassen. Der ständige Wechsel zwischen verschiedenen Anwendungen und das manuelle Kopieren von Inhalten entfallen komplett. Dienste von Ideogram, Higgsfield oder Mistral verschmelzen so zu einer nahtlosen und effizienten Arbeitsumgebung. Ideogram: Ideogram MCP - generate, edit, and train from your assistant Higgsfield: AI Image & Video Generation for Any Agent TechCrunch: WordPress.com now lets AI agents write and publish posts, and more TechCrunch: Google's AI agents will bring you the web now VentureBeat: Mistral launches API for building AI agents that run Python, generate images, perform RAG and more Das ständige Wechseln zwischen verschiedenen KI-Anwendungen gehört der Vergangenheit an. Aktuell etablieren sich zwei völlig neue Ansätze für kreative Aufgaben. Entweder steuern Nutzer spezialisierte KI-Modelle, z.B. Nano Banana direkt aus zentralen Chatbots heraus, oder Fachplattformen binden große KI-Agenten direkt in ihre eigene Umgebung ein. Der direkte Weg über zentrale KI-Agenten Dank des Model Context Protocol greifen KI-Agenten wie Claude oder ChatGPT nun direkt auf externe Dienste zu. Nutzer planen ihre Projekte im gewohnten Chat und rufen bei Bedarf spezialisierte Bild- oder Videogeneratoren auf. Das lästige manuelle Kopieren von Texten und Prompts entfällt dadurch vollständig. Ein anschauliches Beispiel liefert Higgsfield. Der Anbieter verbindet seine Modelle für kinoreife Videos über eine offene Schnittstelle direkt mit gängigen KI-Agenten. So schreibt Claude das Drehbuch und nutzt anschließend Nano Banana Pro für das detaillierte Storyboard. Im letzten Schritt animiert das KI-Modell Seedance 2.0 den finalen Schnitt direkt im Chat. Der gesamte Entwurfsprozess findet statt, ohne dass der Nutzer sein primäres Textfenster verlassen muss. Die KI koordiniert die verschiedenen Teilschritte und Modelle dabei völlig autonom. Twitter Beitrag - Cookies links unten aktivieren. We made a cartoon episode without leaving Claude. Claude writes the story, Nano Banana Pro draws the character sheets and storyboard, Seedance 2.0 animates the final cut. Higgsfield MCP routes it all. What story would you make first? pic.twitter.com/8Z7onrxKGi — Higgsfield AI 🧩 (@higgsfield_ai) May 23, 2026 Plattformen als eigenständige Arbeitsumgebungen Gleichzeitig entwickelt sich ein starker Trend in die entgegengesetzte Richtung. Spezialisierte Plattformen wie Ideogram, Elevenlabs oder auch Higgsfield wandeln sich zu umfassenden Softwareumgebungen, auf denen hauseigene KI-Agenten laufen. Diese Plattformen greifen im Hintergrund auf große Modelle wie Claude zu, um konzeptionelle Entwürfe direkt intern zu generieren. Anschließend koppeln sie diese Textarbeit nahtlos mit ihren eigenen leistungsstarken KI-Modellen. Bei Ideogram können Anwender ein visuelles Konzept direkt auf der Plattform entwerfen und danach sofort in die Detailbearbeitung übergehen. Sobald der KI-Agent den groben Entwurf geliefert hat, nutzen Anwender den Editor von Ideogram für den präzisen Feinschliff. Dort bearbeiten sie die einzelnen Bildebenen, entfernen störende Hintergründe oder skalieren die fertigen Grafiken hoch. Auch Higgsfield bietet diesen plattformzentrierten Ansatz an. Der komplette kreative Prozess, von der ersten Idee über die detaillierte Planung bis hin zum fertigen Video, verbleibt somit innerhalb einer einzigen, hochspezialisierten Umgebung. Anzeige Orchestrierung technischer und redaktioneller Abläufe Die Verschmelzung der verschiedenen Dienste durch offene Standards geht weit über die reine Medienproduktion hinaus. Anbieter wie Mistral stellen Programmierschnittstellen bereit, mit denen Entwickler maßgeschneiderte KI-Agenten für komplexe Unternehmensprozesse bauen können. Diese KI-Modelle führen eigenständig Python-Code aus oder rufen interne Datenbanken ab. Dabei kommunizieren sie reibungslos mit anderen Modellen, um Aufgaben arbeitsteilig und effizient zu lösen. Auch große Web-Plattformen öffnen ihre Infrastruktur für diese zweigleisige Integration. WordPress ermöglicht es KI-Agenten mittlerweile, fundierte Artikel völlig autonom zu verfassen und inklusive Medien direkt zu veröffentlichen. Das Web wird zunehmend zu einem Raum, in dem KI-Modelle selbstständig agieren und Aufgaben plattformübergreifend koordinieren. Anwender profitieren am Ende von äußerst flexiblen Workflows. Sie entscheiden völlig frei, ob sie den KI-Agenten im Chat oder die spezialisierte Fachplattform als Zentrum ihrer täglichen Arbeit nutzen. Anzeige

DeepSeek senkt Preise für KI dauerhaft um 75%

aycaramba@all-ai.de (Andreas Becker) — Sun, 24 May 2026 11:33:01 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ DeepSeek senkt die Preise für sein KI-Modell V4-Pro dauerhaft um 75 Prozent. Gleichzeitig bereitet das Unternehmen eine Finanzierungsrunde mit einer Bewertung von bis zu 50 Milliarden US-Dollar vor. Westliche Anbieter wie Anthropic und Google verteuern ihre KI-Modelle durch neue Tokenizer oder den Wegfall von Flatrates. Unternehmen wie Uber und Microsoft reagieren bereits und kürzen ihre KI-Budgets wegen explodierender Kosten. DeepSeek Models & Pricing Reuters: China's DeepSeek to make permanent 75% price cut on flagship V4-Pro AI model TechCrunch: DeepSeek previews new AI model that 'closes the gap' with frontier models Reuters: DeepSeek value could be up to $50 billion in first fundraising, sources say DeepSeek X Statusmeldung DeepSeek senkt die API-Preise für sein aktuelles KI-Modell V4-Pro dauerhaft um 75 Prozent. Gleichzeitig strebt das chinesische Unternehmen eine Rekordbewertung von 50 Milliarden US-Dollar an. Damit reagiert der Entwickler intelligent auf die steigenden Kosten der westlichen Konkurrenz. Hohe Kosten bremsen die Industrie Amerikanische Anbieter von KI-Modellen erhöhen derzeit faktisch ihre Preise. Anthropic verlangt für Claude Opus 4.7 durch einen veränderten Tokenizer deutlich mehr Geld als für den Vorgänger. Auch Google streicht etablierte, kostenlose Kontingente bei seinem Gemini-Modell. Unternehmen spüren die finanziellen Folgen dieser Preispolitik bereits deutlich. Uber hat sein komplettes KI-Budget für das Jahr 2026 innerhalb von nur vier Monaten aufgebraucht. Sogar Microsoft stornierte kürzlich interne Lizenzen für Claude Code, da die nutzungsbasierte Abrechnung zu teuer wurde. Die Ausgaben für amerikanische KI-Produkte stiegen zuletzt um 20 bis 37 Prozent. Viele Anbieter, darunter das zu Microsoft gehörende GitHub, verabschieden sich von festen Flatrates und setzen auf eine reine Abrechnung nach Nutzung. + Quelle: DeepSeek Asiatischer Preisdruck DeepSeek wählt in dieser Phase einen entgegengesetzten Ansatz und reduziert die Kosten für eine Million Tokens bei V4-Pro dauerhaft auf 0,025 bis 6 Yuan. Zuvor lagen die Preise zwischen 0,1 und 24 Yuan. Ein Bruchteil zur US-Konkurrenz, wie man auf der Grafik sehen kann. Mit diesem Schritt positioniert sich das KI-Modell als Alternative für Unternehmen, deren Budgets durch die aktuellen Kosten stark belastet sind. Token-basierte Abrechnungen zwingen Firmen dazu, die tatsächlichen Betriebskosten der Modelle kritisch zu prüfen. Gleichzeitig plant DeepSeek eine neue Finanzierungsrunde, die den Wert des Unternehmens auf 50 Milliarden US-Dollar steigern könnte. Damit sichert sich der Entwickler frisches Kapital, um die niedrigen Preise langfristig aufrechtzuerhalten. Der Markt für kommerzielle KI-Modelle erfährt somit eine spürbare Neuausrichtung der Preisstrukturen. Anzeige

SpaceX plant den größten Börsengang der Geschichte

aycaramba@all-ai.de (Andreas Becker) — Sat, 23 May 2026 12:35:00 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ SpaceX bereitet den historisch größten Börsengang an der US-Technologiebörse Nasdaq vor. Die veröffentlichten Dokumente legen einen milliardenschweren Infrastrukturvertrag mit dem Entwickler Anthropic offen. Trotz hoher Verluste in der Hardware-Sparte treiben Kooperationen die Einnahmen für KI-Infrastruktur an. Die Platzierung gilt als wichtiger Gradmesser für die kommenden Börsengänge von OpenAI und Anthropic. t3n – Mega-IPO von SpaceX: So können Anleger schon vorab investieren t3n – Warum Milliardenverluste Elon Musks Mega-Plan nicht stoppen The Verge – SpaceX just filed for what could be the biggest IPO ever The Verge – Anthropic is paying $15 billion a year for access to Elon Musk's data centers Wired – SpaceX IPO Filing Reveals Anthropic Is Paying $15 Billion a Year to Access Its Data Centers Das Raumfahrt- und KI-Unternehmen SpaceX bereitet den historisch größten Börsengang an der Nasdaq vor. Das S-1-Formular bei der US-Börsenaufsicht gibt erstmals Einblick in die finanzielle Struktur hinter den Kulissen. Die Dokumente enthüllen überraschende Partnerschaften und finanzielle Verflechtungen auf dem Markt für KI-Modelle. Ein historischer Schritt aufs Parkett Mit dem geplanten Börsengang im Juni 2026 visiert das Unternehmen von Elon Musk eine Bewertung von bis zu 1,75 Billionen US-Dollar an. Ein solches Volumen übertrifft alle bisherigen Rekorde der Finanzgeschichte bei weitem. Bisher hielt der staatliche Ölkonzern Saudi Aramco mit einem Emissionsvolumen von rund 29,4 Milliarden US-Dollar im Jahr 2019 den weltweiten Spitzenplatz. Auch der chinesische E-Commerce-Riese Alibaba setzte im Jahr 2014 mit 25 Milliarden US-Dollar Maßstäbe an der New Yorker Börse. Der geplante Schritt von SpaceX hebt die Bedingungen für Technologieunternehmen nun in eine völlig neue Dimension. Anzeige Die Relevanz für den Kapitalmarkt Die Veröffentlichung des Börsenprospekts gewährt Investoren seltene Einblicke in ein Imperium, das längst nicht mehr nur Raketen baut. Das Papier zeigt, wie stark die Zukunft des Unternehmens mittlerweile mit der Bereitstellung von Rechenkapazitäten verknüpft ist. Für private Anleger eröffnet sich damit die Chance, direkt in die physische Basis moderner Rechenzentren zu investieren. Großbanken wie Goldman Sachs führen das Konsortium für die Notierung unter dem Kürzel »SPCX« an. Das Interesse an den Aktien gilt schon vor dem offiziellen Erstausgabetag als außergewöhnlich hoch. Rekorde im All und ein überraschender Deal Technisch demonstrierte das Unternehmen erst gestern seine Leistungsfähigkeit, als der zwölfte Testflug der Starship-Rakete rund 45 Tonnen Nutzlast erfolgreich in den Orbit transportierte. Dies markiert das höchste in den Weltraum beförderte Gewicht seit dem Start der Skylab-Raumstation im Jahr 1973. Wirtschaftlich sorgt parallel eine Vereinbarung mit dem Entwickler Anthropic für Aufsehen. Das Startup bezahlt monatlich 1,25 Milliarden US-Dollar, um Zugriff auf die Rechencluster in Memphis zu erhalten. Diese Partnerschaft sichert langfristige Einnahmen durch die Bereitstellung von Rechenleistung für hochentwickelte KI-Modelle. Twitter Beitrag - Cookies links unten aktivieren. pic.twitter.com/C8wKrXoT7K — Elon Musk (@elonmusk) May 23, 2026 Hohe Verluste im Schatten der Server Trotz der enormen Zuflüsse offenbart der Börsenprospekt erhebliche Defizite im Bereich der Hardware-Infrastruktur. Die KI-Sparte verzeichnete im vergangenen Jahr einen operativen Verlust von 6,4 Milliarden US-Dollar bei Gesamtausgaben von fast 13 Milliarden US-Dollar. Besonders die Beschaffung moderner Grafikprozessoren bindet enorme Summen an Kapital. Diese immensen Vorabinvestitionen belasten die Bilanz kurzfristig stark und führten im ersten Quartal 2026 zu einem Gesamtverlust von 1,9 Milliarden US-Dollar. Signalwirkung für kommende Börsengänge Der für Mitte Juni geplante Gang an die Technologiebörse Nasdaq wird von Branchenkennern aufmerksam beobachtet, da er als Gradmesser für den gesamten Sektor gilt. Die angestrebte Bewertung im Bereich von bis zu 1,75 Billionen US-Dollar könnte Elon Musk zum reichsten Menschen der Geschichte machen. Der Erfolg dieser Platzierung dürfte außerdem spürbare Auswirkungen auf die gesamte KI-Branche haben. Sowohl OpenAI als auch Anthropic planen für das laufende Jahr eigene Schritte auf das öffentliche Parkett. Sollte sich die Marktbewertung von SpaceX stabilisieren, dürfte dies das Vertrauen der Investoren in kapitalintensive Geschäftsmodelle nachhaltig stärken. Die kommenden Wochen werden zeigen, ob das große Interesse der privaten Märkte nahtlos auf die öffentlichen Börsen übergeht. Die Bilanzen verdeutlichen jedenfalls, dass die Entwicklung moderner KI-Modelle untrennbar mit großen Infrastrukturinvestitionen verbunden bleibt. Anzeige

Project Glasswing findet zehntausend kritische Schwachstellen

aycaramba@all-ai.de (Andreas Becker) — Sat, 23 May 2026 11:59:09 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Anthropic hat ein wichtiges Update zum Sicherheitsprojekt Project Glasswing mit dem KI-Modell Claude Mythos Preview vorgelegt. Die KI entdeckte innerhalb eines Monats über zehntausend kritische Schwachstellen in globaler Software. Menschliche Entwickler stoßen beim Überprüfen und Patchen der Fehler an ihre kapazitären Grenzen. Wegen der Gefahr von automatisiertem Schadcode bleibt das leistungsfähige KI-Modell vorerst unveröffentlicht. Anthropic – Project Glasswing: An initial update Das KI-Sicherheitsprojekt »Project Glasswing« liefert erste wichtige Zwischenergebnisse zur Absicherung globaler Software. Das neue KI-Modell Claude Mythos Preview spürt kritische Schwachstellen in einer extremen Geschwindigkeit auf. Menschliche Entwickler stoßen beim Einspielen von Sicherheitsupdates bereits an ihre Grenzen. Erste Ergebnisse der Initiative Nach nur einem Monat zeigt die Sicherheitsinitiative erstaunliche Resultate bei der Überprüfung kritischer Infrastrukturen. Die beteiligten Partner verzeichnen eine enorme Beschleunigung bei der Erkennung von Schwachstellen. So fand Mozilla beim Testen des Browsers Firefox 150 insgesamt 271 Sicherheitslücken. Dies entspricht einer Verzehnfachung der Funde im Vergleich zu älteren KI-Modellen. Auch der Netzwerkspezialist Cloudflare meldet rund 2.000 identifizierte Fehler auf seinen Systemen. Die Genauigkeit der KI übertraf laut den Testern sogar die Quoten menschlicher Experten. Anzeige Der Mensch als neuer Flaschenhals Die Flut an automatisierten Entdeckungen stellt Open-Source-Entwickler vor enorme Probleme. Der Aufwand für die manuelle Überprüfung und das Erstellen von Updates ist kaum zu bewältigen. Einige Teams baten bereits darum, das Tempo der Meldungen zu drosseln. Es fehlt schlicht an personellen Kapazitäten für die Absicherung der betroffenen Software. Ein konkretes Beispiel betrifft die weitverbreitete Verschlüsselungsbibliothek wolfSSL, die auf Milliarden Geräten läuft. Die KI demonstrierte hierbei direkt, wie Angreifer gefälschte Zertifikate für Bankseiten erstellen könnten. Das Patchen solcher kritischen Fehler dauert im Schnitt zwei Wochen. Keine Veröffentlichung für die Allgemeinheit Wegen des hohen Missbrauchspotenzials bleibt Claude Mythos Preview vorerst unter Verschluss. Funktionierende Schutzmaßnahmen gegen die automatisierte Erstellung von Schadcode fehlen bisher. Ohne diese Barrieren könnten Angreifer die Technologie für automatisierte Attacken nutzen. Für Unternehmenskunden steht eine weniger riskante Variante auf Basis von Claude Opus 4.7 bereit. Diese assistiert IT-Teams dabei, eigene Anwendungen abzusichern und schlägt passende Korrekturen vor. Damit soll die digitale Verteidigung gestärkt werden, bevor leistungsfähigere Modelle regulär erscheinen.

Trump macht Rolle rückwärts bei KI-Regulierung

aycaramba@all-ai.de (Andreas Becker) — Fri, 22 May 2026 10:13:18 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ US-Präsident Donald Trump hat einen fast fertigen Erlass zur Regulierung von KI-Modellen kurzfristig gestoppt. Die Verordnung sah eine freiwillige, 90-tägige Vorabprüfung leistungsstarker KI-Modelle durch Bundesbehörden vor. Tech-Vertreter intervenierten aus Sorge vor Innovationsbremsen und Nachteilen im Wettbewerb mit China. Zudem blockierten interne Kompetenzstreitigkeiten zwischen US-Geheimdiensten und dem Handelsministerium das Vorhaben. The Washington Post - Trump delays executive order on AI oversight hours before planned signing Politico - Trump yanked AI order after David Sacks raised industry concerns Axios - Scoop: Trump AI executive order seeks early government access to frontier models Politico - Trump's big AI order could land as soon as Thursday The New York Times - Trump Cancels Signing of A.I. Executive Order US-Präsident Donald Trump hat die Unterzeichnung einer weitreichenden Regierungsanordnung zur KI-Regulierung überraschend gestoppt. Der geplante Erlass sah eine freiwillige Vorabprüfung neuer KI-Modelle vor, um Cyberrisiken rechtzeitig zu minimieren. Einspruch aus der Tech-Branche verhinderte die Unterzeichnung in letzter Sekunde. Strengere Kontrollen für neue KI-Modelle geplant Die amerikanische Regierung plante eine intensivere Überprüfung leistungsstarker KI-Modelle, sogenannter Frontier-Modelle, vor deren Veröffentlichung. Die Betreiber sollten neue Entwicklungen bis zu 90 Tage vor der Markteinführung Regierungsbehörden zur Analyse überlassen. Ziel war es, potenzielle Gefahren für kritische Infrastrukturen wie Banken und Krankenhäuser frühzeitig zu identifizieren. Besonders im Fokus standen neuartige KI-Modelle wie »Mythos« von Anthropic oder »GPT-5.5-Cyber« von OpenAI. Diese hochentwickelten KI-Modelle zeigten in Tests die Fähigkeit, Sicherheitslücken in digitalem Programmcode extrem schnell zu finden und auszusetzen. Die geplante Verordnung sollte sicherstellen, dass nationale Sicherheitsbehörden Gegenmaßnahmen einleiten können, bevor kriminelle Akteure diese Fähigkeiten missbrauchen. Anzeige Tech-Branche warnt vor Innovationsbremsen Kurz vor der geplanten feierlichen Unterzeichnung, zu der bereits Einladungen an führende Köpfe der Tech-Industrie verschickt waren, wuchs der Widerstand aus dem Silicon Valley. Branchenvertreter wie David Sacks intervenierten direkt beim Präsidenten und äußerten erhebliche Bedenken gegen das Vorhaben. Sie warnten davor, dass aus einer anfänglich freiwilligen Prüfung im Laufe der Zeit eine verpflichtende bürokratische Hürde entstehen könnte. Diese Bedenken zeigten Wirkung, da der Präsident eine Schwächung der heimischen Wirtschaft befürchtete. Er betonte nach der Absage, dass amerikanische Unternehmen im globalen Wettbewerb, insbesondere gegenüber China, nicht zurückfallen dürften. Behördenstreit verzögert die Regulierung Hinter den Kulissen der US-Regierung offenbarte sich zudem ein tiefer Konflikt über die Zuständigkeit für die KI-Überwachung. Nationale Sicherheitsbehörden wie der Geheimdienst NSA und das Finanzministerium forderten eine stärkere Rolle bei der Kontrolle der KI-Modelle. Sie versuchten, das im Handelsministerium angesiedelte Institut für KI-Sicherheit zu verdrängen, was zu internen Blockaden führte. Zusätzlich war vorgesehen, erhebliche Mittel für die Einstellung von Cybersicherheitsexperten in Bundesbehörden bereitzustellen. Da jedoch zuvor Stellen bei der zuständigen Behörde für Cybersicherheit gekürzt wurden, stieß dieser Plan auf organisatorische Hindernisse. Wie sich die amerikanische Politik bezüglich der Regulierung kommender KI-Modelle weiterentwickelt, bleibt nach diesem kurzfristigen Stopp vorerst unklar.

Google legt uns mit Gemini 3.5 Flash rein

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 21:05:12 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google hat den Basispreis für Gemini 3.5 Flash auf 9 US-Dollar verdreifacht. Das KI-Modell verbraucht durch intensives Reasoning selbst auf niedriger Stufe extrem viele Gedanken-Token. In unabhängigen Benchmarks ist die Flash-Variante dadurch im Betrieb teurer als Gemini 3.1 Pro. Nutzer sollten den Thinking-Modus genau prüfen, da Google Abos auf den Echtzeit-Verbrauch umstellt. All AI - Gemini und Claude: Rechenleistung im Abo Google präsentiert Gemini 3.5 Flash als das neue, schnelle Mittelklasse-Modell. In der Praxis entpuppt sich die Architektur jedoch als Kostenfalle für Nutzer. Das KI-Modell übersteigt durch einen exzessiven Token-Verbrauch sogar die Ausgaben für das Flaggschiff Gemini 3.1 Pro. Versteckte Kosten durch Denkprozesse Tests von mir mit identischen Prompts und der Einstellung »low« für das Reasoning zeigen ein unerwartetes Verhalten. Gemini 3.5 Flash greift bei nahezu jeder Anfrage auf umfangreiche interne Denkprozesse zurück. Dabei generiert das KI-Modell Tausende sogenannte Thinking-Tokens, die das Kontextfenster füllen und letztlich auf der Rechnung landen. Gemini 3.1 Pro verzichtet im direkten Vergleich bei vielen meiner Aufgaben komplett auf diesen Zwischenschritt oder verbraucht deutlich weniger. Dies führt dazu, dass die vermeintlich günstige Flash-Variante für dieselbe Aufgabe am Ende deutlich mehr Output liefert und natürlich auch berechnet. + Messungen des Artificial Analysis Index bestätigen dieses Bild. Der Standard-Parcours kostet bei Gemini 3.5 Flash rund 1.552 US-Dollar, während das Pro-Modell die gleichen Aufgaben für 892 US-Dollar abschließt. Der Hauptgrund für diese Differenz liegt in den Reasoning-Kosten, die bei der Flash-Architektur unverhältnismäßig hoch ausfallen. + Quelle: https://artificialanalysis.ai/ Auf dem Bild sind zwei interessante Dinge zu sehen. Der grüne Bereich zeigt, dass Gemini Flash fast genauso teuer ist wie die Pro-Variante. Der hellgrüne Bereich zeigt die »Thinking«-Kosten und macht damit deutlich, dass Flash deutlich länger und intensiver nachdenkt. Preispolitik rückt die Modelle zusammen Frühere Generationen wiesen einen deutlichen Preisabstand auf. Gemini 2.5 Flash kostete mit 2,50 US-Dollar nur einen Bruchteil des 15 US-Dollar teuren Pro-Modells. Auch Gemini 3 Flash ist nur minimal auf 3 US-Dollar angestiegen. Dieser Abstand verringert sich nun spürbar. Für das aktuelle Gemini 3.1 Pro ruft Google 12 US-Dollar auf, bei extrem großen Kontextfenstern über 200.000 Token sind es 18 US-Dollar. Gemini 3.5 Flash schlägt mittlerweile mit 9 US-Dollar zu Buche. Damit kostet es mehr als dreimal so viel wie ältere Flash-Versionen. Kombiniert man nun den gestiegenen Grundpreis mit dem ausufernden Token-Verbrauch für das Nachdenken, kippt die Wirtschaftlichkeit. Das für Effizienz ausgelegte KI-Modell unterbietet den großen Bruder im Alltag schlicht nicht mehr. Ganz im Gegenteil: Bei mir persönlich ist es bei identischen Workflows über die API immer teurer! Anzeige Leistungssprung mit Lücken Angesichts der hohen Betriebskosten rückt die Leistungsfähigkeit in den Fokus. Gemini 3.5 Flash muss nicht nur besser sein als sein Vorgänger, sondern auch deutlich besser als Gemini 3.1 Pro. Im übergreifenden Intelligence Index liegt aber Gemini 3.5 Flash weiterhin knapp zwei Punkte hinter Gemini 3.1 Pro. Die Testergebnisse zeigen zudem, dass die neue Architektur sich weniger strikt an detaillierte Systemvorgaben hält. + Quelle: https://artificialanalysis.ai/ Eine bemerkenswerte Stärke zeigt Gemini 3.5 Flash hingegen im Agentic Index. Hier deklassiert es das Pro-Modell um über zehn Punkte und erreicht mit einem Wert von 70,3 nahezu das Niveau von Claude Opus 4.7. Wer KI-Modelle für autonome Aufgabenketten nutzt, findet hier einen klaren Mehrwert. + Quelle: https://artificialanalysis.ai/ Auch bei der reinen Ausgabegeschwindigkeit dominiert die Flash-Architektur. Mit 219 Token pro Sekunde arbeitet es fast doppelt so schnell wie Gemini 3.1 Pro. Dieser Vorteil verpufft jedoch in der Praxis, wenn das KI-Modell für die Lösung einer Aufgabe doppelt so viele Token benötigt. Trotzdem können hier beiden Gemini Modelle grundsätzlich überzeugen. + Quelle: https://artificialanalysis.ai/ Das Problem wird noch größer Die gestiegenen Kosten treffen Nutzer derzeit besonders hart, da Google die Strukturen seiner Abonnements umstellt. Ähnlich wie beim Konkurrenten Claude basieren die Limits nicht mehr auf pauschalen Freikontingenten, sondern auf der reellen Rechenleistung und den tatsächlichen API-Kosten. Jeder generierte Token und jeder intensive Denkprozess verringern das verfügbare Budget nun unmittelbar. Nutzer müssen ihre Workflows daher präzise evaluieren, um die Kontingente nicht vorzeitig zu erschöpfen. Es gilt abzuwägen, für welche spezifischen Aufgaben große KI-Modelle oder der ressourcenhungrige »Thinking«-Modus zwingend erforderlich sind. Für simple Textarbeiten oder grundlegende Unterhaltungen empfiehlt sich stattdessen ein rechtzeitiger Wechsel auf sparsamere Varianten wie Flash Light. Und zum Schluss noch eine Vermutung. Meiner Meinung nach schreit der gesamte Artikel danach, dass wir im nächsten Monat ein starkes Gemini 3.5 Pro erleben werden, das aber vor allem auch deutlich im Preis steigen wird. Claude Opus 4.7 lässt grüßen... Anzeige

Anthropic behebt heimlich Sicherheitslücke in Claude Code

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 18:30:54 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Anthropic behob eine gefährliche Sicherheitslücke in der Netzwerk-Sandbox des KI-Modells Claude Code. Durch eine SOCKS5-Null-Byte-Injektion konnten Angreifer in Kombination mit Prompt-Injection Daten exfiltrieren. Die Behebung erfolgte ohne offizielle Sicherheitswarnung oder eine spezifische CVE-Kennung für das Produkt. oddguan.com - Another Anthropic Claude Code Network Sandbox Bypass Enables Data Exfiltration The Register - Even Claude agrees: hole in its sandbox was real and dangerous Anthropic hat eine kritische Sicherheitslücke in der Sandbox des KI-Modells Claude Code geschlossen. Die Schwachstelle erlaubte die Exfiltration sensibler Daten, wurde vom Unternehmen jedoch ohne offizielle Sicherheitswarnung oder eine eigene CVE-Kennung behoben. SOCKS5-Injektion umgeht Filterregeln Die Schwachstelle basierte auf einer SOCKS5-Hostname-Null-Byte-Injektion in der Sandbox-Laufzeitumgebung. Angreifer konnten dabei eine Filterregel austricksen, indem sie ein Null-Byte in die Zieladresse einschleusten. Während die Filterkomponente der KI die manipulierte Adresse als erlaubt einstufte, schnitt das Betriebssystem den Text ab und stellte eine Verbindung zu einem blockierten Server her. Betroffen waren alle Versionen seit der Einführung der Netzwerk-Sandbox im Oktober des vergangenen Jahres bis zur Version 2.1.89. Besonders kritisch war diese Schwachstelle in Kombination mit einem Prompt-Injection-Angriff. Über versteckte Anweisungen in ausgelesenen Dateien konnte Schadcode innerhalb der Sandbox ausgeführt werden. Dadurch ließen sich private Daten wie Token, Quellcode und Zugangsdaten unbemerkt an externe Server übertragen. Anzeige Heimlicher Patch sorgt für Kritik Sicherheitsforscher kritisieren nun den intransparenten Umgang des Anbieters mit diesem Vorfall. Anthropic korrigierte den Fehler zwar mit der Version 2.1.90 des KI-Modells, verzichtete jedoch auf Einträge im Changelog oder eine Benachrichtigung der Anwender. Es wird bemängelt, dass für das betroffene KI-Modell keine eigene CVE-Kennung beantragt wurde. Das Unternehmen erklärte dazu, den Fehler bereits vor dem externen Hinweis intern entdeckt und behoben zu haben. Nutzer blieben dadurch allerdings monatelang im Ungewissen über das tatsächliche Schutzniveau ihrer Sandbox. Sogar das KI-Modell selbst bewertete die Schwachstelle nach einer Demonstration durch Forscher als eine echte und gefährliche Umgehung der Netzwerksicherheit. Anwender sollten daher sicherstellen, dass ihre Installationen auf dem neuesten Stand sind.

ElevenLabs verwandelt Chatbots in Voicebots mit einem Prompt

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 17:58:03 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ ElevenLabs hat die neue Audio-Ebene Speech Engine für bestehende Chatbots veröffentlicht. Die Integration erfolgt über ein SDK, ohne die vorhandene LLM- oder RAG-Architektur zu verändern. Integrierte Funktionen ermöglichen eine präzise Sprechpausen-Erkennung und ein automatisches Unterbrechungs-Management. Die Technologie unterstützt die Transkription in 90 Sprachen und die Sprachausgabe in über 70 Sprachen. ElevenLabs – Speech Engine Produktseite ElevenLabs Dokumentation – Speech Engine Übersicht ElevenLabs Dokumentation – Speech Engine Quickstart ElevenLabs Dokumentation – API-Referenz: Speech Engine erstellen ElevenLabs Dokumentation – API-Referenz: Speech Engine abrufen Ein einziger Prompt genügt, um bestehende textbasierte Chatbots in vollwertige Voicebots zu verwandeln. Die neue Audio-Ebene »Speech Engine« von ElevenLabs ermöglicht diese direkte Transformation, ohne dass Entwickler die bestehende KI-Infrastruktur oder Datenbasis anpassen müssen. Flexibler Audio-Aufsatz für bestehende KI-Modelle Die Integration erfolgt über ein SDK für JavaScript oder Python und setzt direkt auf der vorhandenen Infrastruktur auf. Entwickler behalten dadurch die vollständige Kontrolle über die Gesprächslogik, die Datenabfrage per RAG sowie das gewählte KI-Modell. Die Verbindung zum Server wird über das WebSocket-Protokoll hergestellt. Das SDK bietet eine integrierte Stream-Extraktion für etablierte KI-Modelle von OpenAI, Anthropic und Google. Für andere Anbieter lässt sich die Textausgabe als einfacher String übertragen. Im Gegensatz zur vollständig verwalteten Plattform ElevenAgents richtet sich diese Lösung an Entwickler, die eigene Inferenz-Strukturen nutzen wollen. + Quelle: Elevenlabs Zwei Prompts zum Glück Server SDK Prompt Copy import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js"; import "dotenv/config"; const elevenlabs = new ElevenLabsClient({ apiKey: process.env.ELEVENLABS_API_KEY, }); const engine = await elevenlabs.speechEngine.create({ name: "My Speech Engine", speechEngine: { // Note we use the wss protocol instead of https wsUrl: "wss://abc123.ngrok.io/ws", }, }); console.log("Speech Engine ID:", engine.engineId); Prompt vollständig anzeigen Client SDK Copy import express from "express"; import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js"; import "dotenv/config"; const app = express(); const elevenlabs = new ElevenLabsClient({ apiKey: process.env.ELEVENLABS_API_KEY }); const speechEngineId = "seng_8k3m9xr4hjnfg983brhmhkd98n6"; app.get("/api/token", async (req, res) => { const { token } = await elevenlabs.conversationalAi.conversations.getWebrtcToken({ agentId: speechEngineId }); res.json({ token }); }); app.listen(3002, () => console.log("Token server listening on port 3002")); Prompt vollständig anzeigen Intelligente Steuerung natürlicher Konversationen Die neue Audio-Ebene kombiniert mehrere spezialisierte KI-Modelle, um eine minimale Latenz im realen Einsatz zu gewährleisten. Die Transkription der Nutzersprache unterstützt mehr als 90 Sprachen. Für die eigentliche Sprachausgabe stehen über 70 Sprachen sowie eine Bibliothek von 11.000 vorgefertigten Stimmen zur Verfügung. Für einen flüssigen Austausch sorgen integrierte Automatismen: Sprechpausen-Erkennung: Das KI-Modell unterscheidet präzise zwischen kurzen Pausen und dem tatsächlichen Ende einer Aussage. Unterbrechungs-Management: Sobald der Nutzer spricht, wird die Audioausgabe automatisch über ein Abbruchsignal gestoppt. Geräuschfilterung: Hintergrundgeräusche werden isoliert, sodass nur klare Audiosignale die Transkription erreichen. Die Steuerung der Sitzungen im Browser oder in mobilen Anwendungen wird über eine WebRTC-Token-Anbindung realisiert. Damit steht Entwicklern eine umfassende Architektur für die direkte Sprachinteraktion zur Verfügung. Anzeige

Anthropic überrascht als erstes KI-Unternehmen mit Gewinn

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 14:05:59 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Anthropic erwartet im zweiten Quartal 2026 den ersten operativen Gewinn der Unternehmensgeschichte. Der Umsatz steigt voraussichtlich um 130 Prozent auf 10,9 Milliarden Dollar. Wichtigste Treiber sind die hohe Nachfrage nach Coding-Tools und autonomen Funktionen des KI-Modells Claude. Trotz sinkender interner Infrastrukturkosten steigen die Preise für Endnutzer durch veränderte Token-Berechnungen. The Wall Street Journal: Mind-Blowing Growth Is About to Propel Anthropic Into Its First Profitable Quarter Handelsblatt: Anthropic: Claude-Entwickler könnte erstmals Gewinne vorlegen TechCrunch: Anthropic says it's about to have its first profitable quarter CNBC: Anthropic set to hit $10.9 billion in revenue during second quarter, source says Yahoo Finance: Anthropic revenue set to more than double to $10.9 billion in Q2 Der KI-Entwickler Anthropic steuert im zweiten Quartal 2026 auf den ersten operativen Gewinn seiner Geschichte zu. Ein Umsatzsprung von 130 Prozent auf 10,9 Milliarden Dollar treibt das Unternehmen überraschend früh in die schwarzen Zahlen. Enormes Wachstum durch autonome KI-Modelle Angetrieben wird diese Entwicklung durch eine starke Nachfrage nach spezialisierten Coding-Tools. Unternehmen setzen vermehrt auf die sogenannten agentischen Fähigkeiten des KI-Modells Claude, das komplexe Aufgaben über längere Zeiträume hinweg eigenständig löst. Diese intensive Nutzung führte stellenweise zu Engpässen bei den Kapazitäten, weshalb neue Verträge für Rechenzentren unter anderem mit SpaceX vereinbart wurden. Die hohe Nachfrage übertrifft die internen Prognosen der Unternehmensführung deutlich. Noch im vergangenen Sommer kalkulierte das Management mit Verlusten bis zum Jahr 2028. Für das im Juni endende Quartal wird nun jedoch ein operativer Gewinn von 559 Millionen Dollar erwartet. Damit wächst das Unternehmen in dieser Phase schneller als historische Vorbilder wie Google oder Facebook vor ihren Börsengängen. Anzeige Effizienzsteigerung und steigende Token-Preise Parallel zum Umsatzwachstum verbesserte sich die Effizienz bei den internen Betriebskosten. Gab Anthropic im ersten Quartal noch 71 Cent pro eingenommenem Dollar für Rechenleistung aus, sinkt dieser Wert im laufenden Vierteljahr auf 56 Cent, da strategische Partnerschaften mit Google und Amazon genutzt werden. Amodei beschrieb das Wachstum auf der Claude Entwicklerkonferenz übrigens scherzhaft als »just crazy« und »too hard to handle« und fügte hinzu, er hoffe auf »more normal growth«. Gespannt darf man jetzt sein, ob das ein dauerhafter Zustand sein wird und ob andere KI-Unternehmen dem folgen können.

FLUX Erase schlägt Konkurrenz bei der Bildbearbeitung

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 13:33:00 +0200

Flux Kurzfassung ▾ Quellen ▾ Black Forest Labs hat das neue KI-Modell FLUX Erase zur maskenbasierten Bildbearbeitung vorgestellt. Es entfernt störende Objekte, Personen oder Texte automatisch ohne die Eingabe von Prompts. Im Vergleich zur Konkurrenz arbeitet das Modell rund viermal schneller und ist deutlich kostengünstiger. Interessierte können die Technologie über eine kostenlose Webdemo oder eine API nutzen. Black Forest Labs: FLUX Erase — remove anything, leave no trace Black Forest Labs: FLUX Erase Demo Black Forest Labs hat das neue KI-Modell FLUX Erase zur intelligenten Bildbearbeitung vorgestellt. Die Neuentwicklung entfernt störende Objekte oder Personen maskenbasiert ohne zusätzliche Texteingaben und arbeitet dabei rund viermal schneller sowie kostengünstiger als etablierte KI-Modelle der Konkurrenz. Hohe Bildqualität ohne Text-Prompts Das KI-Modell rekonstruiert Bildhintergründe nach der einfachen Markierung unerwünschter Bereiche nahtlos. Dabei passt es Texturen, Lichtverhältnisse und Schatten automatisch an die Umgebung an. Anwender müssen dafür keinen beschreibenden Prompt eingeben. Neben klassischen Gegenständen oder Personen retuschiert die neue Technologie auch komplexe Bildelemente wie Textpassagen und Wasserzeichen verlässlich. Eine Besonderheit ist, dass neben dem maskierten Bereich auch die angrenzenden Bereiche automatisch in Bezug auf Schatten und Licht angepasst werden. In einer menschlichen Qualitätsbewertung mit 198 Testbildern erzielte das KI-Modell eine überlegene Gewinnrate von 68,5 Prozent gegenüber GPT Image-2 und 63,2 Prozent gegen Finegrain Eraser Standard. Während es zu Nano Banana 2 exakte Parität hält, liegt es nur minimal hinter der Pro-Version dieses Anbieters. + Quelle: Black Forest Labs Enormer Vorsprung bei Tempo und Budget Der größte Vorteil der Neuentwicklung liegt in der extremen Effizienz. Mit einer durchschnittlichen Latenz von 4,54 Sekunden pro Megapixel arbeitet die Bildkorrektur etwa viermal schneller als die versammelte Konkurrenz. Das zweitschnellste KI-Modell benötigt im direkten Vergleich bereits über zwölf Sekunden. Gleichzeitig unterbietet die Neuvorstellung die Preise der qualitativ vergleichbaren Konkurrenz deutlich. Ein Megapixel-Output kostet über die Schnittstelle 0,034 US-Dollar, womit das KI-Modell rund viermal günstiger arbeitet als Nano Banana Pro. + Quelle: Black Forest Labs Für einen unkomplizierten Einstieg steht eine kostenlose Webdemo bereit, mit der sich die Fähigkeiten direkt im Browser ausprobieren lassen. Entwickler können das KI-Modell für professionelle Projekte zudem direkt über die hauseigene API einbinden. Anzeige

Gemini folgt Claude und rechnet nach Rechenleistung ab

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 10:59:39 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google stellt die Gemini-Nutzerlimits auf Basis der verbrauchten Rechenleistung um. Die Komplexität der Prompts, genutzte Funktionen und Chatlängen bestimmen fortan das Kontingent. Die Limits aktualisieren sich alle fünf Stunden und bieten im Pro-Abo vierfache Kapazität. Ein neues Ultra-Abonnement bietet für ein hohes monatliches Entgelt die fünffache Kapazität von Pro. Gemini-Apps-Hilfe: Nutzungslimits und Upgrades für Google AI-Abos Google Blog: Everything new in our Google AI subscriptions, fresh from I/O 2026 Google One: Google AI Plans with Cloud Storage Google ändert die Bedingungen für die eigenen KI-Abos grundlegend. Statt starrer täglicher Abfragen bestimmt die verbrauchte Rechenleistung die Limits für die Nutzung von Gemini. Komplexe Eingaben und lange Chats erschöpfen das Kontingent nun schneller. Komplexität bestimmt den Verbrauch Die verbrauchte Rechenleistung wird fortan in Echtzeit berechnet. Ein einfacher Prompt verbraucht weniger Kontingent als rechenintensive Funktionen wie Deep Research oder die Generierung von Medien. Das zugewiesene Limit aktualisiert sich alle 5 Stunden, sofern die wöchentliche Obergrenze noch nicht erreicht wurde. Falls das Kontingent vorzeitig erschöpft ist, erfolgt eine automatische Herabstufung auf ein kleineres KI-Modell. Dadurch bleibt der Chat zumindest für einfache Textaufgaben weiterhin einsatzbereit. Gleichzeitig bedeutet das aber auch, dass man sich überlegen sollte, ob man standardmäßig immer das Pro-Modell auswählen sollte, selbst wenn die Flash-Variante ausreicht. Anzeige Neue Tarife für hohe Ansprüche Die Kosten und Kapazitäten orientieren sich strikt an den gewählten Abo-Modellen. Der Tarif KI Plus bietet für monatlich 8 US-Dollar die doppelte Kapazität des kostenfreien Zugangs. Das Abonnement KI Pro kostet weiterhin knapp 20 US-Dollar und gewährt das vierfache Limit des Standardzugangs. Für Entwickler und professionelle Anwender führt Google eine neue Ultra-Stufe für rund 100 US-Dollar im Monat ein. Dieses Paket bietet die fünffache Kapazität des Pro-Tarifs. Zudem erhalten Abonnenten ein KI-Guthaben für zusätzliche Funktionen der Anwendungen Flow und Google Antigravity. + Quelle: Google Parallelen zum Konkurrenten Anthropic Mit dieser Umstellung folgt der Anbieter einem klaren Trend in der Branche. Der Konkurrent Anthropic berechnet die Nutzung für das eigene KI-Modell Claude schon länger auf Basis der beanspruchten Rechenleistung. Dort führen lange Kontexte oder umfangreiche Dokumente ebenfalls zu einer schnellen Erschöpfung der Limits. Die Pauschalmodelle für die Nutzung von Spitzenmodellen stoßen aufgrund der enormen Rechenkosten zunehmend an ihre wirtschaftlichen Grenzen. Die neuen Tarife spiegeln diese veränderte Realität der Infrastrukturkosten wider.

Anthropic und X: Der wahre Grund der Zusammenarbeit

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 06:30:12 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Anthropic mietet für 1,25 Milliarden US-Dollar pro Monat das Colossus-1-Rechenzentrum von xAI. Der Vertrag läuft bis Mai 2029 und bringt xAI einen potenziellen Umsatz von über 40 Milliarden Dollar. Grund für den Deal ist die gesunkene Nutzung des hauseigenen KI-Assistenten Grok bei xAI. Durch das neue Modell agiert xAI als eine Art Neocloud auf dem Markt für KI-Modelle. TechCrunch - Anthropic will pay xAI $1.25B per month for compute Anthropic kauft für seine KI-Modelle immense Rechenkapazitäten beim Konkurrenten xAI ein. Das Geschäft umfasst die gesamte Leistung des Colossus-1-Rechenzentrums in Tennessee. Dafür fließen monatlich 1,25 Milliarden US-Dollar an das Unternehmen von Elon Musk. Milliarden für die nötige Rechenleistung Die Details dieser weitreichenden Vereinbarung gehen aus einem aktuellen S-1-Börsenprospekt von SpaceX an die US-Börsenaufsicht SEC hervor. Der Vertrag läuft bis zum Mai 2029 und sieht eine zweimonatige Anlaufphase vor, in der Anthropic von rabattierten Preisen profitiert. Insgesamt könnte dieses Geschäft xAI einen Umsatz von mehr als 40 Milliarden US-Dollar einbringen. Beide Parteien behalten sich jedoch das vertragliche Recht vor, die Vereinbarung mit einer Frist von 90 Tagen flexibel zu kündigen. Anzeige Ein neuer Ansatz auf dem Markt Normalerweise bauen Entwickler von KI-Modellen entweder eigene Rechenzentren auf oder mieten Kapazitäten bei großen Cloud-Anbietern. Das aktuelle Vorgehen von xAI etabliert nun eine neue Mischform, die in der Tech-Branche als Neocloud bezeichnet wird. Auf diese Weise lassen sich die immensen Investitionen in die physische Infrastruktur effektiv refinanzieren. SpaceX begründet diesen Schritt im Börsendokument damit, ungenutzte Kapazitäten gewinnbringend zu verwerten und neue Pfade für Renditen auf das eingesetzte Kapital zu schaffen. Sinkende Nutzerzahlen beim KI-Assistenten Grok Hinter der ungewöhnlichen Kooperation steht allerdings auch eine wirtschaftliche Notwendigkeit für das Unternehmen. Die Nutzung des hauseigenen KI-Assistenten Grok ist in den vergangenen Monaten spürbar zurückgegangen. Dadurch blieben extrem teure Server-Ressourcen ungenutzt, die das Unternehmen nun an einen der engsten Konkurrenten vermietet. Anthropic sichert sich durch den Deal die Kapazitäten des Colossus-1-Rechenzentrums in Tennessee, um zukünftige KI-Modelle stabil zu trainieren.

LinkedIn stoppt »AI Slop« mit neuen Filtern

aycaramba@all-ai.de (Andreas Becker) — Thu, 21 May 2026 00:01:11 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ LinkedIn geht mit neuen KI-Modellen gegen minderwertige, automatisiert erstellte Inhalte vor. Diese als »AI Slop« bezeichneten Beiträge und Kommentare werden in ihrer Reichweite stark eingeschränkt. In ersten Tests wurden generische Texte mit einer Genauigkeit von 94 Prozent erkannt. Zusätzlich schützt ein erweiterter Verifizierungsfilter den Feed vor Bots und gefälschten Profilen. LinkedIn – Keeping conversations real on LinkedIn THE DECODER – Kampf gegen KI-Spam: LinkedIn will den KI-Geist zurück in die Flasche drängen Das Karrierenetzwerk LinkedIn geht mit neuen technischen Filtern gegen die Flut minderwertiger, automatisiert erstellter Beiträge vor. Sogenannter »AI Slop« soll paradoxerweise durch trainierte KI-Modelle erkannt und in der Reichweite drastisch eingeschränkt werden. Ziel ist es, die Plattform für authentische menschliche Debatten freizuhalten. Erkennungsmethoden gegen generische Texte Die neuen Filtermethoden wurden in Zusammenarbeit mit dem Redaktionsteam von LinkedIn trainiert. Diese KI-Modelle analysieren Beiträge auf echten Mehrwert. Ein nur schön aussehender, glatt polierter Beitrag soll dann abgewertet werden. Neben regulären Beiträgen stehen vor allem automatisierte Kommentare sowie rein repetitive Antworten im Fokus. In ersten Testläufen erzielte die Plattform nach eigenen Angaben eine Trefferquote von 94 Prozent bei der Identifizierung dieser generischen Texte. Unabhängig überprüfbare Daten oder Angaben zu fälschlicherweise blockierten Inhalten fehlen bisher allerdings. Dennoch berichten viele Nutzer bereits von einer spürbaren Abnahme derartiger Beiträge in ihren Feeds. Auch ich bemerke die Auswirkungen extrem bei meinen eigenen Beiträgen, allerdings im positiven Sinne. + Reichweitenbremse und Verifizierungsfilter Einstufungen als minderwertige KI-Inhalte führen dazu, dass diese Beiträge nicht mehr global verbreitet werden. Stattdessen bleibt die Sichtbarkeit weitgehend auf das direkte Netzwerk des jeweiligen Verfassers beschränkt, wodurch im öffentlichen Feed mehr Raum für durchdachte Beiträge von echten Personen entstehen soll. Zusätzlich baut die Plattform ihre Verifizierungsfunktionen aus, um gegen automatisierte Profile vorzugehen. Die inzwischen mehr als 100 Millionen verifizierten Mitglieder können nun gezielt gefiltert werden. Dies ist ab sofort bei Profilaufrufen, Stellenbewerbungen sowie direkt bei den Kommentaren im Feed möglich. Die Maßnahme birgt jedoch eine gewisse Ironie, da der Mutterkonzern Microsoft zeitgleich neue Funktionen für seinen Copilot vorgestellt hat. Diese unterstützen Nutzer explizit dabei, Texte mithilfe von KI direkt im Browser für das Karrierenetzwerk zu generieren. Am Ende entscheidet wohl die Qualität der Beiträge über deren Erfolg im Netzwerk. Anzeige

OpenAI löst historisches Rätsel der Mathematik

aycaramba@all-ai.de (Andreas Becker) — Wed, 20 May 2026 22:20:51 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Ein internes KI-Modell von OpenAI hat das historische Einheitsabstandsproblem von Paul Erdős autonom gelöst. Die KI widerlegte die seit 1946 bestehende Vermutung durch den unerwarteten Einsatz tiefer zahlentheoretischer Methoden. Der Erfolg des Modells stieg durch die Erhöhung der Rechenzeit beim Testen auf eine Genauigkeit von fast 50 Prozent. Es ist das erste Mal, dass eine mathematische Spitzenleistung dieser Art komplett eigenständig von einer KI erbracht wurde. OpenAI: An OpenAI model has disproved a central conjecture in discrete geometry OpenAI: A construction of n points in the plane with many unit distances (Proof PDF) Ein internes KI-Modell von OpenAI hat eine seit 80 Jahren bestehende mathematische Vermutung des legendären Mathematikers Paul Erdős autonom widerlegt. Das KI-Modell löste das berühmte Problem der Einheitsabstände in der diskreten Geometrie überraschend durch Methoden aus der algebraischen Zahlentheorie. Unerwartete Verbindungen in der Mathematik Das Problem von 1946 beschäftigt sich mit der Frage, wie viele Punktepaare in einer Ebene exakt den Abstand eins haben können. Bisher gingen Experten davon aus, dass quadratische Gitternetze die optimale Anordnung bieten. Das neue KI-Modell bewies jedoch das Gegenteil und fand eine unendliche Familie von Beispielen, die diese Annahme mathematisch widerlegen. Für die Lösung nutzte das KI-Modell komplexe Methoden wie unendliche Klassenkörpertürme, die eigentlich in der algebraischen Zahlentheorie verortet sind. Mathematiker zeigten sich überrascht von dieser tiefen Verknüpfung zweier bisher getrennter Fachgebiete. Externe Experten überprüften und bestätigten den Beweis bereits in einer begleitenden wissenschaftlichen Arbeit. »In meinen Augen zeigt diese Arbeit, dass aktuelle KI-Modelle über bloße Helfer für menschliche Mathematiker hinausgehen – sie sind fähig, originelle, geniale Ideen zu haben und diese in die Tat umzusetzen.« Arul Shankar Mehr Rechenzeit bringt den Durchbruch Ein entscheidender Faktor für den Erfolg des Beweises war die Skalierung der Rechenleistung während der Antwortphase. Interne Untersuchungen von OpenAI zeigen, dass die Erfolgsquote des Modells bei dieser komplexen Aufgabe stark von der investierten Rechenzeit abhängt. Ohne zusätzliche Denkzeit lag die Genauigkeit nahezu bei null Prozent. + Quelle: OpenAI Mit steigendem Einsatz von sogenanntem Test-Time-Compute kletterte die Erfolgsrate in den Tests auf fast 50 Prozent. Diese Skalierung verdeutlicht das enorme Potenzial von hochentwickelten Reasoning-Fähigkeiten bei KI-Modellen. Es zeigt zudem, dass komplexe logische Zusammenhänge durch mehr Rechenzeit stabil gehalten werden können. Diese autonomen Fähigkeiten könnten künftig auch in der Biologie, Physik oder den Materialwissenschaften eine wichtige Rolle spielen. Anzeige

Google bringt neues KI-Modell für Forscher

aycaramba@all-ai.de (Andreas Becker) — Wed, 20 May 2026 19:42:27 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google stellt das neue KI-Modell Empirical Research Assistance für die Wissenschaft vor. Die Technologie schreibt und optimiert eigenständig wissenschaftlichen Programmcode auf Expertenniveau. In Tests lieferte das Modell bereits präzise Vorhersagen für Krankheitswellen und CO2-Konzentrationen. Der Prototyp der darauf basierenden Plattform Computational Discovery startet in den Google Labs. Google Research: Empirical Research Assistance (ERA): From Nature publication to catalyzing Computational Discovery Nature: AI system designed to help scientists write expert-level empirical software Google hat ein neues KI-Modell namens Empirical Research Assistance vorgestellt, das wissenschaftlichen Programmiercode auf Expertenniveau schreibt. Die in der Fachzeitschrift Nature veröffentlichte Entwicklung bildet die Basis für die neue Forschungsplattform »Computational Discovery«. Intelligente Code-Optimierung für die Wissenschaft Das KI-Modell nutzt die Leistung von Gemini, um computergestützte Experimente selbstständig zu testen und zu verfeinern. Bei einer wissenschaftlichen Fragestellung durchsucht die Technologie die Fachliteratur, entwirft eigenen Code und bewertet die Ergebnisse autonom. Für die Optimierung greift das KI-Modell auf einen sogenannten Tree-Search-Ansatz zurück. Hierbei analysiert es tausende von Optionen parallel, um den bestmöglichen Code für ein definiertes Ziel zu finden. In etablierten Benchmarks aus der Genomik, der Mathematik und den Neurowissenschaften erreichte das KI-Modell bereits die Leistung menschlicher Experten. Anzeige Präzise Prognosen von Klima bis Wirtschaft Praktische Tests der vergangenen sechs Monate zeigen konkrete Erfolge in der Anwendung. Bei der Vorhersage von Krankenhausaufnahmen durch Grippe, COVID-19 und RSV in den USA belegten die Prognosen des KI-Modells Spitzenplätze auf den offiziellen Bestenlisten der Gesundheitsbehörde CDC. + Quelle: Google Ein weiteres Einsatzgebiet ist die Umweltforschung. Das KI-Modell entwickelte eine Methode zur präzisen Kartierung von atmosphärischem Kohlendioxid mithilfe von Wettersatelliten. Die CO2-Konzentration lässt sich damit alle zehn Minuten flächendeckend bestimmen, wodurch selbst urbane Emissionen sichtbar werden. + Quelle: Google Zudem optimierte das KI-Modell dreidimensionale Solaranlagen zur Maximierung der Energieausbeute und übertraf gängige Vorhersagen für den US-Einzelhandel. Start der neuen Forschungsplattform Die Technologie hinter dem KI-Modell fließt nun in die Plattform »Computational Discovery« ein. Google öffnet den Zugang zu diesem experimentellen Tool schrittweise über ein Testprogramm in den Google Labs. Zusammen mit ergänzenden Funktionen zur Hypothesengenerierung soll die Anwendung die wissenschaftliche Arbeit grundlegend unterstützen.

Stable Diffusion Team bringt lokale Musik-KI

aycaramba@all-ai.de (Andreas Becker) — Wed, 20 May 2026 19:23:00 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Stability AI veröffentlicht die neue KI-Modellfamilie Stable Audio 3.0 zur Musikgenerierung. Die größeren Varianten können vollständige Musikstücke mit einer Länge von über sechs Minuten erzeugen. Drei der vier Modelle stehen als Open Weights auf Hugging Face kostenlos zum Download bereit. Durch das Training mit vollständig lizenzierten Daten bietet der Hersteller rechtliche Absicherung für Unternehmen. Stability AI - Meet Stable Audio 3.0, the model family built for artistic experimentation with open-weight models TechCrunch - Stability AI releases a new audio model that can create six-minute songs Stability AI meldet sich mit der Veröffentlichung von Stable Audio 3.0 im KI-Sektor zurück. Die neuen KI-Modelle erzeugen vollständige Musikstücke von über sechs Minuten Länge. Drei der vier Modellvarianten erscheinen mit frei verfügbaren Open Weights. Von der Bildgenerierung zum Studio-Sound Nach den frühen Erfolgen mit Bildmodellen wie Stable Diffusion 1.5 oder Stable Diffusion XL wurde es zeitweise ruhiger um das Unternehmen. Mit der neuen Modellfamilie verschiebt sich der Fokus nun deutlich auf die Generierung von Audioinhalten. Die technische Basis bildet eine neue Architektur mit einem semantisch-akustischen Autoencoder, der variable Tracklängen mit sekundengenauer Steuerung ermöglicht. Die Varianten Small SFX und Small umfassen jeweils 459 Millionen Parameter. Sie sind für die lokale Nutzung auf Smartphones oder Notebooks optimiert. Während die SFX-Variante Soundeffekte liefert, komponiert das Small-Modell kurze Musikstücke von bis zu zwei Minuten Länge. + Quelle: Stability AI Lange Laufzeiten und offene Gewichte Das KI-Modell Stable Audio 3.0 Medium arbeitet mit 1,4 Milliarden Parametern und dehnt die Musikstücke auf eine Länge von bis zu 6:20 Minuten aus. Das größte Modell der Familie, Stable Audio 3.0 Large, besitzt 2,7 Milliarden Parameter und bietet die höchste Musikalität. Diese Spitzenvariante bleibt allerdings Entwicklern vorbehalten, die das Modell über eine API anbinden. Die drei kleineren Varianten stehen auf Hugging Face als Open Weights bereit. Nutzer können diese KI-Modelle über »Inpainting-Funktionen« anpassen, einzelne Abschnitte bearbeiten oder Musikstücke verlängern. Zudem erlaubt eine neue Dokumentation das Feintuning über LoRa-Strukturen. Anzeige Rechtssicherheit im Fokus Das Unternehmen grenzt sich durch den Einsatz von vollständig lizenzierten Trainingsdaten von Mitbewerbern ab. Durch Kooperationen mit großen Musiklabels wie der Warner Music Group soll das Risiko von Urheberrechtsverletzungen minimiert werden. Kleinere Anwender dürfen die erzeugten Daten kommerziell nutzen, sofern ihr Jahresumsatz unter einer Million US-Dollar liegt. Größere Unternehmen benötigen eine kostenpflichtige Enterprise-Lizenz, die eine zusätzliche rechtliche Freistellung beinhaltet. Damit reagiert der Anbieter auf die jüngsten Urheberrechtsstreitigkeiten in der Musikindustrie.

Qwen3.7-Max schlägt Konkurrenz bei Agenten-Benchmarks

aycaramba@all-ai.de (Andreas Becker) — Wed, 20 May 2026 11:20:00 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Alibaba hat das KI-Modell Qwen 3.7-Max für komplexe Agenten-Aufgaben veröffentlicht. Die KI arbeitet über viele Stunden hinweg eigenständig und optimiert selbstständig Code. In aktuellen Benchmarks übertrifft Qwen 3.7-Max etablierte Konkurrenten wie Claude 4.6 Opus oder DeepSeek V4 Pro. Das KI-Modell lässt sich flexibel in verschiedene Umgebungen wie OpenClaw oder Claude Code integrieren. Qwen - Qwen3.7: The Agent Frontier Das Qwen-Team hat das neue Flaggschiff-KI-Modell Qwen3.7-Max vorgestellt, das speziell als Basis für autonome KI-Agenten konzipiert wurde. Dieses KI-Modell soll komplexe Programmieraufgaben lösen, Büro-Workflows automatisieren und über hunderte von Schritten hinweg stabil agieren. Die Neuentwicklung zeichnet sich vor allem durch eine verbesserte Generalisierung über verschiedene Agenten-Frameworks hinweg aus. Flexibler Einsatz in OpenClaw und Claude Code Ein zentraler Aspekt des neuen KI-Modells ist die nahtlose Integration in bestehende Infrastrukturen für KI-Agenten. Qwen3.7-Max ist so trainiert, dass es nicht für eine einzelne Umgebung optimiert ist, sondern über verschiedene Gerüste wie Claude Code, OpenClaw, Qwen Code oder Hermes hinweg stabil funktioniert. Durch die Entkopplung von Aufgabe, Umgebung und Verifizierer im Training lernt das KI-Modell allgemeine Strategien zur Problemlösung anstatt plattformspezifischer Abkürzungen. In Tests auf Plattformen wie QwenClawBench und CoWorkBench liefert die Neuentwicklung konstante Ergebnisse, unabhängig vom genutzten System. Entwickler können das KI-Modell über die Alibaba Cloud Model Studio API ansprechen, wobei ein spezieller Modus zur Bewahrung des internen Denkprozesses über mehrere Interaktionen hinweg implementiert wurde. + Quelle: Alibaba Spitzenwerte bei Coding und mathematischem Reasoning Die Leistung des KI-Modells spiegelt sich in den aktuellen Benchmark-Ergebnissen wider, bei denen es etablierte Konkurrenten teilweise übertrifft oder einholt. Im Programmiertest Terminal Bench 2.0-Terminus erreicht Qwen3.7-Max einen Spitzenwert von 69,7 Punkten und setzt sich damit gegen DeepSeek V4 Pro Max mit 67,9 Punkten durch. Bei SWE-Verified liegt das KI-Modell mit 80,4 Punkten fast gleichauf mit Claude Opus-4.6 Max, welches 80.8 Punkte erzielt. Besonders starke Zuwächse verzeichnet die Fachwelt bei allgemeinen Agenten-Anwendungen und komplexen Logiktests. Im extrem anspruchsvollen Humanity's Last Exam (HLE) führt Qwen3.7-Max mit 41,4 Punkten vor Opus-4.6 Max mit 40,0 Punkten und Qwen3.6-Plus mit 28,8 Punkten. Auch im mathematischen Reasoning-Benchmark Apex distanziert das KI-Modell mit 44,5 Punkten die Konkurrenz von DeepSeek V4 Pro, das bei 38,3 Punkten landet. + Quelle: Alibaba Autonome Höchstleistung im 35-Stunden-Dauertest Wie stabil das KI-Modell über extrem lange Zeiträume agiert, demonstrierten die Entwickler in einem realen Optimierungsszenario für GPU-Kernel. Qwen3.7-Max optimierte einen komplexen Aufmerksamkeits-Operator in SGLang auf einer völlig unbekannten Hardware-Architektur ohne Dokumentation komplett eigenständig. Über einen Zeitraum von rund 35 Stunden führte das KI-Modell 1.158 Tool-Aufrufe durch, diagnostizierte Kompilierungsfehler und korrigierte Fehler im Code selbstständig. Das Ergebnis dieses autonomen Prototypings war eine zehnfache Beschleunigung des Kernels gegenüber der Standard-Referenz. Andere Spitzenmodelle wie GLM 5.1 oder Kimi K2.6 brachen diesen Test vorzeitig ab, da sie keine weiteren Fortschritte erzielen konnten. Insgesamt ein sehr interessantes und starkes Modell, welches man sich näher anschauen sollte. + Quelle: Alibaba Anzeige

Anthropic setzt auf HTML anstelle von Markdown

aycaramba@all-ai.de (Andreas Becker) — Wed, 20 May 2026 06:30:06 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Das Entwicklerteam hinter Claude Code ersetzt das Format Markdown zunehmend durch HTML für die Ausgaben der KI-Modelle. Der Wechsel ermöglicht die Darstellung komplexer Informationen durch interaktive Elemente, Vektorgrafiken und übersichtliche Formatierungen im Browser. Trotz des höheren Token-Verbrauchs bewältigt das zugrundeliegende KI-Modell Opus 4.7 diese Anforderungen dank seines großen Kontextfensters problemlos. Anthropic - Using Claude Code: The unreasonable effectiveness of HTML Entwickler des Claude-Code-Teams verabschieden sich bei Ausgaben ihrer KI-Modelle zunehmend vom Standardformat Markdown. Das Team setzt stattdessen auf HTML, um komplexe Informationen grafisch und interaktiv aufzubereiten. Dadurch erhalten Nutzer visuell strukturierte Ergebnisse anstelle unübersichtlicher Textdokumente. Grenzen der textbasierten Darstellung Bisher nutzen KI-Modelle vorwiegend Markdown, um Antworten für Anwender zu strukturieren. Dieses Format erweist sich bei umfangreichen Ausgaben schnell als unübersichtlich. Dokumente mit mehr als hundert Zeilen sind schwer zu erfassen und erschweren die Zusammenarbeit in Entwicklungsteams. Besonders bei der Visualisierung von Architekturen oder Tabellen stößt die einfache Auszeichnungssprache an ihre Grenzen. Das KI-Modell greift dann oft auf ineffiziente Methoden wie ASCII-Diagramme zurück. Die Nutzung von HTML löst dieses Problem durch eine deutlich höhere Informationsdichte. + Quelle: Anthropic Interaktive Elemente und grafische Vielfalt Die Web-Sprache erlaubt es dem KI-Modell, Ergebnisse wesentlich detaillierter und ansprechender zu generieren. So integriert Claude Code direkt CSS-Stile, SVG-Vektorgrafiken und kleine Skripte in die Dokumente. Die Ausgaben lassen sich dadurch problemlos im Browser betrachten und einfach mit Kollegen teilen. Zusätzlich ermöglicht HTML echte Interaktionen direkt in der Antwort der KI. Nutzer erhalten maßgeschneiderte Bedienoberflächen mit Schiebereglern und Schaltflächen, um Design-Entwürfe oder Algorithmen direkt anzupassen. Die veränderten Parameter lassen sich anschließend per Klick kopieren und für neue Prompts in Claude Code verwenden. + Quelle: Anthropic Praktische Anwendung im Entwicklungsalltag Im Arbeitsalltag beschleunigt der HTML-Ansatz konkrete Prozesse wie Code-Reviews und die allgemeine Projektplanung. Das KI-Modell erstellt beispielsweise interaktive Dashboards für die Ticket-Priorisierung oder visuelle Erklärungen für komplexe Programmstrukturen. Solche spezialisierten Mini-Anwendungen, die exakt auf eine Aufgabe zugeschnitten sind, ersetzen abstrakte Textbeschreibungen. Auch bei der Analyse umfangreicher Datenquellen spielt das Format seine Stärken voll aus. Claude Code liest lokale Repositories aus oder greift auf Plattformen wie Slack zu. Daraus generiert die KI übersichtliche und grafisch aufbereitete Statusberichte, welche die Lesbarkeit im Team deutlich erhöhen. Anzeige Technischer Hintergrund und Token-Verbrauch Der generierte HTML-Code benötigt durch die umfangreiche Syntax grundsätzlich mehr Token als reiner Markdown-Text. Diese technische Hürde spielt in der aktuellen Generation der KI-Modelle jedoch eine untergeordnete Rolle. Das zugrundeliegende KI-Modell Opus 4.7 verfügt über ein Kontextfenster von einer Million Token. Diese immense Kapazität fängt den erhöhten Speicherbedarf mühelos auf. Der Fokus bei der Ausgabe verschiebt sich damit rein faktisch von sparsamen Textblöcken hin zu direkt nutzbaren Endformaten. Eine Sache, die man dabei aber nicht verschweigen sollte, auch wenn das eigene Claude-Code-Team das sicherlich belächelt: Wir müssen die zusätzlichen Token natürlich mit Geld bezahlen.

Die Top 11 Highlights der GOOGLE I/O

aycaramba@all-ai.de (Andreas Becker) — Tue, 19 May 2026 23:23:23 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ Google stellt auf der I/O 2026 leistungsstarke KI-Modelle wie Gemini 3.5 Flash und Gemini Omni vor. Mit Gemini Spark erhalten Nutzer einen autonom agierenden Helfer, der Aufgaben eigenständig im Hintergrund erledigt. Zusätzlich präsentiert das Unternehmen intelligente Hardware in Form der Audio Glasses und führt neue KI-Tarife für professionelle Anwender ein. Google Blog: Gemini Products Google Blog: Next evolution of the Gemini app Google Blog: Introducing Gemini Omni Google eröffnet die I/O 2026 mit weitreichenden Neuerungen für die eigenen KI-Modelle. Im Fokus stehen Gemini 3.5 und autonom handelnde KI-Agenten. Wir haben die elf wichtigsten Neuerungen zusammengestellt. Nach der Nummer 1 werdet ihr alles mit anderen »Augen« sehen. 11: Neue Tarifstrukturen für KI-Modelle Google ändert die Preisstruktur seines Ultra-Tarifs. Dieser hat nun zwei verschiedene Preisstufen: 100 $ und 200 $. Der bisherige Tarif für 250 $ entfällt komplett. Beide Ultra-Tarife haben dabei die gleichen Funktionen, aber unterschiedliche Limits. So gibt es für 100 $ beispielsweise nur 20 TB Speicherplatz anstelle von 30 GB oder 10.000 Flow Credits anstelle von 25.000. + Quelle: Google 10: Autonome Handlungen mit Gemini Spark Ein zentrales Element der Präsentation bildet Gemini Spark, ein rund um die Uhr aktiver KI-Agent. Diese Eigenentwicklung agiert autonom auf den Servern von Google und führt dort selbstständig komplexe Aufgaben aus. Nutzer müssen ihre Endgeräte nicht mehr eingeschaltet lassen, während die Berechnungen im Hintergrund laufen. Spark integriert sich nahtlos in bestehende Anwendungen und reagiert auf E-Mails sowie Nachrichten. Top News Neuer »Agent Spark« arbeitet autonom 24 Stunden für Dich Google zeigt einen neuen KI-Agenten für den Alltag. Das KI-Modell automatisiert digitale Arbeitsabläufe in verschiedenen Apps. 09: SynthID kennzeichnet maschinelle Inhalte Die Markierung von KI-generierten Inhalten gewinnt zunehmend an Bedeutung. Google erweitert seine Wasserzeichen-Technologie SynthID durch strategische Partnerschaften mit Nvidia und OpenAI. Durch diese Kooperation soll eine branchenweite Lösung etabliert werden, um synthetische Medien zweifelsfrei zu identifizieren. Das schafft Vertrauen und erhöht die Transparenz bei der Nutzung mächtiger KI-Modelle. 08: Gemini Omni generiert Videos auf Zuruf Mit „Gemini Omni” präsentiert Google ein rein multimodales KI-Modell, das auf audiovisuelle Inhalte spezialisiert ist. Es wandelt Text-, Bild- und Videodaten direkt in hochauflösende Videos um. Die gezeigten Möglichkeiten sind wirklich grandios. Gerade in Bezug auf die Videobearbeitung ist quasi alles möglich, was man sich vorstellen kann. Unbedingt das Intro-Video im ausführlichen Artikel anschauen! Top News Neue KI-Modell Gemini Omni verändert die Videobearbeitung Nutzer generieren mit dem KI-Modell realistische Clips aus Text, Bild und Ton. 07: Universe Commerce Protocol für den digitalen Handel Das neue Universe Commerce Protocol verbindet KI-Modelle direkt mit dem E-Commerce. Dadurch entsteht ein standardisierter Weg, wie Agenten selbstständig Käufe tätigen und Transaktionen abwickeln können. Für die meisten sicherlich weniger aufregend, aber dafür umso wichtiger für Entwickler. 06: Antigravitar 2.0 erweitert die Entwicklerbasis Entwickler erhalten mit Antigravitar 2.0 eine aktualisierte Umgebung für die Arbeit mit KI. Diese Plattform ermöglicht es, maßgeschneiderte Agenten auf Basis der eigenen KI-Modelle zu erstellen. Durch die Integration in bestehende Schnittstellen reduzieren sich die infrastrukturellen Hürden drastisch. Programmierer können sich somit auf die reine Logik ihrer Anwendungen konzentrieren. Anzeige 05: Google Flows Tools strukturieren Aufgaben Google Flow wurde vor über einem Jahr eingeführt, wies aber immer Mängel bei der Bedienung auf. Das soll sich mit den neuen Google-Flow-Tools jetzt ändern. Im Video sind zahlreiche Tools und Schaltflächen zu sehen, die die Videobearbeitung sehr einfach und kreativ machen. 04: Daily Brief fasst den Tag zusammen Eine neue Funktion innerhalb der Gemini-App nennt sich Daily Brief. Das KI-Modell analysiert eingehende Informationen, Kalendereinträge sowie Nachrichten und erstellt daraus einen personalisierten Tagesüberblick. Statt zahlreicher Benachrichtigungen erhalten Nutzer morgens ein kompaktes Briefing. Dies erleichtert die Planung und sorgt für mehr Übersicht über anstehende Termine. 03: Gemini 3.5 Flash und Pro betreten die Bühne Das Highlight der Veranstaltung war zweifellos die Ankündigung von Gemini 3.5 Flash. Dieses KI-Modell arbeitet nicht nur deutlich schneller als andere Modelle, sondern ist auch in vielen Bereichen schneller als Gemini 3.1 Pro. Gemini 3.5 Pro wird übrigens im nächsten Monat starten. Top News Gemini 3.5 Flash schlägt 3.1 Pro Das Modell ist nicht nur stärker, sondern mit 289 Token pro Sekunde auch unglaublich schnell. 02: Stich programmiert Webseiten in Echtzeit Für Webentwickler und Designer bringt Google ein großes Update für das Projekt Stich an den Start. Über einfaches Prompting baut das KI-Modell funktionale Internetauftritte in Echtzeit auf dem Bildschirm auf. Änderungswünsche setzt die KI sofort um. Nutzer müssen dafür nicht manuell in den Code eingreifen. Dies beschleunigt den Entwurfsprozess von Seiten enorm und sah erstaunlich cool aus. Im Hauptvideo zu sehen ab 2:30:35. + Quelle: Google 01: Audio Glasses integrieren KI in den Alltag Im Hardware-Bereich kündigt das Unternehmen intelligente Audio-Glasses an. Die Brille verbindet sich direkt mit KI-Modellen und liefert sofort Antworten auf gesprochene Fragen ins Ohr. Das smarte Wearable ermöglicht zudem die Navigation und den Versand von Nachrichten, ohne dass das Smartphone in die Hand genommen werden muss. Dadurch wird die KI zu einem unsichtbaren Begleiter. Besonders hervorgehoben wurde das Design. Dieses stand bei der Entwicklung der Brille an erster Stelle, darum herum wurden dann die Funktionen integriert. Anzeige

OpenAI startet Verifizierung für KI-Bilder

aycaramba@all-ai.de (Andreas Becker) — Tue, 19 May 2026 20:50:00 +0200

GPT-Images-2.0 Kurzfassung ▾ Quellen ▾ OpenAI integriert das Wasserzeichen SynthID von Google DeepMind für Bilder aus ChatGPT und der OpenAI API. Das Unternehmen erhält zudem die offizielle Zertifizierung für den C2PA-Standard zur sicheren Übertragung von Metadaten. Eine neue öffentliche Anwendung erlaubt es Nutzern, Bilder auf diese versteckten Herkunftssignale zu prüfen. OpenAI - Advancing content provenance for a safer, more transparent AI ecosystem OpenAI führt eine neue Anwendung zur Überprüfung von KI-generierten Bildern ein und integriert gleichzeitig das Wasserzeichen SynthID von Google DeepMind. Damit lassen sich visuelle Inhalte aus ChatGPT künftig deutlich zuverlässiger als künstlich erzeugt identifizieren. Zweigleisige Strategie für mehr Transparenz Bisher setzten Entwickler zur Kennzeichnung von KI-Inhalten primär auf Metadaten. Diese Informationen gehen jedoch häufig durch einfache Formatänderungen oder Screenshots verloren. Um dieses Problem zu lösen, kombiniert OpenAI nun zwei verschiedene Ansätze miteinander. Den Grundstein bildet der etablierte C2PA-Standard für kryptografische Metadaten. Das Unternehmen ist nun offiziell als konformer Generator zertifiziert. Dadurch können Plattformen die Herkunftsinformationen der KI-Modelle durchgehend auslesen und sicher bewahren. Zusätzlich kommt eine unsichtbare Markierung tief in den Bilddaten zum Einsatz. Die Technologie SynthID von Google DeepMind ergänzt die anfälligen Metadaten um eine äußerst widerstandsfähige Ebene. Selbst nach starken Bearbeitungen der Bilder bleibt dieses Signal intakt. + Quelle: OpenAI Öffentliche Prüfung leicht gemacht Die besten Sicherheitsmaßnahmen nützen wenig, wenn Nutzer sie nicht auslesen können. Aus diesem Grund startet nun eine frühe Version einer öffentlichen Web-Anwendung. Dort lassen sich Bilder hochladen und auf versteckte Herkunftssignale untersuchen. Der Dienst prüft spezifisch auf C2PA-Daten und das SynthID-Wasserzeichen. Schlägt der Test an, stammt das Bild mit hoher Sicherheit von einem KI-Modell des Unternehmens. Fehlen die Signale, trifft die Anwendung jedoch bewusst keine endgültige Aussage. Künftig soll die Anwendung noch deutlich ausgebaut werden. Geplant ist eine branchenübergreifende Zusammenarbeit, um langfristig auch Inhalte anderer Entwickler zuverlässig zu erkennen. Anzeige