Deine KI-Agenten funktionieren einzeln super. Zusammen legen sie alles lahm.

Dein Unternehmen hat diesen Frühling vermutlich seinen ersten KI-Agenten deployt — ein Programm, das eigenständig handelt, nicht nur Fragen beantwortet. Vielleicht reviewt es Pull Requests auf GitHub. Vielleicht sortiert es Support-Tickets. Vielleicht überwacht es deine Cloud-Dashboards um 3 Uhr morgens, damit du es nicht tun musst. Jeder einzelne meldet Grün auf seinem eigenen kleinen Dashboard. Das Leben ist schön.

Nur schreiben alle drei ins selbe Jira-Board, in dieselben Slack-Channels, in dieselben GitHub-Repos. Und niemand — nicht dein Team, nicht der Anbieter — hat definiert, was passiert, wenn sich ihre Aktionen auf gemeinsamen Ressourcen in die Quere kommen. Du hast drei autonome Mitarbeiter eingestellt und sie an denselben Schreibtisch gesetzt, ohne sie einander vorzustellen.

Drei Plattformen, null Ampeln

Google eröffnet heute (22. April, Las Vegas) die Cloud Next 2026 mit seinem Agentic-AI-Stack im Rampenlicht: ADK v1.0 — ein Toolkit zum Bauen von Agenten — plus das A2A-Protokoll (Agent-to-Agent, ein Standard, der Agenten ermöglicht, sich gegenseitig zu entdecken und Aufgaben zu delegieren), das heute nach seiner ersten Preview auf der Cloud Next 2025 in Version 1.0 erscheint — mittlerweile mit über 150 unterstützenden Organisationen, darunter AWS, Microsoft und Salesforce. Vor zwei Wochen (8. April) hat Anthropic Managed Agents in der Public Beta gestartet — lang laufende Claude-Instanzen, die komplette Workflows abarbeiten, nicht nur auf Prompts antworten — mit Notion, Asana und Sentry als Early Adopters. Vor einer Woche (15. April) hat OpenAI sein Agents SDK aufgerüstet mit nativer Sandbox-Execution — isolierte Container, in denen Agenten Code sicher ausführen — und einem model-nativen Harness.

Drei konkurrierende Runtimes, jede behandelt ihren Agenten als einzigen autonomen Akteur in deiner Infrastruktur. Keine von ihnen kennt das Konzept "Hey, ein anderer Agent arbeitet schon daran."

Wie Agenten sich in den Misserfolg hinein-optimieren

Hier ist das Muster, das sich bereits in Produktion zeigt. Agent A (dein Ticket-Bot) erstellt ein Jira-Issue. Agent B (dein Deduplizierungs-Bot) klassifiziert es als Duplikat und schließt es. Agent A erkennt die Schließung als Anomalie und öffnet das Ticket wieder. Jeder Agent handelt korrekt innerhalb seines eigenen Kontexts — seines eigenen Context Windows (der Informationsausschnitt, den die KI gleichzeitig "sehen" kann). Das Gesamtsystem ist falsch, gefangen in einer Endlosschleife, in der korrekte Aktionen zu falschen Ergebnissen führen.

Cogent Infotech hat am 26. März drei Varianten davon dokumentiert: den "Mirror Mirror"-Effekt (Agenten, die endlos gegenseitig ihre Änderungen überschreiben und dabei in Minuten Tausende von Dollar verbrennen), halluzinierten Konsens (mehrere Agenten, die auf fabrizierte Daten konvergieren — "leise und überzeugend") und Ressourcen-Deadlocks (Agenten, die in zirkulären Abhängigkeiten aufeinander warten). Ihr Fazit: "Man kann einen Agenten nicht fragen, ob er in einer Schleife steckt; man muss es mathematisch beweisen."

Die Daten untermauern das. Der MAST-Benchmark der UC Berkeley, veröffentlicht im März 2025 und im Oktober 2025 überarbeitet, analysierte über 1.600 Traces über sieben Multi-Agenten-Frameworks hinweg und fand Fehlerquoten zwischen 41 % und 86,7 %. Der Hammer: Rund 79 % dieser Fehler stammten aus Spezifikations- und Koordinationsproblemen — nicht weil die Modelle dumm waren. Die Agenten waren schlau genug. Sie wussten nur nichts voneinander.

Ein am 16. April 2026 veröffentlichtes Paper, "Semantic Consensus", gibt dem Ganzen einen formalen Namen: Semantic Intent Divergence — kooperierende Agenten, die inkonsistente Interpretationen gemeinsamer Ziele entwickeln, weil jeder in seinem eigenen Informationssilo operiert. In 600 Testläufen auf AutoGen, CrewAI und LangGraph erreichten die Forscher mit ihrem vorgeschlagenen Koordinations-Framework 100 % Workflow-Completion gegenüber 25,1 % für die nächstbeste Baseline. Die Kluft ist erschreckend, und sie bestätigt, was die Zahlen bereits flüstern: Das Problem ist nicht die Intelligenz, es ist die Koordination.

Der Preis des Fixes, den niemand ausliefert

Googles A2A-Protokoll kommt einer Lösung am nächsten. Es ermöglicht Agenten, sich anzukündigen, ihre Fähigkeiten über "Agent Cards" zu beschreiben (jetzt mit kryptografischer Identitätsverifizierung) und Aufgaben zu übergeben. Über 150 Organisationen sind an Bord. Aber A2A definiert Discovery und Delegation — keine Konfliktlösung. Wenn Agent A und Agent B beide die legitime Berechtigung haben, dasselbe Jira-Ticket zu ändern, hat A2A keine Meinung dazu, wer gewinnt. Und die Einführung von A2A bedeutet, die Inter-Agenten-Koordination über Vertex AI zu routen, Googles Cloud-Plattform — Vendor-Kollision lösen mit dem Lock-in eines anderen Vendors.

Wie John Furrier von SiliconANGLE am 20. April schrieb: "Wem gehört die Control Plane, auf der KI tatsächlich arbeitet? Modelle werden zur Commodity." Er hat recht. Der Kampf geht nicht darum, welches Modell am schlausten ist. Es geht darum, wer die Verkehrssteuerungsschicht baut, die über allen sitzt.

Anthropics Managed-Agents-Architektur beschreibt ausdrücklich "many brains, many hands" — dokumentiert aber null Koordination zwischen den Brains. OpenAIs Agents SDK unterstützt Handoffs (Agent-zu-Agent-Aufgabendelegation) und Guardrails (Input/Output-Validierung), aber keine Cross-Agent-Konfliktlösung. Jeder Anbieter hat einen sehr fähigen Einzelkämpfer gebaut und angenommen, du würdest immer nur einen gleichzeitig deployen. Im Jahr 2026. In einem Unternehmen.

Was du jetzt konkret tun solltest

Bevor du einen zweiten Agenten auf ein gemeinsames System loslässt — Jira, GitHub, Slack, deine Cloud-Konsole — braucht dein Team drei Dinge, die aktuell kein Anbieter liefert: explizite Ressourcen-Ownership-Regeln (welcher Agent besitzt welche Objekte), ein Shared-State-Registry (eine Single Source of Truth darüber, was jeder Agent getan hat) und Conflict-Resolution-Policies (wenn zwei Agenten sich widersprechen, wer gewinnt und warum). Bau dir das als interne Middleware oder zahl die Endlosschleifen-Steuer.

Die fehlende Schicht

Erinnerst du dich an den ersten Agenten, den du deployt hast, der Grün auf seinem Dashboard meldet? Er meldet immer noch Grün. Der zweite auch. Der dritte auch. Jeder Agent glaubt, er macht einen großartigen Job. Das System, das sie sich teilen, erzählt eine andere Geschichte.

Die fehlende Infrastrukturschicht der Agenten-Ära ist kein schlaueres Modell — es ist eine Verkehrssteuerung für die Agenten, die bereits laufen. Die erste Plattform, die das ausliefert, sichert sich die Orchestrierungsebene über Google, Anthropic und OpenAI. Bis dahin sind deine Agenten drei Katzen in einer Küche, jede fest davon überzeugt, dass sie die Einzige ist, die hier wohnt.

Deine KI-Agenten funktionieren einzeln super. Zusammen legen sie alles lahm.

Drei Plattformen, null Ampeln

Wie Agenten sich in den Misserfolg hinein-optimieren

Der Preis des Fixes, den niemand ausliefert

Was du jetzt konkret tun solltest

Die fehlende Schicht

Keep reading

Drei Agent-Plattformen, drei verschiedene Spezies

Dein Agent waehlt das falsche Tool, weil du eine schlechte Beschreibung geschrieben hast - und keine Plattform kuemmert sich darum

Das Agenten-Paradoxon: Weniger Autonomie, mehr Nutzen

Deine KI-Agent-Rechnung ist ein Organigramm -- du hast sie nur noch nicht so gelesen