Du hast deinen monolithischen Agenten — ein Programm, das in deinem Auftrag handelt — in einen Research-Sub-Agenten und einen Code-Sub-Agenten aufgeteilt, genau wie es die SDK-Docs vorgeschlagen haben. Delegation! Arbeitsteilung! Moderne Managementtheorie, nur halt für KI. Was soll schon schiefgehen.
In Produktion: eine ganze Menge. Der Code-Sub-Agent ignoriert fröhlich die Einschränkungen, die der Research-Sub-Agent herausgefunden hat. Der Parent Agent zuckt mit den Schultern. Du starrst auf Logs und fragst dich, wo die Hälfte des Kontexts — also alle Informationen, die die KI braucht, um ihren Job zu machen — zwischen Punkt A und Punkt B verdampft ist. Willkommen bei Multi-Agent-Stille-Post.
Drei Plattformen, drei Wege, deine Daten zu verlieren
Zwischen dem 9. und 17. April 2026 haben die drei größten KI-Plattformen Sub-Agent-Delegation — also die Möglichkeit, dass eine KI Arbeit an eine andere KI weiterreicht — als vollwertiges Feature ausgeliefert oder aktualisiert:
- 9. April: Anthropic launchte Managed Agents in der Public Beta. Jeder Sub-Agent bekommt eine frische Session — eine leere Gesprächstafel — plus einen Instruktions-String.
- 15. April: OpenAI aktualisierte sein Agents SDK mit sandboxed Sub-Agent-Routing. Standardverhalten: die komplette Konversationshistorie wird an den nächsten Agenten weitergereicht.
- 17. April: Google ADK (Agent Development Kit), das Multi-Agent-Support Ende März erstmals ausgeliefert hatte, aktualisierte seine Multi-Agent-Docs und das Session-State-Modell — im Grunde ein gemeinsames Whiteboard, auf dem Agenten sich gegenseitig Notizen hinterlassen. Aus ihren eigenen Docs stammt diese Perle: "the Root Agent is effectively out of the loop."
Drei Plattformen. Drei inkompatible Mechanismen. Null Dokumentation darüber, was am Übergabepunkt tatsächlich verloren geht.
Stille Post, quantifiziert
So übergibt jede Plattform den Kontext, wenn Agent A an Agent B delegiert:
# OpenAI: übergibt eine gefilterte Nachrichtenliste via HandoffInputData
class HandoffInputData:
input_history: list # volle Chat-History, filterbar
pre_handoff_items: list
new_items: list
# Standard: alles wird durchgereicht.
# Aber Input Guardrails (Sicherheitsfilter) greifen NUR
# beim ersten Agenten. Der Rest läuft ungesichert.
# Anthropic: startet eine brandneue Session pro Agent
# POST /v1/sessions → frischer Kontext, leere Tafel
# "brains can pass hands to one another"
# ...aber das neue Gehirn startet mit selektiver Amnesie
# Google ADK: geteiltes State-Dictionary
session.state["research_results"] = findings
# Anderer Agent liest den Key. Falls er existiert.
# Parallele Ausführung? Race Conditions (zwei Agenten
# schreiben gleichzeitig auf denselben Key) sind dein Problem.
Der Verfall ist nicht theoretisch. Eine UC-Berkeley-Studie vom Februar 2026 mit 1.600+ Traces über sieben Agent-Frameworks fand Fehlerquoten von bis zu 86,7 %. Die XTrace-Analyse zeigte, wie ein Research-Agent 3.000 nützliche Tokens — Wort-Häppchen, die die KI verarbeitet — produzierte, vergraben in 40.000 Tokens Gesamtkontext. Das ist eine Noise-Ratio von 93 % bei der Übergabe. Die Studie unterteilte die Fehler in drei Kategorien: Context Loss (Information verschwindet schlicht zwischen Agenten), Context Corruption (Information kommt an, aber semantisch verzerrt) und Context Dilution (nützliche Information ertrinkt im Rauschen). Ein Google-DeepMind-Paper vom März 2026 zur Multi-Agent-Koordination maß 39–70 % Reasoning-Degradation an Delegationsgrenzen.
Wie BriefHQ am 11. März schrieb: "What disappeared along the way was not raw information. What disappeared was decision context."
Der Preis der Reparatur
Deine Optionen sind mau:
- Vollständigen Kontext in den Delegation-Prompt serialisieren — verbrennt Tokens (bei ~5–25 $ pro Million für Frontier-Modelle) und frisst dein Context Window bei lebendigem Leib auf
- Shared Memory Stores — bringt Vendor Lock-in und einen weiteren Single Point of Failure
- Delegation ganz weglassen — zurück zu Single-Agent-Monolithen, die an komplexen Workflows ersticken
Keine Plattform bietet einen eingebauten Mechanismus, mit dem ein Parent Agent überprüfen kann, was sein Child tatsächlich erhalten hat im Vergleich zu dem, was gesendet wurde. Du managst ein Team, das dich nicht in CC setzen kann.
Bevor du zerlegst
Bevor du deinen Agenten in einen Multi-Agent-Workflow aufteilst, mach einen simplen Test: Injiziere eine spezifische Einschränkung ganz oben in der Kette und prüfe, ob der letzte Agent sie einhält. Irgendwas wie "niemals pandas benutzen" oder "alle Ausgaben müssen in metrischen Einheiten sein." Wenn der letzte Agent dagegen verstößt — Glückwunsch, du hast dein Context Leak gefunden.
Geh noch einen Schritt weiter. Logge die Token-Anzahl an jeder Übergabegrenze. Wenn Agent A 3.000 Tokens Research sendet und der effektive Kontext von Agent B nur 200 davon enthält, weißt du exakt, wo der Abfluss ist. Kein aufwendiges Tracing-Framework nötig — ein Print-Statement an jedem Delegationspunkt erzählt die ganze Geschichte. Mach das vor dem Deployment in Produktion. Mach das, bevor du eine einzige Zeile Orchestrierungscode schreibst.
Jede Plattform verkauft Multi-Agent-Delegation als "ein Team managen." Aber die Teammitglieder können die Notizen der anderen nicht lesen, das Protokoll wird auf jeder Ebene des Organigramms kürzer, und niemand hat einen Mechanismus gebaut, um den Informationsverlust zu erkennen. Ein Gartner-Report vom Oktober 2025 prognostiziert, dass über 40 % der agentischen KI-Projekte bis 2027 eingestellt werden. Wenn man sich die Handoff-Architekturen ansieht, die diese drei Plattformen im April 2026 ausgeliefert haben, wirkt diese Zahl optimistisch.


