Rozbiłeś swojego monolitycznego agenta — program, który działa w twoim imieniu — na sub-agenta do researchu i sub-agenta do kodu, dokładnie jak sugerowała dokumentacja SDK. Delegacja! Podział pracy! Nowoczesna teoria zarządzania, ale dla AI. Co mogłoby pójść nie tak.

W produkcji — całkiem sporo. Sub-agent od kodu radośnie ignoruje ograniczenia, które odkrył sub-agent od researchu. Agent-rodzic wzrusza ramionami. Ty wpatrujesz się w logi, zastanawiając się, gdzie połowa kontekstu — wszystkich informacji, które AI potrzebuje do wykonania zadania — wyparowała między punktem A a punktem B. Witaj w wieloagentowym głuchym telefonie.

Trzy platformy, trzy sposoby na utratę danych

Między 9 a 17 kwietnia 2026 roku trzy największe platformy AI wypuściły lub zaktualizowały delegację sub-agentów — możliwość przekazywania pracy przez jedną AI drugiej AI — jako pełnoprawną funkcjonalność:

  • 9 kwietnia: Anthropic uruchomił Managed Agents w publicznej becie. Każdy sub-agent dostaje świeżą sesję — czystą kartę konwersacji — plus string z instrukcjami.
  • 15 kwietnia: OpenAI zaktualizowało swoje Agents SDK z sandboxowanym routingiem sub-agentów. Domyślne zachowanie: przekaż całą historię konwersacji do następnego agenta.
  • 17 kwietnia: Google ADK (Agent Development Kit), który po raz pierwszy dostarczył wsparcie multi-agent pod koniec marca, zaktualizował dokumentację multi-agentową i model stanu sesji — w zasadzie współdzieloną tablicę, na której agenci bazgrzą sobie nawzajem notatki. Ich własna dokumentacja zawiera taki klejnot: 'Root Agent jest w praktyce poza pętlą."

Trzy platformy. Trzy niekompatybilne mechanizmy. Zero dokumentacji o tym, co faktycznie ginie na granicy przekazania.

Głuchy telefon w liczbach

Oto jak każda platforma przekazuje kontekst, kiedy Agent A deleguje do Agenta B:

# OpenAI: przekazuje przefiltrowaną listę wiadomości przez HandoffInputData
class HandoffInputData:
    input_history: list   # pełna historia czatu, z możliwością filtrowania
    pre_handoff_items: list
    new_items: list
# Domyślnie: wszystko przechodzi.
# Ale input guardrails (filtry bezpieczeństwa) działają TYLKO
# na pierwszym agencie. Reszta leci bez zabezpieczeń.

# Anthropic: startuje zupełnie nową sesję per agent
# POST /v1/sessions  → świeży kontekst, czysta karta
# "mózgi mogą przekazywać sobie ręce"
# ...ale nowy mózg startuje z selektywną amnezją

# Google ADK: współdzielony słownik stanu
session.state["research_results"] = findings
# Inny agent czyta klucz. Jeśli istnieje.
# Równoległe wykonanie? Race conditions (dwa agenty
# piszące do tego samego klucza jednocześnie) to twój problem.

Degradacja nie jest teoretyczna. Badanie UC Berkeley z lutego 2026 na ponad 1600 śladach wykonania w siedmiu frameworkach agentowych wykazało wskaźnik awaryjności do 86,7%. Analiza XTrace pokazała, że agent badawczy produkuje 3000 użytecznych tokenów — kawałków słów przetwarzanych przez AI — zatopionych w 40 000 tokenów całkowitego kontekstu. To 93% szumu przy przekazaniu. Badanie podzieliło awarie na trzy kategorie: utrata kontekstu (informacja po prostu znika między agentami), uszkodzenie kontekstu (informacja dociera, ale jest semantycznie zniekształcona) i rozmycie kontekstu (użyteczna informacja tonie w szumie). Artykuł Google DeepMind z marca 2026 o koordynacji multi-agentowej zmierzył 39–70% degradacji rozumowania na granicach delegacji.

Jak ujął to BriefHQ 11 marca: 'To, co zniknęło po drodze, nie były surowe informacje. Zniknął kontekst decyzyjny."

Cena naprawy

Twoje opcje nie wyglądają różowo:

  1. Serializuj pełen kontekst do promptu delegacji — pali tokeny (przy ~5–25$ za milion dla topowych modeli) i pożera twoje okno kontekstowe żywcem
  2. Współdzielone magazyny pamięci — dodaje vendor lock-in i kolejny punkt awarii
  3. Zrezygnuj z delegacji całkowicie — z powrotem do jednoagentowych monolitów, które dławią się na złożonych workflowach

Żadna platforma nie dostarcza wbudowanego mechanizmu, który pozwoliłby agentowi-rodzicowi zweryfikować, co jego dziecko faktycznie otrzymało w porównaniu z tym, co rodzic wysłał. Zarządzasz zespołem, który nie potrafi dodać cię do DW w mailu.

Zanim zaczniesz rozbijać

Zanim podzielisz swojego agenta na wieloagentowy workflow, przeprowadź jeden banalny test: wstrzyknij konkretne ograniczenie na początku łańcucha i sprawdź, czy ostatni agent je respektuje. Coś w stylu 'nigdy nie używaj pandas" albo 'wszystkie wyniki muszą być w jednostkach metrycznych." Jeśli ostatni agent to łamie — gratulacje, znalazłeś swój wyciek kontekstu.

Idź o krok dalej. Loguj liczbę tokenów na każdej granicy przekazania. Jeśli Agent A wysyła 3000 tokenów researchu, a efektywny kontekst Agenta B zawiera tylko 200 z nich, wiesz dokładnie, gdzie jest odpływ. Żaden wymyślny framework do tracingu nie jest potrzebny — print statement w każdym punkcie delegacji mówi ci całą historię. Zrób to przed wdrożeniem na produkcję. Zrób to przed napisaniem jednej linijki kodu orkiestracji.

Każda platforma reklamuje delegację multi-agentową jako 'zarządzanie zespołem." Ale członkowie tego zespołu nie potrafią czytać swoich nawzajem notatek, notatki ze spotkań kurczą się z każdym poziomem hierarchii, i nikt nie zbudował mechanizmu wykrywania utraty informacji. Raport Gartnera z października 2025 przewiduje, że ponad 40% projektów agentowego AI zostanie anulowanych do 2027. Patrząc na architektury przekazań, które te trzy platformy wypuściły w kwietniu 2026 — ta liczba wydaje się optymistyczna.