Ви розбили свого монолітного агента — програму, що діє від вашого імені — на дослідницького суб-агента й кодового суб-агента, рівно як радила документація SDK. Делегування! Розподіл праці! Сучасна теорія менеджменту, тільки для ШІ. Що може піти не так.
На проді — багато чого. Кодовий суб-агент радісно ігнорує обмеження, які знайшов дослідницький суб-агент. Батьківський агент знизує плечима. Ви витріщаєтесь у логи, намагаючись зрозуміти, куди поділася половина контексту — всієї інформації, потрібної ШІ для роботи — між точкою А і точкою Б. Ласкаво просимо у мультиагентний зіпсований телефон.
Три платформи, три способи втратити дані
Між 9 та 17 квітня 2026 року три найбільші ШІ-платформи випустили або оновили делегування суб-агентів — коли один ШІ передає роботу іншому ШІ — як повноцінну фічу:
- 9 квітня: Anthropic запустив Managed Agents у публічній бета-версії. Кожен суб-агент отримує свіжу сесію — чистий аркуш розмови — плюс рядок інструкцій.
- 15 квітня: OpenAI оновив свій Agents SDK із sandboxed маршрутизацією суб-агентів. Поведінка за замовчуванням: передати всю історію розмови наступному агенту.
- 17 квітня: Google ADK (Agent Development Kit), який вперше отримав підтримку мультиагентності наприкінці березня, оновив документацію по мультиагентності та модель стану сесій — по суті спільну дошку, де агенти залишають нотатки одне одному. Їхня власна документація містить перлину: "Root Agent фактично не в курсі подій".
Три платформи. Три несумісні механізми. Нуль документації про те, що насправді губиться на межі передачі.
Зіпсований телефон у цифрах
Ось як кожна платформа передає контекст, коли Агент А делегує Агенту Б:
# OpenAI: передає відфільтрований список повідомлень через HandoffInputData
class HandoffInputData:
input_history: list # повна історія чату, з фільтрацією
pre_handoff_items: list
new_items: list
# За замовчуванням: проходить все.
# Але input guardrails (фільтри безпеки) працюють ТІЛЬКИ
# для першого агента. Решта працює без захисту.
# Anthropic: запускає абсолютно нову сесію для кожного агента
# POST /v1/sessions → свіжий контекст, чистий аркуш
# "мізки можуть передавати руки одне одному"
# ...але новий мізок починає з вибірковою амнезією
# Google ADK: спільний словник стану
session.state["research_results"] = findings
# Інший агент читає ключ. Якщо він існує.
# Паралельне виконання? Race conditions (два агенти
# пишуть в один ключ одночасно) — ваші проблеми.
Деградація — не теоретична. Дослідження UC Berkeley від лютого 2026 на 1 600+ трейсах у семи агентних фреймворках виявило рівень відмов до 86,7%. Аналіз XTrace показав: дослідницький агент генерує 3 000 корисних токенів — текстових фрагментів, які ШІ обробляє — похованих у 40 000 токенів загального контексту. Це 93% шуму на момент передачі. Дослідження класифікувало збої на три категорії: втрата контексту (інформація просто зникає між агентами), спотворення контексту (інформація доходить, але семантично перекручена) та розмивання контексту (корисна інформація тоне в шумі). Стаття Google DeepMind від березня 2026 про координацію мультиагентних систем зафіксувала 39–70% деградації reasoning на межах делегування.
Як написав BriefHQ 11 березня: "Зникла не сира інформація. Зник контекст прийняття рішень".
Ціна виправлення
Ваші варіанти так собі:
- Серіалізувати повний контекст у промпт делегування — спалює токени (≈$5–25 за мільйон для топових моделей) і з'їдає ваше контекстне вікно живцем
- Спільні сховища пам'яті — додає vendor lock-in і ще одну точку відмови
- Відмовитись від делегування взагалі — назад до моноліту, який захлинається на складних воркфлоу
Жодна платформа не дає вбудованого механізму, щоб батьківський агент міг перевірити, що дочірній реально отримав те, що йому відправили. Ви керуєте командою, яка не може поставити вас у копію листа.
Перш ніж декомпозувати
Перед тим як розбивати агента на мультиагентний воркфлоу, проведіть один елементарний тест: впровадьте конкретне обмеження на початку ланцюга і перевірте, чи дотримується його останній агент. Щось на кшталт "ніколи не використовуй pandas" або "всі результати мають бути в метричних одиницях". Якщо останній агент порушує обмеження — вітаю, ви знайшли свій витік контексту.
Підіть далі. Логуйте кількість токенів на кожній межі передачі. Якщо Агент А відправляє 3 000 токенів дослідження, а ефективний контекст Агента Б містить лише 200 із них — ви точно знаєте, де дірка. Не потрібен модний фреймворк для трейсингу — print statement на кожній точці делегування розповість усю історію. Зробіть це до деплою на прод. Зробіть це до написання першого рядка оркестраційного коду.
Кожна платформа продає мультиагентне делегування як "керування командою". Але члени команди не можуть прочитати нотатки одне одного, протокол наради стає коротшим на кожному рівні ієрархії, і ніхто не побудував механізм виявлення втрати інформації. Звіт Gartner від жовтня 2025 прогнозує, що понад 40% проєктів з агентним ШІ будуть скасовані до 2027 року. Дивлячись на архітектури передачі, які ці три платформи випустили у квітні 2026, ця цифра виглядає оптимістичною.


