Você dividiu seu agente monolítico — um programa que age em seu nome — em um sub-agente de pesquisa e um sub-agente de código, exatamente como a documentação do SDK sugeria. Delegação! Divisão de trabalho! Teoria moderna de gestão, mas para IA. O que poderia dar errado.

Em produção, muita coisa. O sub-agente de código alegremente ignora restrições que o sub-agente de pesquisa descobriu. O agente pai dá de ombros. Você fica encarando os logs tentando entender onde metade do contexto — toda a informação que a IA precisa pra fazer seu trabalho — evaporou entre o ponto A e o ponto B. Bem-vindo ao telefone sem fio multi-agente.

Três Plataformas, Três Formas de Perder Seus Dados

Entre 9 e 17 de abril de 2026, as três maiores plataformas de IA lançaram ou atualizaram delegação de sub-agentes — permitir que uma IA passe trabalho para outra IA — como funcionalidade de primeira classe:

  • 9 de abril: A Anthropic lançou Managed Agents em beta público. Cada sub-agente ganha uma sessão nova — uma lousa limpa de conversa — mais uma string de instrução.
  • 15 de abril: A OpenAI atualizou seu Agents SDK com roteamento sandboxado de sub-agentes. Comportamento padrão: passar o histórico inteiro da conversa para o próximo agente.
  • 17 de abril: O Google ADK (Agent Development Kit), que lançou suporte multi-agente no final de março, atualizou sua documentação de multi-agente e o modelo de session state — basicamente um quadro branco compartilhado onde os agentes rabiscam anotações um pro outro. A própria documentação deles inclui essa pérola: "o Root Agent está efetivamente fora do circuito."

Três plataformas. Três mecanismos incompatíveis. Zero documentação sobre o que realmente se perde na fronteira do handoff.

O Telefone Sem Fio, Quantificado

Veja como cada plataforma passa contexto quando o Agente A delega para o Agente B:

# OpenAI: passa uma lista filtrada de mensagens via HandoffInputData
class HandoffInputData:
    input_history: list   # histórico completo do chat, filtrável
    pre_handoff_items: list
    new_items: list
# Padrão: tudo passa.
# Mas input guardrails (filtros de segurança) se aplicam APENAS
# ao primeiro agente. O resto roda sem proteção.

# Anthropic: inicia uma sessão completamente nova por agente
# POST /v1/sessions  → contexto fresco, lousa limpa
# "cérebros podem passar mãos uns aos outros"
# ...mas o novo cérebro começa com amnésia seletiva

# Google ADK: dicionário de estado compartilhado
session.state["research_results"] = findings
# Outro agente lê a chave. Se ela existir.
# Execução paralela? Race conditions (dois agentes
# escrevendo na mesma chave simultaneamente) são problema seu.

A degradação não é teórica. Um estudo de fevereiro de 2026 da UC Berkeley com 1.600+ traces em sete frameworks de agentes encontrou taxas de falha de até 86,7%. A análise XTrace mostrou um agente de pesquisa produzindo 3.000 tokens úteis — pedaços de palavras que a IA processa — enterrados em 40.000 tokens de contexto total. Isso é uma taxa de ruído de 93% no handoff. O estudo classificou as falhas em três categorias: perda de contexto (informação simplesmente sumindo entre agentes), corrupção de contexto (informação chegando mas semanticamente distorcida) e diluição de contexto (informação útil afogada em ruído). Um paper de março de 2026 do Google DeepMind sobre coordenação multi-agente mediu degradação de raciocínio de 39–70% nas fronteiras de delegação.

Como o BriefHQ resumiu em 11 de março: "O que desapareceu no caminho não foi informação bruta. O que desapareceu foi o contexto de decisão."

O Preço de Consertar Isso

Suas opções não são lá essas coisas:

  1. Serializar o contexto completo no prompt de delegação — queima tokens (a ~$5–25 por milhão para modelos de ponta) e devora sua janela de contexto
  2. Memory stores compartilhados — adiciona vendor lock-in e mais um ponto de falha
  3. Pular a delegação completamente — de volta aos monolitos single-agent que engasgam em workflows complexos

Nenhuma plataforma oferece um mecanismo nativo para o agente pai verificar o que o filho realmente recebeu versus o que o pai enviou. Você está gerenciando uma equipe que não consegue te colocar em cópia nos e-mails.

Antes de Decompor

Antes de dividir seu agente em um workflow multi-agente, faça um teste absurdamente simples: injete uma restrição específica no topo da cadeia e verifique se o agente do final respeita. Algo como "nunca use pandas" ou "todas as saídas devem estar em unidades métricas." Se o último agente violar — parabéns, você encontrou seu vazamento de contexto.

Vá um passo além. Registre a contagem de tokens em cada fronteira de handoff. Se o Agente A envia 3.000 tokens de pesquisa e o contexto efetivo do Agente B contém apenas 200 tokens disso, você sabe exatamente onde está o ralo. Nenhum framework sofisticado de tracing necessário — um print statement em cada ponto de delegação conta a história inteira. Faça isso antes de fazer deploy em produção. Faça isso antes de escrever uma única linha de código de orquestração.

Toda plataforma vende delegação multi-agente como "gerenciar uma equipe." Mas os membros da equipe não conseguem ler as anotações uns dos outros, a ata da reunião fica mais curta a cada nível do organograma, e ninguém construiu um mecanismo para detectar a perda de informação. Um relatório da Gartner de outubro de 2025 prevê que mais de 40% dos projetos de IA agêntica serão cancelados até 2027. Olhando para as arquiteturas de handoff que essas três plataformas lançaram em abril de 2026, esse número parece otimista.