Tres plataformas lancaram delegacao multi-agente em abril de 2026. Nenhuma resolveu a perda de contexto.

Você dividiu seu agente monolítico — um programa que age em seu nome — em um sub-agente de pesquisa e um sub-agente de código, exatamente como a documentação do SDK sugeria. Delegação! Divisão de trabalho! Teoria moderna de gestão, mas para IA. O que poderia dar errado.

Em produção, muita coisa. O sub-agente de código alegremente ignora restrições que o sub-agente de pesquisa descobriu. O agente pai dá de ombros. Você fica encarando os logs tentando entender onde metade do contexto — toda a informação que a IA precisa pra fazer seu trabalho — evaporou entre o ponto A e o ponto B. Bem-vindo ao telefone sem fio multi-agente.

Três Plataformas, Três Formas de Perder Seus Dados

Entre 9 e 17 de abril de 2026, as três maiores plataformas de IA lançaram ou atualizaram delegação de sub-agentes — permitir que uma IA passe trabalho para outra IA — como funcionalidade de primeira classe:

9 de abril: A Anthropic lançou Managed Agents em beta público. Cada sub-agente ganha uma sessão nova — uma lousa limpa de conversa — mais uma string de instrução.
15 de abril: A OpenAI atualizou seu Agents SDK com roteamento sandboxado de sub-agentes. Comportamento padrão: passar o histórico inteiro da conversa para o próximo agente.
17 de abril: O Google ADK (Agent Development Kit), que lançou suporte multi-agente no final de março, atualizou sua documentação de multi-agente e o modelo de session state — basicamente um quadro branco compartilhado onde os agentes rabiscam anotações um pro outro. A própria documentação deles inclui essa pérola: "o Root Agent está efetivamente fora do circuito."

Três plataformas. Três mecanismos incompatíveis. Zero documentação sobre o que realmente se perde na fronteira do handoff.

O Telefone Sem Fio, Quantificado

Veja como cada plataforma passa contexto quando o Agente A delega para o Agente B:

# OpenAI: passa uma lista filtrada de mensagens via HandoffInputData
class HandoffInputData:
    input_history: list   # histórico completo do chat, filtrável
    pre_handoff_items: list
    new_items: list
# Padrão: tudo passa.
# Mas input guardrails (filtros de segurança) se aplicam APENAS
# ao primeiro agente. O resto roda sem proteção.

# Anthropic: inicia uma sessão completamente nova por agente
# POST /v1/sessions  → contexto fresco, lousa limpa
# "cérebros podem passar mãos uns aos outros"
# ...mas o novo cérebro começa com amnésia seletiva

# Google ADK: dicionário de estado compartilhado
session.state["research_results"] = findings
# Outro agente lê a chave. Se ela existir.
# Execução paralela? Race conditions (dois agentes
# escrevendo na mesma chave simultaneamente) são problema seu.

A degradação não é teórica. Um estudo de fevereiro de 2026 da UC Berkeley com 1.600+ traces em sete frameworks de agentes encontrou taxas de falha de até 86,7%. A análise XTrace mostrou um agente de pesquisa produzindo 3.000 tokens úteis — pedaços de palavras que a IA processa — enterrados em 40.000 tokens de contexto total. Isso é uma taxa de ruído de 93% no handoff. O estudo classificou as falhas em três categorias: perda de contexto (informação simplesmente sumindo entre agentes), corrupção de contexto (informação chegando mas semanticamente distorcida) e diluição de contexto (informação útil afogada em ruído). Um paper de março de 2026 do Google DeepMind sobre coordenação multi-agente mediu degradação de raciocínio de 39–70% nas fronteiras de delegação.

Como o BriefHQ resumiu em 11 de março: "O que desapareceu no caminho não foi informação bruta. O que desapareceu foi o contexto de decisão."

O Preço de Consertar Isso

Suas opções não são lá essas coisas:

Serializar o contexto completo no prompt de delegação — queima tokens (a ~$5–25 por milhão para modelos de ponta) e devora sua janela de contexto
Memory stores compartilhados — adiciona vendor lock-in e mais um ponto de falha
Pular a delegação completamente — de volta aos monolitos single-agent que engasgam em workflows complexos

Nenhuma plataforma oferece um mecanismo nativo para o agente pai verificar o que o filho realmente recebeu versus o que o pai enviou. Você está gerenciando uma equipe que não consegue te colocar em cópia nos e-mails.

Antes de Decompor

Antes de dividir seu agente em um workflow multi-agente, faça um teste absurdamente simples: injete uma restrição específica no topo da cadeia e verifique se o agente do final respeita. Algo como "nunca use pandas" ou "todas as saídas devem estar em unidades métricas." Se o último agente violar — parabéns, você encontrou seu vazamento de contexto.

Vá um passo além. Registre a contagem de tokens em cada fronteira de handoff. Se o Agente A envia 3.000 tokens de pesquisa e o contexto efetivo do Agente B contém apenas 200 tokens disso, você sabe exatamente onde está o ralo. Nenhum framework sofisticado de tracing necessário — um print statement em cada ponto de delegação conta a história inteira. Faça isso antes de fazer deploy em produção. Faça isso antes de escrever uma única linha de código de orquestração.

Toda plataforma vende delegação multi-agente como "gerenciar uma equipe." Mas os membros da equipe não conseguem ler as anotações uns dos outros, a ata da reunião fica mais curta a cada nível do organograma, e ninguém construiu um mecanismo para detectar a perda de informação. Um relatório da Gartner de outubro de 2025 prevê que mais de 40% dos projetos de IA agêntica serão cancelados até 2027. Olhando para as arquiteturas de handoff que essas três plataformas lançaram em abril de 2026, esse número parece otimista.

Tres plataformas lancaram delegacao multi-agente em abril de 2026. Nenhuma resolveu a perda de contexto.

Três Plataformas, Três Formas de Perder Seus Dados

O Telefone Sem Fio, Quantificado

O Preço de Consertar Isso

Antes de Decompor

Keep reading

A Janela de Permissao do Seu Agente e Placebo

O Paradoxo dos Agentes: Menos Autonomia, Mais Valor

Tres Plataformas de Agentes, Tres Especies Diferentes

Agentes Invisiveis, Lei Visivel: 102 Dias Ate a UE Obrigar a IA a Se Identificar