Dividiste tu agente monolítico — un programa que actúa en tu nombre — en un sub-agente de investigación y otro de código, exactamente como sugerían los docs del SDK. ¡Delegación! ¡División del trabajo! Teoría moderna de gestión, pero para IA. Qué podría salir mal.
En producción, bastante. El sub-agente de código ignora alegremente las restricciones que el sub-agente de investigación descubrió. El agente padre se encoge de hombros. Tú te quedas mirando los logs preguntándote dónde se esfumó la mitad del contexto — toda la información que la IA necesita para hacer su trabajo — entre el punto A y el punto B. Bienvenido al teléfono descompuesto multi-agente.
Tres plataformas, tres formas de perder tus datos
Entre el 9 y el 17 de abril de 2026, las tres plataformas de IA más grandes lanzaron o actualizaron la delegación de sub-agentes — permitir que una IA le pase trabajo a otra IA — como funcionalidad de primera clase:
- 9 de abril: Anthropic lanzó Managed Agents en beta pública. Cada sub-agente recibe una sesión nueva — una pizarra de conversación limpia — más una cadena de instrucciones.
- 15 de abril: OpenAI actualizó su Agents SDK con enrutamiento de sub-agentes en sandbox. Comportamiento por defecto: pasar el historial completo de conversación al siguiente agente.
- 17 de abril: Google ADK (Agent Development Kit), que lanzó soporte multi-agente a finales de marzo, actualizó sus docs de multi-agente y su modelo de estado de sesión — básicamente un pizarrón compartido donde los agentes se dejan recados. Sus propios docs incluyen esta joya: "el Root Agent está efectivamente fuera del loop."
Tres plataformas. Tres mecanismos incompatibles. Cero documentación sobre lo que realmente se pierde en el límite del handoff.
El teléfono descompuesto, cuantificado
Así es como cada plataforma pasa el contexto cuando el Agente A delega al Agente B:
# OpenAI: pasa una lista filtrada de mensajes vía HandoffInputData
class HandoffInputData:
input_history: list # historial completo del chat, filtrable
pre_handoff_items: list
new_items: list
# Por defecto: todo pasa.
# Pero los input guardrails (filtros de seguridad) aplican SOLO
# al primer agente. El resto corre sin protección.
# Anthropic: inicia una sesión completamente nueva por agente
# POST /v1/sessions → contexto fresco, pizarra limpia
# "los cerebros pueden pasarse las manos entre sí"
# ...pero el nuevo cerebro arranca con amnesia selectiva
# Google ADK: diccionario de estado compartido
session.state["research_results"] = findings
# El otro agente lee la key. Si existe.
# ¿Ejecución en paralelo? Las race conditions (dos agentes
# escribiendo en la misma key simultáneamente) son tu problema.
La degradación no es teórica. Un estudio de UC Berkeley de febrero de 2026 con más de 1,600 trazas en siete frameworks de agentes encontró tasas de fallo de hasta 86.7%. El análisis con XTrace mostró un agente de investigación produciendo 3,000 tokens útiles — pedazos de palabras que la IA procesa — enterrados en 40,000 tokens de contexto total. Eso es un 93% de ruido en el handoff. El estudio clasificó los fallos en tres categorías: pérdida de contexto (la información simplemente desaparece entre agentes), corrupción de contexto (la información llega pero semánticamente distorsionada) y dilución de contexto (la información útil ahogada en ruido). Un paper de Google DeepMind de marzo de 2026 sobre coordinación multi-agente midió una degradación del razonamiento del 39–70% en los límites de delegación.
Como lo planteó BriefHQ el 11 de marzo: "Lo que desapareció en el camino no fue información cruda. Lo que desapareció fue el contexto de decisión."
El precio de arreglarlo
Tus opciones no son geniales:
- Serializar todo el contexto en el prompt de delegación — quema tokens (a ~$5–25 por millón para modelos de frontera) y devora tu ventana de contexto
- Almacenes de memoria compartida — agrega vendor lock-in y otro punto de fallo
- Saltarte la delegación por completo — de vuelta a monolitos de un solo agente que se ahogan con flujos de trabajo complejos
Ninguna plataforma provee un mecanismo integrado para que un agente padre verifique lo que su hijo realmente recibió versus lo que el padre envió. Estás gestionando un equipo que no puede ponerte en copia en los correos.
Antes de descomponer
Antes de dividir tu agente en un flujo multi-agente, haz una prueba ridículamente simple: inyecta una restricción específica al inicio de la cadena y verifica si el último agente la respeta. Algo como "nunca uses pandas" o "todos los outputs deben estar en unidades métricas." Si el último agente la viola — felicidades, encontraste tu fuga de contexto.
Llévalo un paso más allá. Registra el conteo de tokens en cada límite de handoff. Si el Agente A envía 3,000 tokens de investigación y el contexto efectivo del Agente B solo contiene 200 tokens de eso, sabes exactamente dónde está el drenaje. No necesitas un framework de tracing sofisticado — un print statement en cada punto de delegación te cuenta toda la historia. Haz esto antes de hacer deploy a producción. Haz esto antes de escribir una sola línea de código de orquestación.
Cada plataforma vende la delegación multi-agente como "gestionar un equipo." Pero los miembros del equipo no pueden leer las notas de los demás, las minutas de las reuniones se acortan en cada nivel del organigrama, y nadie construyó un mecanismo para detectar la pérdida de información. Un reporte de Gartner de octubre de 2025 predice que más del 40% de los proyectos de IA agéntica serán cancelados para 2027. Viendo las arquitecturas de handoff que estas tres plataformas lanzaron en abril de 2026, ese número se siente optimista.


