Tus agentes de IA funcionan genial solos. Juntos estan rompiendo todo.

Tu empresa probablemente desplegó su primer agente de IA — un programa que actúa por su cuenta, no solo responde preguntas — en algún momento de esta primavera. Quizás revisa pull requests en GitHub. Quizás clasifica tickets de soporte. Quizás vigila tus dashboards de la nube a las 3 AM para que tú no tengas que hacerlo. Cada uno reporta verde en su propio tablero. La vida es bella.

Excepto que los tres escriben en el mismo board de Jira, los mismos canales de Slack, los mismos repos de GitHub. Y nadie — ni tu equipo, ni el proveedor — definió qué pasa cuando sus acciones chocan sobre recursos compartidos. Compraste tres empleados autónomos y los sentaste en el mismo escritorio sin presentarlos.

Tres plataformas, cero semáforos

Google abre Cloud Next 2026 hoy (22 de abril, Las Vegas) con su stack de IA agéntica como plato fuerte: ADK v1.0 — un toolkit para construir agentes — más el protocolo A2A (Agent-to-Agent, un estándar que permite a los agentes descubrirse y delegarse tareas entre sí), graduándose a v1.0 hoy después de su preview inicial en Cloud Next 2025, ahora con más de 150 organizaciones participantes incluyendo AWS, Microsoft y Salesforce. Hace dos semanas (8 de abril), Anthropic lanzó Managed Agents en beta pública — instancias de Claude de larga duración que completan flujos de trabajo enteros, no solo responden prompts — con Notion, Asana y Sentry como adoptantes tempranos. Hace una semana (15 de abril), OpenAI actualizó su Agents SDK con ejecución nativa en sandbox — contenedores aislados donde los agentes ejecutan código de forma segura — y un harness nativo del modelo.

Tres runtimes en competencia, cada uno tratando a su agente como el único actor autónomo en tu infraestructura. Ninguno incluye un concepto de "oye, otro agente ya está trabajando en esto".

Cómo los agentes se sabotean con su propio éxito

Aquí está el patrón, que ya está apareciendo en producción. El Agente A (tu bot de tickets) crea un issue en Jira. El Agente B (tu bot de deduplicación) lo clasifica como duplicado y lo cierra. El Agente A detecta el cierre como una anomalía y reabre el ticket. Cada agente tiene razón dentro de su propio contexto — su propia ventana de contexto (el fragmento de información que la IA puede "ver" a la vez). El sistema en su conjunto está mal, atrapado en un loop infinito donde acciones correctas producen resultados incorrectos.

Cogent Infotech documentó tres sabores de esto el 26 de marzo: el efecto "Mirror Mirror" (agentes sobreescribiendo eternamente las ediciones del otro, quemando miles de dólares en minutos), consenso alucinado (múltiples agentes convergiendo en datos fabricados — "silencioso y convincente"), y deadlocks de recursos (agentes esperándose mutuamente en dependencias circulares). Su veredicto: "No puedes preguntarle a un agente si está en un loop; tienes que demostrarlo matemáticamente."

Los datos lo respaldan. El benchmark MAST de UC Berkeley, publicado en marzo de 2025 y revisado en octubre de 2025, analizó más de 1,600 trazas en siete frameworks multi-agente y encontró tasas de fallo entre 41% y 86.7%. Lo mejor: aproximadamente el 79% de esos fallos venían de problemas de especificación y coordinación — no de que los modelos fueran tontos. Los agentes eran suficientemente inteligentes. Simplemente no tenían idea de la existencia del otro.

Un paper publicado el 16 de abril de 2026, "Semantic Consensus", le da un nombre formal a esto: Semantic Intent Divergence — agentes cooperantes que desarrollan interpretaciones inconsistentes de objetivos compartidos porque cada uno opera en su propio silo de información. En 600 pruebas sobre AutoGen, CrewAI y LangGraph, los investigadores lograron 100% de completación de workflows con su framework de coordinación propuesto versus 25.1% para el siguiente mejor baseline. La brecha es brutal, y confirma lo que los números ya susurraban: el problema no es la inteligencia, es la coordinación.

El precio del fix que nadie entrega

El protocolo A2A de Google es lo más cercano a una solución. Permite que los agentes se anuncien, describan sus capacidades a través de "Agent Cards" (ahora con verificación criptográfica de identidad), y deleguen tareas. Más de 150 organizaciones se sumaron. Pero A2A define descubrimiento y delegación — no resolución de conflictos. Si el Agente A y el Agente B tienen autoridad legítima para modificar el mismo ticket de Jira, A2A no opina sobre quién gana. Y adoptar A2A significa enrutar la coordinación entre agentes a través de Vertex AI, la plataforma cloud de Google — resolviendo la colisión entre proveedores con el lock-in de otro proveedor.

Como escribió John Furrier de SiliconANGLE el 20 de abril: "¿Quién es dueño del plano de control donde la IA realmente trabaja? Los modelos se están volviendo un commodity." Tiene razón. La batalla no es sobre qué modelo es más inteligente. Es sobre quién construye la capa de control de tráfico que se sienta por encima de todos ellos.

La arquitectura de Managed Agents de Anthropic describe explícitamente "muchos cerebros, muchas manos" — pero documenta cero coordinación entre los cerebros. El Agents SDK de OpenAI soporta Handoffs (delegación de tareas entre agentes) y Guardrails (validación de entrada/salida) pero ninguna resolución de conflictos entre agentes. Cada proveedor construyó un operador solitario muy capaz y asumió que solo desplegarías uno a la vez. En 2026. En una empresa.

Qué hacer al respecto

Antes de desplegar un segundo agente en cualquier sistema compartido — Jira, GitHub, Slack, tu consola de la nube — tu equipo necesita tres cosas que ningún proveedor ofrece actualmente: reglas explícitas de propiedad de recursos (qué agente es dueño de qué objetos), un registro de estado compartido (una única fuente de verdad sobre lo que cada agente ha hecho), y políticas de resolución de conflictos (cuando dos agentes no están de acuerdo, quién gana y por qué). Constrúyelos como middleware interno o sufre el impuesto del loop infinito.

La capa que falta

¿Recuerdas ese primer agente que desplegaste, el que reporta verde en su dashboard? Sigue reportando verde. El segundo también. El tercero también. Cada agente cree que está haciendo un trabajo excelente. El sistema que comparten cuenta una historia diferente.

La capa de infraestructura que le falta a la era de los agentes no es un modelo más inteligente — es control de tráfico para los agentes que ya están corriendo. La primera plataforma que lo entregue captura el nivel de orquestación por encima de Google, Anthropic y OpenAI. Hasta entonces, tus agentes son tres gatos en una cocina, cada uno convencido de que es el único que vive ahí.

Tus agentes de IA funcionan genial solos. Juntos estan rompiendo todo.

Tres plataformas, cero semáforos

Cómo los agentes se sabotean con su propio éxito

El precio del fix que nadie entrega

Qué hacer al respecto

La capa que falta

Keep reading

Tres plataformas de agentes, tres especies distintas

Tu agente elige la herramienta equivocada porque escribiste una mala descripcion y a ninguna plataforma le importa

La paradoja de los agentes: menos autonomia, mas valor

La factura de tu agente de IA es un organigrama — solo que no la has leido asi