El 11 de marzo de 2026, el agente de IA Kiro de Amazon eliminó y recreó autónomamente un entorno de producción en AWS. Trece horas de caída. Aproximadamente 6.3 millones de pedidos perdidos. El post-mortem de Particula clavó la distinción que realmente importa: "Los permisos responden '¿puede el agente hacer esto?' No responden '¿debería el agente hacer esto?' — que es la pregunta que importa para la seguridad en producción."
Esa pregunta del "debería" es la que nadie está resolviendo.
El sistema operativo invisible de tu equipo
Tu equipo tiene reglas no escritas. No se despliega los viernes. Se silencian los bots durante las caídas. No se toca nada durante el freeze de sprint planning. Nadie las escribió porque todos los humanos del equipo simplemente las saben. Es ese instinto operativo que se construye después de demasiadas alertas a las 3 AM.
Tus nuevos agentes de IA no saben nada de esto. Se disparan según su horario, pushean código, crean tickets y publican actualizaciones sin importar qué se está incendiando a su alrededor.
"Pero si ya tenemos automatización"
Sí. Y tomó una década de cicatrices enseñarle mesura.
PagerDuty tardó diez años de post-mortems a las 3 AM para aprender que quizás no hay que alertar a la gente por un servidor de staging roto mientras producción está en llamas. Los pipelines de CI/CD (cadenas automatizadas de build-test-deploy) necesitaron toda una generación de releases desastrosos para descubrir que "respetar el change freeze" no es una sugerencia — es supervivencia. Los bots de Slack se silencian durante ventanas de mantenimiento porque un pobre diablo recibió 400 notificaciones durante un P0 y renunció a la mañana siguiente.
Cada herramienta de operaciones madura carga juicio ganado a golpes, codificado como conciencia situacional. Las plataformas de agentes que se lanzaron entre el 8 y el 15 de abril de 2026 se saltaron toda esa década y dijeron "con esto alcanza".
Los lanzamientos que ya conoces
Te ahorro el resumen completo — ya viste la cobertura. Anthropic lanzó Managed Agents (8 de abril) y Claude Code Routines (14 de abril). OpenAI actualizó su Agents SDK (15 de abril). Tres plataformas, ocho días. Andrej Karpathy lo llamó la "era de los loops" después de que su agente AutoResearch ejecutara 700 experimentos en dos días sin supervisión el 17 de marzo de 2026.
Lo que tal vez no notaste: revisé cada página de documentación de las tres plataformas. Cero integración con gestión de incidentes. Sin soporte para freeze windows. Sin conciencia del estado de los deployments. Ni un solo hook que pregunte "¿es mal momento?"
Cómo se ve la ceguera contextual a las 2 AM
Un Routine pushea un PR de actualización de dependencias mientras el ingeniero de guardia combate un incidente P0. Un Managed Agent crea tickets de Jira que chocan con el freeze de sprint planning. Un agente del SDK reintenta una llamada API fallida contra una base de datos en plena migración.
Cada acción técnicamente correcta. Cada una operativamente catastrófica.
Es la misma clase de falla que arruinó la tarde de Amazon el 11 de marzo. Kiro tenía permisos para recrear el entorno. Nadie codificó el juicio para decirle que no lo hiciera.
El precio de "siempre activo" sin "siempre consciente"
Construir conciencia para agentes hoy significa cableado artesanal: conectar triggers a PagerDuty, Opsgenie, ArgoCD, calendarios de equipo — un MCP server (un plugin estandarizado que permite a las herramientas de IA conectarse con servicios externos) por cada fuente de señales. Nadie empaqueta esto.
Los límites diarios de los Routines — 5 ejecuciones para Pro, 15 para Max, 25 para Enterprise — limitan cuántas veces se ejecuta un agente. No dicen nada sobre cuándo debería quedarse callado. The Register los llamó "cron jobs medianamente ingeniosos", lo cual es generoso — porque cron de verdad al menos corre dentro de un ecosistema que aprendió mesura hace décadas.
Qué hacer hasta que las plataformas se pongan al día
Tres cosas, ninguna opcional:
- Documenta los runbooks de tus agentes junto a los humanos. Si tu playbook de guardia dice "durante incidentes, no desplegar", tu agente necesita la misma regla — en su archivo de configuración, no en tu cabeza.
- Configs explícitos de freeze windows. Aunque sean artesanales. Un archivo de texto que diga "sprint planning: martes 10–11 AM, no crear tickets" le gana a la nada por kilómetros.
- Un kill switch que no sea "borrar el Routine". Algo entre "corriendo" y "desapareció para siempre". Un botón de pausa. Idea radical, aparentemente.
La disciplina que todavía no existe
La era de los agentes no necesita más capacidades. Cada semana trae nuevas. Lo que necesita es su propia disciplina de operaciones — la que responda no "qué puede hacer el agente" sino "cuándo debería el agente callarse la boca".
Tu equipo pasó años construyendo ese instinto. Tus agentes arrancan en cero cada vez que se inician. Hasta que las plataformas codifiquen el contexto operativo como una primitiva de primera clase, esa brecha es tu problema — manual, tedioso, una freeze window a la vez.
El incidente de Kiro no fue una falla de permisos. Fue una falla de juicio. Y ahora mismo, cada agente always-on en producción carga el mismo punto ciego.



