Te pasaste semanas afinando tu setup. Tu CLAUDE.md — el archivo de reglas que le dice a la IA cómo comportarse en tu proyecto — está perfecto. Tus patrones de prompt están calibrados al milímetro. Tu asistente de código por fin escribe como vos querés. La vida es bella.
Entonces el 16 de abril, Anthropic le cambió el cerebro.
La lobotomía nocturna
Claude Opus 4.7 salió en vivo el 16 de abril de 2026 en Claude.ai, la API (la forma en que los programas se comunican con los servidores de Anthropic), AWS Bedrock, Google Vertex y GitHub Copilot. Si usás Claude Code — el agente de programación de Anthropic que corre en la terminal y sacó un 91% de satisfacción en la encuesta AI Pulse de JetBrains — y tu config dice model: opus, tu herramienta empezó a correr un modelo distinto sin avisarte. Sin notificación. Sin diálogo de confirmación. Sin changelog en la cara.
GitHub fue todavía más directo. Su changelog del 16 de abril dice que Opus 4.7 va a reemplazar a Opus 4.5 y 4.6 en el selector de modelos de Copilot "en las próximas semanas". No "junto a". Reemplazar.
Y el 23 de abril — dentro de dos días — Claude Code hace el cambio automático del modelo por defecto para usuarios Enterprise y de API también.
Cada dependencia tiene un lockfile. Menos la más importante.
Pensá en cómo funciona el software normalmente. Cuando usás un paquete de npm (la tienda de librerías de código de JavaScript) o una imagen de Docker (una foto congelada de un entorno de servidor), fijás la versión exacta. Hay un lockfile — un recibo que dice "estoy usando la versión 2.3.1, y lo elegí a propósito". Hay un changelog — una lista de qué cambió. Hay git blame — una forma de ver quién cambió qué y cuándo.
Los modelos de IA no tienen nada de esto.
Según la documentación de Anthropic, Opus 4.7 introdujo cambios que rompen la API: eliminaron los thinking budgets (errores 400 si lo intentás), mataron los parámetros de sampling, y metieron un nuevo tokenizer — el componente que corta el texto en pedacitos que la IA puede leer — que hace que la misma entrada cueste hasta un 35% más tokens. Simon Willison midió de forma independiente que los system prompts cuestan 1.46× más y las imágenes 3.01× más.
Pero los cambios de comportamiento son peores que los breaking changes, porque son invisibles. Anthropic describe a Opus 4.7 como "seguimiento de instrucciones más literal" con un "tono más directo y opinado". Menos tool calls por defecto. Menos subagents. Largos de respuesta diferentes. En otras palabras: el modelo piensa diferente — y vos optimizaste tu archivo de reglas cuidadosamente elaborado para un cerebro que ya no existe.
Tian Pan, ex ingeniero de Uber, publicó "The Silent Regression" el 17 de abril, clavando el problema central: "Los usuarios avanzados son los más perjudicados por la deriva de comportamiento... los que más invirtieron en entender las particularidades del sistema."
Qué significa realmente "mejor"
Opus 4.7 saca 87.6% en SWE-bench Verified — un test estandarizado para medir la capacidad de programación de la IA. Impresionante en el papel. Pero "mejor en benchmarks promedio" no es "mejor para tu codebase". Tu proyecto no es un benchmark. Tus convenciones no son el promedio.
Cursor ofrece un selector de modelos pero no permite fijar versión dentro de una familia de modelos. Copilot empuja reemplazos. Claude Code sí deja que los usuarios avanzados fijen el modelo con variables de entorno (ANTHROPIC_DEFAULT_OPUS_MODEL=claude-opus-4-7), pero los usuarios de suscripción en los planes Pro y Max — la mayoría — son movidos en silencio. El checklist de CTO de Augment Code considera que herramientas sin version pinning son una "descalificación inmediata" para adopción empresarial.
Qué hacer ahora mismo
Tratá las actualizaciones de modelo como cambios de infraestructura. Versioná tus archivos de reglas con control de versiones. Si usás Claude Code, fijá el nombre completo del modelo en vez del alias opus. Mantené un set pequeño de "tests de prompt" — inputs conocidos donde esperás outputs específicos — y correlos después de cada cambio de modelo. Y exigile changelogs de comportamiento a tu proveedor, no solo tablas de benchmarks.
El remate
¿Te acordás de ese setup perfectamente afinado que tenías la semana pasada? Lo afinaste para un modelo que ya está siendo deprecado. El componente más importante de toda tu cadena de herramientas de programación — el modelo de IA — es el único con cero gestión de cambios. El primer proveedor que ofrezca version pinning, diffs de comportamiento y rollback como funcionalidades de primera clase no solo va a ganar la confianza de los desarrolladores. Va a ganar el tier enterprise, donde "cambió y no sabemos por qué" no es una feature — es una violación de compliance.



