Você passou semanas ajustando seu setup. Seu CLAUDE.md — um arquivo de regras que diz pra IA como se comportar no seu projeto — está perfeito. Seus padrões de prompt estão afinados. Seu assistente de código finalmente escreve código do jeito que você quer. A vida é boa.

Aí no dia 16 de abril, a Anthropic trocou o cérebro.

A lobotomia da madrugada

O Claude Opus 4.7 entrou no ar em 16 de abril de 2026, no Claude.ai, na API (a interface que programas usam pra falar com os servidores da Anthropic), AWS Bedrock, Google Vertex e GitHub Copilot. Se você usa o Claude Code — o agente de código via terminal da Anthropic, que marcou 91% de CSAT na pesquisa AI Pulse da JetBrains — e seu config diz model: opus, sua ferramenta começou a rodar um modelo diferente sem aviso. Sem notificação. Sem tela de opt-in. Sem changelog na sua cara.

O GitHub deixou ainda mais escancarado. O changelog de 16 de abril diz que o Opus 4.7 vai substituir o Opus 4.5 e 4.6 no seletor de modelos do Copilot "nas próximas semanas". Não "ao lado de". Substituir.

E no dia 23 de abril — daqui a dois dias — o Claude Code troca o padrão automaticamente pra usuários Enterprise e API também.

Toda dependência tem um lockfile. Menos a mais importante.

Pense em como software normalmente funciona. Quando você usa um pacote do npm (a loja de bibliotecas do JavaScript) ou uma imagem Docker (um snapshot congelado de um ambiente de servidor), você trava a versão exata. Tem um lockfile — um recibo que diz "estou usando a versão 2.3.1, e escolhi isso de propósito". Tem um changelog — uma lista do que mudou. Tem o git blame — um jeito de ver quem mudou o quê e quando.

Modelos de IA não têm nada disso.

Segundo a própria documentação da Anthropic, o Opus 4.7 trouxe breaking changes na API: a Anthropic removeu thinking budgets (erro 400 se você tentar), matou parâmetros de sampling e trocou o tokenizer — o componente que fatia o texto em pedaços que a IA consegue ler — por um que faz a mesma entrada custar até 35% mais tokens. Simon Willison mediu independentemente que system prompts custam 1,46× mais e imagens custam 3,01× mais.

Mas as mudanças comportamentais são piores que as breaking changes, porque são invisíveis. A Anthropic descreve o Opus 4.7 como "mais literal no seguimento de instruções" com um "tom mais direto e opinativo". Menos tool calls por padrão. Menos subagents. Tamanhos de resposta diferentes. Em outras palavras: o modelo pensa diferente — e você otimizou seu arquivo de regras cuidadosamente elaborado pra um cérebro que já não existe mais.

Tian Pan, ex-engenheiro do Uber, publicou "The Silent Regression" em 17 de abril, acertando em cheio o problema central: "Usuários avançados são os mais prejudicados pelo drift comportamental... quem mais investiu em entender as peculiaridades do sistema."

O que "melhor" realmente significa

O Opus 4.7 marca 87,6% no SWE-bench Verified — um teste padronizado pra habilidade de código de IA. Impressionante no papel. Mas "melhor na média dos benchmarks" não é "melhor pro seu codebase". Seu projeto não é um benchmark. Suas convenções não são a média.

O Cursor oferece um seletor de modelos, mas não permite travar a versão dentro de uma família. O Copilot empurra substituições. O Claude Code permite que usuários avançados travem via variáveis de ambiente (ANTHROPIC_DEFAULT_OPUS_MODEL=claude-opus-4-7), mas assinantes dos planos Pro e Max — a maioria — são migrados silenciosamente. O checklist de CTO da Augment Code classifica ferramentas sem version pinning como "desqualificação imediata" pra adoção enterprise.

O que fazer agora

Trate atualizações de modelo como mudanças de infraestrutura. Versione seus arquivos de regras no Git. Se você usa o Claude Code, trave o nome completo do modelo em vez do alias opus. Mantenha um conjunto pequeno de "testes de prompt" — inputs conhecidos onde você espera outputs específicos — e rode de novo depois de qualquer mudança de modelo. E exija changelogs comportamentais do seu fornecedor, não só tabelas de benchmark.

O ponto final

Lembra daquele setup perfeitamente ajustado que você tinha semana passada? Você ajustou pra um modelo que já está sendo descontinuado. O componente de maior impacto em toda a sua toolchain de código — o modelo de IA — é o único com zero gestão de mudança. O primeiro fornecedor que entregar version pinning, diffs comportamentais e rollback como features de primeira classe não vai só ganhar a confiança dos devs. Vai ganhar o tier enterprise, onde "mudou e a gente não sabe por quê" não é uma feature — é uma violação de compliance.