Spędziłeś tygodnie, dopieszczając swój setup. Twój CLAUDE.md — plik z regułami, który mówi AI, jak ma się zachowywać w twoim projekcie — jest perfekcyjny. Twoje wzorce promptów są wykręcone na maksa. Twój asystent kodowania w końcu pisze kod tak, jak ty tego chcesz. Życie jest piękne.
A potem 16 kwietnia Anthropic podmienił mózg.
Lobotomia w nocy
Claude Opus 4.7 pojawił się 16 kwietnia 2026 roku — na Claude.ai, w API (interfejsie, przez który programy gadają z serwerami Anthropica), AWS Bedrock, Google Vertex i GitHub Copilot. Jeśli używasz Claude Code — terminalowego agenta kodującego od Anthropica, który zgarnął 91% CSAT w ankiecie JetBrains AI Pulse — a w konfiguracji masz model: opus, twoje narzędzie po cichu zaczęło odpytywać inny model. Żadnego powiadomienia. Żadnego okna z pytaniem o zgodę. Żadnego changelogu przed nosem.
GitHub pokazał to jeszcze dosadniej. Ich changelog z 16 kwietnia mówi, że Opus 4.7 zastąpi Opus 4.5 i 4.6 w pickerze modeli Copilota "w ciągu nadchodzących tygodni". Nie "obok". Zastąpi.
A 23 kwietnia — za dwa dni — Claude Code automatycznie przełącza domyślny model także dla użytkowników Enterprise i API.
Każda zależność ma lockfile. Oprócz tej najważniejszej.
Pomyśl, jak normalnie działa software. Kiedy używasz paczki z npm (sklepu z bibliotekami dla JavaScriptu) albo obrazu Dockera (zamrożonej migawki środowiska serwerowego), pinujesz konkretną wersję. Jest lockfile — kwit mówiący "używam wersji 2.3.1 i wybrałem ją świadomie". Jest changelog — lista zmian. Jest git blame — sposób, żeby zobaczyć, kto co zmienił i kiedy.
Modele AI nie mają nic z tego.
Według własnej dokumentacji Anthropica, Opus 4.7 wprowadził łamiące zmiany w API: Anthropic usunął budżety na myślenie (dostaniesz błąd 400, jeśli spróbujesz), wyrzucił parametry samplowania i podmienił tokenizer — komponent, który tnie tekst na kawałki czytelne dla AI — przez co ten sam input kosztuje do 35% więcej tokenów. Simon Willison niezależnie zmierzył, że system prompty kosztują 1,46× więcej, a obrazy 3,01× więcej.
Ale zmiany behawioralne są gorsze od łamiących, bo są niewidoczne. Anthropic opisuje Opus 4.7 jako "bardziej dosłowne śledzenie instrukcji" z "bardziej bezpośrednim, opiniodawczym tonem". Mniej wywołań narzędzi domyślnie. Mniej subagentów. Inne długości odpowiedzi. Innymi słowy: model myśli inaczej — a ty zoptymalizowałeś swój starannie przygotowany plik reguł pod mózg, który już nie istnieje.
Tian Pan, były inżynier Ubera, opublikował "The Silent Regression" 17 kwietnia, celnie ujmując sedno problemu: "Power userzy są najbardziej poszkodowani przez dryfowanie zachowań... bo to oni zainwestowali najwięcej w zrozumienie dziwactw systemu."
Co właściwie znaczy "lepszy"
Opus 4.7 zdobywa 87,6% na SWE-bench Verified — standaryzowanym teście umiejętności kodowania AI. Na papierze robi wrażenie. Ale "lepszy w uśrednionych benchmarkach" to nie jest "lepszy dla twojego codebase'u". Twój projekt to nie benchmark. Twoje konwencje nie są przeciętne.
Cursor oferuje picker modeli, ale bez pinowania wersji wewnątrz rodziny modeli. Copilot wpycha zamienniki. Claude Code pozwala power userom pinować przez zmienne środowiskowe (ANTHROPIC_DEFAULT_OPUS_MODEL=claude-opus-4-7), ale użytkownicy subskrypcyjni na planach Pro i Max — czyli większość — są przenoszeni po cichu. Checklista CTO od Augment Code traktuje narzędzia bez pinowania wersji jako "natychmiastową dyskwalifikację" przy wdrożeniach enterprise.
Co robić teraz
Traktuj aktualizacje modeli jak zmiany infrastrukturalne. Trzymaj pliki reguł pod kontrolą wersji. Jeśli używasz Claude Code, pinuj pełną nazwę modelu zamiast aliasu opus. Utrzymuj mały zestaw "testów promptów" — znanych inputów, dla których oczekujesz konkretnych outputów — i puszczaj je ponownie po każdej zmianie modelu. I wymagaj od swojego dostawcy behawioralnych changelogów, nie tylko tabelek z benchmarkami.
Puenta
Pamiętasz ten perfekcyjnie dostrojony setup z zeszłego tygodnia? Dostroiłeś go pod model, który właśnie jest wycofywany. Najważniejszy komponent w całym twoim toolchainie do kodowania — model AI — jest jedynym, który ma zero zarządzania zmianami. Pierwszy vendor, który dostarczy pinowanie wersji, diffy behawioralne i rollback jako pełnoprawne funkcje, nie tylko zdobędzie zaufanie deweloperów. Wygra tier enterprise, gdzie "coś się zmieniło i nie wiemy dlaczego" to nie ficzer — to naruszenie compliance.



