Jak pisałem w dzisiejszym porannym przeglądzie, główna historia 31 marca nie wyszła z press release. Wyszła ze źle skonfigurowanego systemu zarządzania treścią.

Co Się Stało

Wewnętrzna dokumentacja Anthropic dla modelu o kryptonimie Mythos — alias inżynierski: Capybara — była krótko wystawiona na staging serwerze dostępnym z publicznego internetu. Dokument był zaindeksowany przez co najmniej dwa crawlery, zanim security team Anthropic go ściągnął. Do tego czasu screenshoty krążyły na X i w prywatnych grupach Slack.

Anthropic potwierdził ekspozycję. Ich oświadczenie było ostrożne: przyznali, że Mythos istnieje, potwierdzili, że jest w testach, i odmówili mówienia czegokolwiek o treści wycieku poza określeniem jej "wstępnymi notatkami wewnętrznymi."

Co Mówił Dokument

Wiele osób, które przeczytały dokument przed jego usunięciem, opisywało te same fragmenty. Język, który rozszedł się najszybciej:

  • "Skokowa zmiana w capability" — nie przyrostowe ulepszenie Claude Opus, ale jakościowa zmiana w tym, co model potrafi
  • "Wyprzedzi obrońców" w kontekście zastosowań cybersecurity
  • Odniesienia do wyników benchmarków, które były oznaczone jako nieopublikowane i zredagowane w wycieku

Fraza "wyprzedzi obrońców" robi tu dużo pracy. W kontekście wydawała się opisywać ryzyko, którego Anthropic był świadomy — wewnętrzna analiza bezpieczeństwa tego, co model mógłby umożliwić w trybie ofensywnym. Ale pozbawiona kontekstu, fraza brzmi jak claim capability. Obie interpretacje są niewygodne z różnych powodów.

Dlaczego To Ważne

Wyciek ma trzy warstwy i powinieneś się troszczyć o wszystkie.

Warstwa pierwsza: sam model. Anthropic był cicho w kwestii tego, co pojawi się po Opus. Modele klasy Sonnet dźwigały większość komercyjnego ciężaru — Claude Code jest na nich zbudowany, API jest przez nie zdominowane. Ale Mythos wydaje się czymś innym. "Skokowa zmiana" to język, który Anthropic rezerwuje dla przejść między tierami capability. Jeśli Mythos spełni to, co opisuje dokument, to nie jest ulepszenie Opus. To nowy tier powyżej niego.

Warstwa druga: język security. Fraza "wyprzedzi obrońców" to red flag zasługujący na uwagę niezależnie od kontekstu. Fakt, że safety team Anthropic pisze te słowa wewnętrznie, oznacza, że aktywnie modelują scenariusze, w których capability klasy Mythos wyprzedza zdolność specjalistów security do reagowania. To poważna wewnętrzna ocena ryzyka. To, że wyszła przypadkowo, jest drugorzędne wobec faktu, że w ogóle istnieje.

Warstwa trzecia: mechanizm wycieku. Źle skonfigurowany CMS na staging serwerze to nie wyrafinowany atak. To porażka operational security. Dla firmy trzymającej jedne z najbardziej wrażliwych badań AI capability na świecie, to warto zbadać. Co jeszcze jest na staging serwerach, gdzie nie powinno być?

Rynek Się Poruszył

Bitcoin osiągnął 66K$ w godzinach po tym, jak wyciek szeroko się rozpowszechnił. Korelacja jest spekulatywna, ale nie irracjonalna — rynki przetwarzające sygnały capability AI czasem traktują je jako sygnały makro. Jeśli frontier model ma wylądować i "wyprzedzać obrońców" w cybersecurity, ma to implikacje poza branżą AI.

Ostatnia podana prywatna wycena Anthropic to 61B$. Ta liczba będzie rewidowana.

Na Co Patrzeć

Benchmarki. Dokument wskazywał na nieopublikowane wyniki. Gdy Anthropic formalnie ogłosi Mythosa — a ogłosi, we własnym czasie — liczby benchmarków powiedzą ci, czy język "skokowej zmiany" był trafny czy aspiracyjny.

Disclosure bezpieczeństwa. Jak Anthropic komunikuje model, który ich własne wewnętrzne dokumenty oznaczyły jako potencjalnie wyprzedzający obrońców? Framing responsible scaling, którego używali wcześniej, będzie tu poddany poważnej próbie.

Odpowiedź konkurentów. OpenAI, Google i Meta mają własne timelines frontier modeli. Potwierdzona "skokowa zmiana" od Anthropic kompresuje publiczne timelines wszystkich.

Ironia Codexa. Jak opiszę o 9:30, OpenAI tego ranka shippował plugin działający wewnątrz Claude Code. To się stało przed wiadomościami o Mythosie. Jeśli Mythos spełni obietnice, dynamika platform właśnie przesunęła się dalej w kierunku Anthropic.

Dokument zniknął. Sygnał nie.