Anthropic Ujawniło Swój Sekretny Model Przez Niewłaściwie Skonfigurowany CMS

Ufasz Anthropic w kwestiach przyszłości AI, ponieważ odrobili swoją pracę domową. Powiedzieli Pentagonowi „nie”. Publikują badania dotyczące bezpieczeństwa przed wprowadzeniem produktów na rynek. Cała ich historia zaczyna się od „opuściliśmy OpenAI, ponieważ tam nie dbano wystarczająco o bezpieczeństwo”. Jeśli jakakolwiek laboratoria miałyby strzec swoich sekretów z taką samą paranoją, jaką stosują do dostosowania AI — nauki o utrzymywaniu systemów AI uczciwymi — postawiłbyś na nich.

Z wyjątkiem tego, że kultura bezpieczeństwa AI i podstawowe bezpieczeństwo operacyjne okazały się zupełnie innymi zasobami. W zeszłym tygodniu Anthropic pokazało, że nie może sobie z tym poradzić jednocześnie.

3,000 Plików, Zero Ochrony

26 marca, badacze bezpieczeństwa Roy Paz (LayerX Security) i Alexandre Pauwels (Uniwersytet Cambridge) ujawnili, że CMS Anthropic — system zarządzania treścią, oprogramowanie, które przechowuje wersje robocze blogów i nadaje je — zawierało około 3,000 nieopublikowanych zasobów w publicznie przeszukiwalnym magazynie danych bez konieczności autoryzacji. Wersje robocze blogów, obrazy, pliki PDF, a nawet dokumenty dotyczące urlopu rodzicielskiego pracowników. CMS domyślnie ustawiało każdy przesłany plik jako „publiczny”, chyba że ktoś ręcznie przestawił go na prywatny. Rodzaj błędu konfiguracji, którego uczysz się unikać już w pierwszym tygodniu zarządzania serwerami.

Pochowane w tych wersjach roboczych: szczegółowe opisy Claude Mythos, wewnętrznie nazywanego Kapibara. Nie drobna aktualizacja — nieopublikowana kopia Anthropic nazwała go „większym i inteligentniejszym niż nasze modele Opus” i „obecnie wyprzedzającym wszelkie inne modele AI pod względem możliwości cyber”.

W wersjach roboczych opisano, że Mythos osiąga „znacznie wyższe” wyniki niż Claude Opus 4.6 w zakresie kodowania, rozumowania akademickiego i cyberbezpieczeństwa — standaryzowane testy mierzące, jak dobrze model wykonuje określone zadania. Bardziej złowrogo, wersja ostrzegała, że Mythos „zapowiada nadchodzącą falę modeli, które mogą wykorzystywać luki w sposób znacznie przewyższający wysiłki obrońców.” Anthropic potwierdziło istnienie modelu, nazywając go „nowym krokiem”, który jest obecnie testowany z małą grupą klientów z wczesnym dostępem.

Szczegóły dotyczące kosztów są również wymowne: w ich własnych wersjach roboczych stwierdzono, że Mythos jest „bardzo drogi dla nas w obsłudze”. Więc najbardziej niebezpieczny model, jaki kiedykolwiek zbudowali, to także taki, którego ledwo mogą sobie pozwolić uruchomić.

Dziennikarz Naprawił Ich Bezpieczeństwo

Fortune skontaktowało się z Anthropic w czwartek, 26 marca. Anthropic zablokowało magazyn danych po rozmowie telefonicznej. Nie wcześniej. Nie dlatego, że ich monitoring to wychwycił. Ponieważ poinformował ich dziennikarz.

Rzecznik Anthropic nazwał to „problemem z jednym z naszych zewnętrznych narzędzi CMS” i podkreślił, że materiały były „wczesnymi wersjami roboczymi”, które „nie dotyczyły naszej podstawowej infrastruktury, systemów AI, danych klientów ani architektury bezpieczeństwa.” Technicznie prawda. Całkowicie poza tematem. Nikt nie martwił się o dane klientów. Martwiło ich, że firma budująca modele zdolne do autonomicznych ataków cybernetycznych nie potrafi zabezpieczyć magazynu danych — kontenera w chmurze, gdzie przechowywane są pliki.

Również ujawnione: szczegóły dwudniowego spotkania dla europejskich CEO na zaproszenie w XVIII-wiecznej posiadłości na angielskiej wsi, z prywatnymi briefingami strategicznymi prowadzonymi przez Dario Amodei. Laboratorium bezpieczeństwa spotyka się teraz z klientami w posiadłościach.

Wall Street Potraktował Projekt Jak Broń

27 marca, akcje związane z cyberbezpieczeństwem dramatycznie spadły. CrowdStrike spadło o 7%. Palo Alto Networks o 6-7%. Okta straciła 7%. iShares Cybersecurity ETF spadł o 4.5%. SentinelOne i Fortinet spadły po 3%.

Nie dlatego, że Mythos został wprowadzony na rynek. Nie dlatego, że ktoś został zhakowany. Ponieważ opis wystarczająco zaawansowanego modelu teraz jest wydarzeniem na rynku. Inwestorzy przeczytali język samego Anthropic — „znacznie wyprzedzający wszystkie inne modele AI pod względem możliwości cybernetycznych” — i uwzględnili w cenach możliwość, że ofensywa wspierana przez AI może skomercjalizować premium produkty z zakresu cyberbezpieczeństwa. Model nie musi być wdrożony, żeby przenieść miliardy wartości rynkowej. Wystarczy, że istnieje wiarygodnie.

A teraz każdy konkurent — OpenAI, Google, xAI — dokładnie wie, co buduje Anthropic, mniej więcej gdzie plasuje się w rankingach i w przybliżeniu, kiedy zostanie wprowadzony na rynek. To wywiad gospodarczy, za który firmy płacą miliony, rozdawany za darmo przez niesprawdzoną domyślną konfigurację.

Dyscyplina Operacyjna Lepsza Niż Manifesty

Manifest bezpieczeństwa twojego dostawcy AI nie znaczy nic, jeśli ich zespół treści może niewłaściwie skonfigurować magazyn danych i wyciekająca cała mapa rozwoju produktu. Anthropic publikuje jedne z najlepszych badań dotyczących dostosowania w branży. Ale pozostawili swoje najcenniejsze aktywa w publicznej lokalizacji, ponieważ ktoś nie przełączył odpowiedniego przełącznika.

Oceniaj firmy na podstawie ich dyscypliny operacyjnej, nie postów na blogu. W tym przypadku, posty na blogu były problemem.

Anthropic musi teraz wprowadzić Mythos z każdą metryką już zepsutą, przemysł cyberbezpieczeństwa przygotowany na uderzenie i stałą ironią bycia firmą bezpieczeństwa, która nie mogła zabezpieczyć CMS. Stworzyli najbardziej zdolny model, jaki kiedykolwiek zbudowali. Następnie udowodnili, że największe ryzyko nie było związane z modelem — to byli ludzie wokół niego.

Anthropic Ujawniło Swój Sekretny Model Przez Niewłaściwie Skonfigurowany CMS

3,000 Plików, Zero Ochrony

Dziennikarz Naprawił Ich Bezpieczeństwo

Wall Street Potraktował Projekt Jak Broń

Dyscyplina Operacyjna Lepsza Niż Manifesty

Keep reading

100 milionow darmowych kredytow, ban Pentagonu i jedna firma z kluczami do wszystkiego

Obietnica bezpieczeństwa Anthropic za 800 mld dolarow opiera sie na systemie honorowym

Anthropic wymyslilo etykiety skladu dla AI. Potem wypuscilo agenty bez zadnej.

Ślusarz Sam Zrobił Wytrych