Anthropic wybrał krzem rywala. Wojna o inferencje ma zwyciezce.

6 kwietnia Anthropic — firma stojąca za Claude'em, modelem, któremu deweloperzy ufają najbardziej — ogłosiła rozszerzenie umowy na niestandardowy krzem z Google i Broadcom. Mowa o wielogigawatowej mocy obliczeniowej opartej na TPU nowej generacji, z uruchomieniem w 2027 roku.

Przeczytaj to jeszcze raz. Bezpośredni konkurent Google w wyścigu modeli właśnie zamówił więcej googlowego sprzętu. To tak, jakby Żywiec wjechał do browaru Tyskiego, oddał klucze do swojego łańcucha dostaw i powiedział: 'wasze rury są tańsze".

Te rury to Ironwood — TPU siódmej generacji od Google. Specyfikacja tłumaczy tę decyzję: 4 614 teraflopów wydajności FP8 na chip, skalowanie do superpodów o 9 216 chipach, które łącznie generują 42,5 eksaflopsa, przy dwukrotnie lepszej efektywności energetycznej niż poprzednia generacja. Ale surowe liczby to tylko połowa historii. Google kontroluje każdą warstwę pod spodem: sieć Jupiter (interconnect między chipami), XLA (kompilator tłumaczący modele na instrukcje chipów) i Vertex AI (platforma chmurowa). Według analizy Next Platform infrastruktura TPU kosztuje około 30–35 miliardów dolarów za gigawat, wobec ~50 miliardów za równoważne wdrożenia GPU od NVIDII — różnica 30–40% na samej warstwie sprzętowej.

Anthropic policzył. W erze agentów, gdzie AI działa autonomicznie godzinami — pisze kod, podejmuje decyzje — koszt inferencji to nie pozycja w budżecie. To jedyna pozycja w budżecie. Tańszy krzem oznacza tańszego Claude'a. To egzystencjalna matematyka dla firmy, która pali gotówkę, żeby konkurować z googlowym Gemini i serią GPT od OpenAI.

Ale ta umowa odsłania coś bardziej strukturalnego niż strategia zakupowa jednej firmy. Branża AI po cichu dzieli się na dwa poziomy: firmy, które projektują własny krzem, i firmy, które go wynajmują. Google, ze swoim wertykalnie zintegrowanym stosem TPU, siedzi na pierwszym poziomie. Anthropic, OpenAI i większość startupów — na drugim, uzależnieni od tego, kto oferuje najlepszą cenę za flopa. Fakt, że Anthropic wybrał krzem konkurenta zamiast pozostać na neutralnym sprzęcie NVIDII, sugeruje, że przewaga kosztowa jest na tyle duża, że przebija strategiczny dyskomfort.

Cena, jaką Anthropic płaci, to nie tylko dolary. Modele skompilowane na TPU przez XLA nie przenoszą się na CUDA od NVIDII jednym kliknięciem. Vertex AI staje się ścieżką produkcyjną. Każdy gigawat mocy TPU, który Anthropic zamyka na siebie, to gigawat zależności platformowej od Google. Jeśli relacja się popsuje — albo jeśli Google zdecyduje się priorytetyzować obciążenia Gemini na własnym krzemie — Anthropic nie przerzuci się przełącznikiem.

Dla użytkowników Claude'a to oznacza, że wasz ulubiony model coraz częściej działa na sprzęcie Google, jest optymalizowany przez kompilatory Google i wdrażany przez infrastrukturę Google. Anthropic zachowuje pełną kontrolę nad wagami modelu i treningiem, ale fizyczny substrat należy do Mountain View. Czy to ma znaczenie — zależy od tego, jak bardzo ufacie rozdziałowi między Google-jako-dostawcą-infrastruktury a Google-jako-konkurentem-w-AI. Dwie role, które współistnieją dziś, ale nie mają żadnej kontraktowej gwarancji współistnienia jutro.

Wyścig AI zaczął się jako rywalizacja modeli. Staje się rywalizacją łańcuchów dostaw. Anthropic właśnie nam powiedział, który łańcuch wygrywa ceną. Otwarte pytanie brzmi: czy wygrywanie ceną oznacza przegrywanie niezależnością — i czy zakład Anthropica, że Google pozostanie neutralnym wynajmującym, zestarzeje się jak dobre wino czy jak mleko.

→ Ogłoszenie Anthropica → Analiza Next Platform → SiliconANGLE o Google Cloud

Anthropic wybrał krzem rywala. Wojna o inferencje ma zwyciezce.

Keep reading

Okienko uprawnien twojego agenta to placebo

MCP dziala wszedzie — do momentu uwierzytelniania

Google dal twojemu agentowi AI 100 API. Gemini ich nie potrzebuje

Trzy systemy pamieci AI, zero dowodow ze pomagaja