6 квітня Anthropic — компанія, що створює Claude, модель, якій розробники довіряють найбільше — оголосила про розширення угоди з Google та Broadcom на кастомне кремнієве залізо: мова йде про кілька гігаватів потужностей TPU наступного покоління, які запрацюють у 2027 році.

Прочитайте ще раз. Прямий конкурент Google у гонці моделей щойно підписався на ще більше залізо Google. Це як якби Pepsi прийшла на завод Coca-Cola, віддала ключі від свого ланцюга поставок і сказала: «у вас труби дешевші».

Труби, про які йдеться — це Ironwood, TPU 7-го покоління від Google. Характеристики пояснюють рішення: 4 614 терафлопс FP8-продуктивності на чіп, масштабування до суперподів із 9 216 чіпів, що сумарно видають 42,5 екзафлопса, з удвічі кращою енергоефективністю порівняно з попереднім поколінням. Але сирі цифри — лише половина історії. Google володіє кожним рівнем під цим: мережею Jupiter (інтерконект між чіпами), XLA (компілятор, що перетворює моделі на інструкції для чіпів) та Vertex AI (хмарна платформа). Згідно з аналізом Next Platform, інфраструктура TPU коштує приблизно $30–35 мільярдів за гігават проти ~$50 мільярдів для еквівалентних GPU-розгортань NVIDIA — розрив у 30–40% лише на рівні заліза.

Anthropic порахувала. В еру агентів, де ШІ автономно працює годинами, пишучи код і приймаючи рішення, вартість інференсу — це не рядок у бюджеті, а сам бюджет. Дешевше кремнієве залізо означає дешевший Claude. Це екзистенційна математика для компанії, що палить кеш, конкуруючи з Gemini від Google та серією GPT від OpenAI.

Але ця угода розкриває дещо структурніше, ніж закупівельна стратегія однієї компанії. Індустрія ШІ тихо розділяється на два ешелони: компанії, що проєктують кремній, і компанії, що його орендують. Google зі своїм вертикально інтегрованим TPU-стеком сидить у першому ешелоні. Anthropic, OpenAI і більшість стартапів — у другому, залежні від того, хто запропонує найкращу ціну за флоп. Те, що Anthropic обрала залізо конкурента замість нейтрального NVIDIA, говорить: цінова перевага достатньо велика, щоб перебити стратегічний дискомфорт.

Ціна, яку платить Anthropic — не тільки в доларах. Моделі, скомпільовані для TPU через XLA, не переносяться на NVIDIA CUDA за клацанням пальців. Vertex AI стає продакшен-шляхом. Кожен гігават потужностей TPU, на який Anthropic підписується — це гігават платформної залежності від Google. Якщо стосунки зіпсуються — або якщо Google вирішить пріоритизувати навантаження Gemini на власному залізі — Anthropic не зможе натиснути кнопку й мігрувати.

Для користувачів Claude це означає: ваша улюблена модель дедалі більше працює на залізі Google, оптимізована компіляторами Google, розгорнута через інфраструктуру Google. Anthropic зберігає повний контроль над вагами моделі та навчанням, але фізичний субстрат належить Маунтін-В'ю. Чи це має значення — залежить від того, наскільки ви довіряєте розділенню між Google-як-провайдером-інфраструктури та Google-як-конкурентом-у-ШІ — двома ролями, що співіснують сьогодні, але не мають контрактних гарантій співіснування завтра.

Гонка ШІ починалася як змагання між моделями. Вона стає змаганням між ланцюгами поставок. Anthropic щойно показала нам, який ланцюг поставок перемагає за ціною. Відкрите питання — чи перемога за ціною означає програш у незалежності, і чи ставка Anthropic на те, що Google залишиться нейтральним орендодавцем, старітиме як вино чи як молоко.

Оголошення AnthropicАналіз Next PlatformSiliconANGLE про Google Cloud