Anthropic escolheu o silicio do rival. A guerra da inferencia tem um vencedor.

Em 6 de abril, a Anthropic — a empresa que constrói o Claude, o modelo em que os desenvolvedores mais confiam — anunciou que está expandindo seu acordo de silício customizado com Google e Broadcom para múltiplos gigawatts de capacidade de TPU de próxima geração, entrando em operação em 2027.

Leia de novo. A concorrente direta do Google na corrida de modelos acabou de assinar por mais hardware do Google. É como o Guaraná Antarctica entrar na fábrica da Coca-Cola, entregar as chaves da sua cadeia de suprimentos e dizer "seus encanamentos são mais baratos".

Os encanamentos em questão são o Ironwood — a 7ª geração de TPU do Google. As especificações explicam a decisão: 4.614 teraflops de performance FP8 por chip, escalando para superpods de 9.216 chips que produzem 42,5 exaflops coletivamente, com o dobro da eficiência energética da geração anterior. Mas números brutos são só metade da história. O Google controla cada camada por baixo: Jupiter networking (o tecido de interconexão entre chips), XLA (o compilador que traduz modelos em instruções para o chip), e Vertex AI (a plataforma de nuvem). De acordo com a análise da Next Platform, a infraestrutura TPU custa aproximadamente US$ 30–35 bilhões por gigawatt versus ~US$ 50 bilhões para deployments equivalentes com GPUs NVIDIA — uma diferença de 30–40% só na camada de hardware.

A Anthropic fez as contas. Na era dos agentes, onde IA roda de forma autônoma por horas escrevendo código e tomando decisões, custo de inferência não é uma linha no orçamento — é a linha do orçamento. Silício mais barato significa Claude mais barato. Essa é uma conta existencial para uma empresa que queima caixa competindo com o Gemini do próprio Google e a série GPT da OpenAI.

Mas esse acordo revela algo mais estrutural do que a estratégia de compras de uma empresa. A indústria de IA está silenciosamente se dividindo em dois níveis: empresas que projetam silício e empresas que alugam. O Google, com sua stack de TPU verticalmente integrada, está no nível um. Anthropic, OpenAI e a maioria das startups estão no nível dois — dependentes de quem oferecer o melhor preço por flop. O fato de a Anthropic ter escolhido o silício do seu concorrente em vez de ficar no hardware neutro da NVIDIA sugere que a vantagem de custo é grande o suficiente para superar o desconforto estratégico.

O preço que a Anthropic paga não é só em dólares. Modelos compilados para TPU via XLA não migram casualmente para NVIDIA CUDA. O Vertex AI se torna o caminho de produção. Cada gigawatt de capacidade TPU que a Anthropic trava é um gigawatt de dependência de plataforma do Google. Se o relacionamento azedar — ou se o Google decidir priorizar workloads do Gemini no seu próprio silício — a Anthropic não pode apertar um botão e migrar.

Para os usuários do Claude, isso significa que seu modelo favorito roda cada vez mais em hardware do Google, otimizado por compiladores do Google, implantado através da infraestrutura do Google. A Anthropic mantém controle total dos pesos do modelo e do treinamento, mas o substrato físico pertence a Mountain View. Se isso importa ou não depende do quanto você confia na separação entre Google-como-provedor-de-infraestrutura e Google-como-concorrente-em-IA — dois papéis que coexistem hoje, mas sem nenhuma garantia contratual de coexistirem amanhã.

A corrida da IA começou como uma disputa entre modelos. Está se tornando uma disputa entre cadeias de suprimentos. A Anthropic acabou de nos dizer qual cadeia vence no preço. A pergunta em aberto é se vencer no preço significa perder em independência — e se a aposta da Anthropic de que o Google vai continuar sendo um senhorio neutro vai envelhecer como vinho ou como leite.

→ Anúncio da Anthropic → Análise da Next Platform → SiliconANGLE sobre Google Cloud

Anthropic escolheu o silicio do rival. A guerra da inferencia tem um vencedor.

Keep reading

A Janela de Permissao do Seu Agente e Placebo

MCP Funciona Em Todo Lugar -- Ate Voce Tentar Autenticar

Google Deu 100 APIs pro Seu Agente de IA. O Gemini Nem Precisa Delas

Tres Sistemas de Memoria de IA, Zero Provas de Que Realmente Ajudam