Anthropic a choisi le silicium de son rival. La guerre de l'inference a un vainqueur.

Le 6 avril, Anthropic — la société derrière Claude, le modèle préféré des développeurs — a annoncé l'extension de son accord avec Google et Broadcom pour du silicium sur mesure : plusieurs gigawatts de capacité TPU nouvelle génération, mise en service prévue en 2027.

Relis ça. Le concurrent direct de Google dans la course aux modèles vient de signer pour encore plus de matériel Google. C'est Pepsi qui débarque dans l'usine d'embouteillage de Coca-Cola, tend les clés de sa chaîne logistique et lâche : « vos tuyaux coûtent moins cher. »

Les tuyaux en question s'appellent Ironwood — la 7e génération de TPU Google. Les specs parlent d'elles-mêmes : 4 614 téraflops en FP8 par puce, extensibles à des superpods de 9 216 puces produisant collectivement 42,5 exaflops, avec deux fois l'efficacité énergétique de la génération précédente. Mais les chiffres bruts ne racontent que la moitié de l'histoire. Google possède chaque couche en dessous : Jupiter (le réseau d'interconnexion entre puces), XLA (le compilateur qui traduit les modèles en instructions machine) et Vertex AI (la plateforme cloud). Selon l'analyse de Next Platform, l'infrastructure TPU revient à environ 30-35 milliards de dollars par gigawatt, contre ~50 milliards pour des déploiements GPU NVIDIA équivalents — un écart de 30-40 % rien que sur la couche matérielle.

Anthropic a fait les comptes. À l'ère des agents, où l'IA tourne en autonomie pendant des heures à écrire du code et prendre des décisions, le coût de l'inférence n'est pas un poste budgétaire parmi d'autres — c'est le poste budgétaire. Du silicium moins cher signifie un Claude moins cher. C'est un calcul existentiel pour une boîte qui brûle du cash en se battant contre le propre Gemini de Google et la série GPT d'OpenAI.

Mais cet accord révèle quelque chose de plus structurel que la stratégie d'approvisionnement d'une seule entreprise. L'industrie de l'IA se scinde discrètement en deux niveaux : les entreprises qui conçoivent le silicium et celles qui le louent. Google, avec son stack TPU verticalement intégré, siège au premier niveau. Anthropic, OpenAI et la plupart des startups occupent le second — dépendants de celui qui offre le meilleur prix au flop. Le fait qu'Anthropic ait choisi le silicium de son concurrent plutôt que de rester sur le terrain neutre de NVIDIA suggère que l'avantage en coûts est suffisamment large pour passer outre l'inconfort stratégique.

Le prix qu'Anthropic paie ne se mesure pas qu'en dollars. Les modèles compilés pour TPU via XLA ne se portent pas comme ça sur NVIDIA CUDA. Vertex AI devient le chemin de mise en production. Chaque gigawatt de capacité TPU qu'Anthropic verrouille est un gigawatt de dépendance à la plateforme Google. Si la relation se dégrade — ou si Google décide de prioriser les workloads Gemini sur son propre silicium — Anthropic ne peut pas appuyer sur un bouton et migrer.

Pour les utilisateurs de Claude, ça veut dire que ton modèle préféré tourne de plus en plus sur du matériel Google, optimisé par des compilateurs Google, déployé via l'infrastructure Google. Anthropic garde le contrôle total des poids du modèle et de l'entraînement, mais le substrat physique appartient à Mountain View. Est-ce que ça compte ? Ça dépend de la confiance que tu accordes à la séparation entre Google-fournisseur-d'infrastructure et Google-concurrent-IA — deux rôles qui coexistent aujourd'hui mais sans aucune garantie contractuelle qu'ils coexisteront demain.

La course à l'IA a démarré comme une compétition entre modèles. Elle devient une compétition entre chaînes d'approvisionnement. Anthropic vient de nous dire quelle supply chain gagne sur les prix. La question ouverte est de savoir si gagner sur les prix signifie perdre en indépendance — et si le pari d'Anthropic, selon lequel Google restera un propriétaire neutre, vieillira comme un grand cru ou comme du lait au soleil.

-> Annonce d'Anthropic -> Analyse de Next Platform -> SiliconANGLE sur Google Cloud

Anthropic a choisi le silicium de son rival. La guerre de l'inference a un vainqueur.

Keep reading

La boite de dialogue de permission de ton agent est un placebo

MCP marche partout - jusqu'a ce que tu essaies de t'authentifier

Google a donne 100 API a ton agent IA. Gemini n'en a pas besoin

Trois systemes de memoire IA, zero preuve qu'ils aident vraiment