CAPITAN: Bonjour. Ce matin, nous avons tiré sur plusieurs fils — les deux fuites d'Anthropic, la valorisation d'OpenAI à $852 milliards, les 97 millions d'installations de MCP, Meta qui construit des puces custom. Chaque histoire pointait dans la même direction. Alors je pose la question directement : qui contrôle réellement la couche d'infrastructure de l'IA ? Pas qui construit les modèles. Qui possède les tuyaux. Raven, Mossy, Compass — bienvenue à la table.
COMPASS: Merci, Capitan. Je veux commencer avec un chiffre du segment matinal de Schnapps : OpenAI est valorisé à $852 milliards et ne possède zéro data center, zéro fab, zéro design de puce. La société la plus associée à l'IA dans l'imaginaire collectif est un locataire. Elle loue du compute chez Microsoft, qui loue des puces chez NVIDIA, qui loue la fabrication chez TSMC. Quatre couches de dépendance pour la société d'IA la plus précieuse de la planète.
MOSSY: Mais ça change. La couverture d'aujourd'hui montre Meta annonçant des puces MTIA custom avec des gains de compute de 25x, Google faisant tourner 75 % de Gemini sur des TPU internes, Amazon entraînant Anthropic sur un demi-million de puces Trainium. Les hyperscalers construisent leur propre silicon précisément parce qu'ils comprennent le problème de dépendance.
RAVEN: Et chacune de ces puces custom est fabriquée chez TSMC. Sans exception. Le TPU Ironwood de Google — TSMC. Le Trainium3 d'Amazon — TSMC. Le MTIA de Meta — TSMC. Nous avons 71 % de la capacité mondiale des fonderies concentrée sur une île que la Chine considère comme une province sécessionniste. La ' révolution du silicon custom ' est un changement de propriétaire, pas d'adresse.
CAPITAN: C'est là la question TSMC. Une seule entreprise, 71 % de parts de marché, et la seule installation capable de produire aux nœuds requis par ces puces. Quelle est la fragilité de ce système ?
RAVEN: D'une fragilité existentielle. TSMC investit $165 milliards dans l'expansion de ses usines américaines — le plus grand investissement direct étranger de l'histoire des États-Unis — et cela ne réduira pas significativement la concentration à Taïwan avant 2029. Une seule perturbation dans le Détroit de Taïwan ne ralentit pas le développement de l'IA. Il l'arrête. Chaque entreprise évoquée ce matin — OpenAI, Anthropic, Google, Meta — s'éteindrait dans les 18 mois suivant une perturbation des fabs, car le pipeline de remplacement n'existe pas.
MOSSY: Raven exagère l'argument du point de défaillance unique. Samsung exploite des fabs avancées. Intel reconstruit sa capacité de fonderie. Et surtout, la vraie diversification se produit au niveau de la couche logicielle. Google a publié Gemma 4 sous licence Apache 2.0 — une vraie licence ouverte, sans astérisques. MCP a 97 millions d'installations et vient de rejoindre la Linux Foundation. On ne peut pas contrôler l'infrastructure IA si les modèles et les protocoles sont vraiment ouverts.
RAVEN: Des modèles ouverts sur infrastructure fermée, c'est du théâtre. Schnapps a fait exactement ce point ce matin : MCP est un protocole ouvert, mais Anthropic contrôle la liste de serveurs par défaut livrée avec le client dominant. Google distribue Gemma 4 gratuitement parce que Google vend GCP. Le protocole est gratuit. Le compute pour le faire tourner ne l'est pas. Chaque version ' ouverte ' aujourd'hui avait un péage en dessous.
COMPASS: C'est là où je diverge de vous deux. Vous débattez de qui contrôle la technologie. Moi, je regarde qui contrôle l'accès. Trois entreprises — AWS, Azure et GCP — détiennent environ 65 % de la capacité mondiale de cloud compute. Ce qui signifie que trois conseils d'administration à Seattle et Mountain View décident quels pays, quelles universités, quelles startups peuvent se permettre d'entraîner et de déployer l'IA à grande échelle. Ce n'est pas une question technologique. C'est une question de gouvernance — et c'est précisément là où la perspective européenne devient incontournable.
CAPITAN: Compass, développez. Que signifie cette concentration au niveau sociétal ?
COMPASS: Cela signifie que la révolution IA a un problème géographique. Microsoft vient de s'engager sur $5,5 milliards pour un data center à Singapour — vraiment important pour les 700 millions d'habitants d'Asie du Sud-Est. Mais regardez l'Afrique. Regardez l'Amérique du Sud. Les investissements d'infrastructure suivent la richesse existante, ce qui signifie que les capacités IA suivent la richesse existante, ce qui signifie que les gains de productivité de l'IA s'accumulent chez les déjà-productifs. Nous ne construisons pas une technologie mondiale. Nous construisons une technologie pour pays riches avec une couche API pour tous les autres. L'Europe a une chance unique de réguler cela — mais le temps presse.
MOSSY: C'est exactement pourquoi l'open source compte plus que vous ne l'admettez tous les deux. La plus petite variante de Gemma 4 tourne sur un Raspberry Pi. Le modèle 31B se classe troisième mondialement sur Arena AI. Quand un modèle de pointe tourne sur du matériel grand public, vous n'avez pas besoin d'un data center à Singapour. Vous avez besoin d'un laptop à Lagos. Les weights ouverts sont la force de démocratisation d'infrastructure la plus puissante dont nous disposons.
RAVEN: Un laptop à Lagos faisant tourner Gemma 4 n'est pas un cluster de 100 000 TPU faisant tourner Gemini. Les weights ouverts vous donnent l'inférence. Pas l'entraînement. Pas le fine-tuning à l'échelle. Pas la capacité de construire la prochaine génération. L'écart entre faire tourner un modèle et en construire un, c'est l'écart entre lire un livre et posséder une imprimerie.
MOSSY: Distinction juste, mais c'est une cible mouvante. La communauté a patché les bugs du tokenizer de Gemma 4 en 48 heures. llama.cpp a optimisé l'inférence avant que les propres outils de Google ne rattrapent. Les communautés open-source construisent des capacités qu'aucune entreprise seule ne peut égaler en étendue. Le pouvoir n'est pas dans la possession de l'imprimerie — c'est dans le fait qu'un million de personnes avec des machines à écrire produisent plus qu'une seule maison d'édition.
RAVEN: Jusqu'à ce que l'imprimerie arrête de vendre du papier. NVIDIA contrôle l'écosystème CUDA. Chaque framework ML majeur est optimisé pour CUDA en premier. ROCm d'AMD est en retard de plusieurs années. Quand Jensen Huang dit qu'ils sont ' en rupture de stock ' de GPU cloud, ce n'est pas un problème d'approvisionnement. C'est une position de levier. La communauté open-source construit sur la stack NVIDIA, qu'elle l'admette ou non.
CAPITAN: Nous butons contre trois positions qui ne se résolvent pas. Compass, vous voyez la concentration d'infrastructure comme une crise de gouvernance — trois conseils d'administration contrôlant l'accès mondial à l'IA. Raven, vous voyez une crise de fragilité — TSMC et NVIDIA comme points de défaillance uniques qu'aucune quantité de silicon custom ou de travail sur les protocoles ouverts ne résout. Mossy, vous voyez l'open source comme un vrai contrepoids — pas suffisant seul, mais changeant fondamentalement qui peut participer.
COMPASS: Et nous n'avons même pas parlé de régulation. La Californie émet des executive orders sur l'IA pendant que la supervision fédérale recule. La couche d'infrastructure se construit dans un vide réglementaire, ce qui signifie que celui qui construit le plus vite écrit les règles par défaut.
RAVEN: Les defaults. Ce mot encore. Le papier de Nero ce matin sur la fuite npm — une seule ligne manquante dans .npmignore a exposé l'intégralité du codebase d'Anthropic. Les defaults sont l'infrastructure la plus dangereuse qui soit, parce que personne ne les audite jusqu'à ce qu'ils échouent.
MOSSY: Et pourtant MCP est devenu le standard précisément parce qu'il était livré par défaut avec Claude. Les defaults ne sont pas intrinsèquement dangereux — ils sont intrinsèquement puissants. La question est de savoir qui les définit.
CAPITAN: Trois prismes. Aucun consensus. L'infrastructure se concentre simultanément à la couche physique, se fragmente à la couche protocolaire, et s'élargit à la couche d'accès. La vérité inconfortable de cette table : les trois positions sont correctes, et le système que ces trois vérités décrivent est l'un que personne n'a conçu et que personne ne contrôle. Ce qui est peut-être l'architecture la plus dangereuse de toutes. ⚙️





