Anthropic eligio el silicio de su rival. La guerra de inferencia tiene un ganador.

El 6 de abril, Anthropic — la empresa que construye Claude, el modelo en el que más confían los desarrolladores — anunció que está expandiendo su acuerdo de silicio personalizado con Google y Broadcom a múltiples gigawatts de capacidad TPU de próxima generación, que entrará en operación en 2027.

Leé eso otra vez. El competidor directo de Google en la carrera de modelos acaba de firmar por más hardware de Google. Es como si Pepsi entrara a la planta embotelladora de Coca-Cola, le entregara las llaves de su cadena de suministro y dijera "tus tuberías son más baratas".

Las tuberías en cuestión son Ironwood — la 7ª generación de TPU de Google. Los specs explican la decisión: 4,614 teraflops de rendimiento FP8 por chip, escalando a superpods de 9,216 chips que producen 42.5 exaflops colectivamente, con el doble de eficiencia energética respecto a la generación anterior. Pero los números crudos son solo la mitad de la historia. Google es dueño de cada capa por debajo: Jupiter networking (la interconexión entre chips), XLA (el compilador que traduce modelos a instrucciones del chip) y Vertex AI (la plataforma cloud). Según el análisis de Next Platform, la infraestructura TPU cuesta aproximadamente $30–35 mil millones por gigawatt versus ~$50 mil millones para despliegues equivalentes con GPUs de NVIDIA — una brecha de costos del 30–40% solo en la capa de hardware.

Anthropic hizo las cuentas. En la era de los agentes, donde la IA corre de forma autónoma por horas escribiendo código y tomando decisiones, el costo de inferencia no es una línea en el presupuesto — es la línea del presupuesto. Silicio más barato significa un Claude más barato. Eso es matemática existencial para una empresa quemando efectivo para competir contra el propio Gemini de Google y la serie GPT de OpenAI.

Pero este acuerdo revela algo más estructural que la estrategia de compras de una sola empresa. La industria de IA se está dividiendo silenciosamente en dos niveles: empresas que diseñan silicio y empresas que lo alquilan. Google, con su stack TPU verticalmente integrado, se sienta en el nivel uno. Anthropic, OpenAI y la mayoría de las startups se sientan en el nivel dos — dependientes de quien ofrezca el mejor precio por flop. El hecho de que Anthropic eligiera el silicio de su competidor en vez de quedarse con hardware neutral de NVIDIA sugiere que la ventaja de costos es lo suficientemente grande como para superar la incomodidad estratégica.

El precio que paga Anthropic no es solo en dólares. Los modelos compilados para TPU a través de XLA no se portan casualmente a NVIDIA CUDA. Vertex AI se convierte en la ruta de producción. Cada gigawatt de capacidad TPU que Anthropic asegura es un gigawatt de dependencia de plataforma con Google. Si la relación se deteriora — o si Google decide priorizar las cargas de trabajo de Gemini en su propio silicio — Anthropic no puede apretar un botón y migrar.

Para los usuarios de Claude, esto significa que tu modelo favorito cada vez más corre sobre hardware de Google, optimizado por compiladores de Google, desplegado a través de infraestructura de Google. Anthropic mantiene control total de los pesos del modelo y el entrenamiento, pero el sustrato físico pertenece a Mountain View. Si eso importa o no depende de cuánto confíes en la separación entre Google-como-proveedor-de-infraestructura y Google-como-competidor-de-IA — dos roles que coexisten hoy pero que no tienen garantía contractual de coexistir mañana.

La carrera de la IA empezó como una competencia entre modelos. Se está convirtiendo en una competencia entre cadenas de suministro. Anthropic acaba de decirnos qué cadena de suministro gana en precio. La pregunta abierta es si ganar en precio significa perder en independencia — y si la apuesta de Anthropic de que Google seguirá siendo un casero neutral envejece como el vino o como la leche.

→ Anuncio de Anthropic → Análisis de Next Platform → SiliconANGLE sobre Google Cloud

Anthropic eligio el silicio de su rival. La guerra de inferencia tiene un ganador.

Keep reading

El dialogo de permisos de tu agente es un placebo

MCP funciona en todos lados — hasta que intentas autenticarte

Google le Dio 100 APIs a Tu Agente de IA. Gemini No las Necesita

Tres sistemas de memoria para IA, cero pruebas de que realmente sirvan