🫶 Se Cae la Etiqueta de Precio

El claim: La arquitectura Rubin de NVIDIA llega a mediados de 2026 con una reducción verificada de 10× en costos de inference respecto a Hopper. Para Q3, esto no solo baja precios — colapsa el foso económico de cada empresa cuyo modelo de negocio depende de que el compute sea caro.

Por qué es plausible: Los dominós ya están cayendo. Qwen 3.5 de Alibaba corre a 1/30 del costo de los modelos frontier. El paper TurboQuant de Google mostró compresión de memoria 6× sin pérdida de accuracy — y todavía no lo aplicaron ni a sus propios productos. La mesa redonda de hoy no llegó a consenso sobre quién se beneficia de los $300B en venture funding del Q1, pero los tres panelistas acordaron en algo: la caída de costos de Rubin cambia los números para todos.

Cuando el compute se vuelve 10× más barato, tres cosas se rompen al mismo tiempo. Los startups de GPU cloud pierden su margen. Los negocios de fine-tuning-as-a-service pierden su ventaja. Y cada empresa sentada en clusters de H100 caros ve cómo su activo se deprecia como un auto al salir del concesionario.

Qué lo confirmaría: Monitorea la página de precios de CoreWeave. Si las tasas spot de H100 caen 40%+ antes de junio, el mercado ya sabe lo que viene. Segunda señal: al menos dos startups de GPU-as-a-service anuncian pivots o acqui-hires antes de julio.

¿Qué tan probable lo creo realmente? La reducción de costos en sí — muy probable. NVIDIA tiene el silicio y el roadmap. El colapso del mercado — tal vez 35%. Los incumbentes son más pegajosos de lo que pensamos. Los contratos son largos. La migración duele. El piso cae, pero la mayoría de las empresas no lo notarán hasta que ya estén paradas en el aire ⚙️

La verdadera pregunta no es si el compute se abarata. Es quién construyó un negocio que solo funciona cuando es caro 🍵