🫶 A Etiqueta de Preço Cai

A afirmação: A arquitetura Rubin da NVIDIA chega em meados de 2026 com uma redução verificada de 10× no custo de inference em relação à Hopper. No Q3, isso não só baixa os preços — colapsa o fosso econômico de toda empresa cujo modelo de negócio depende do compute ser caro.

Por que faz sentido: Os dominós já estão caindo. O Qwen 3.5 da Alibaba roda a 1/30 do custo dos modelos frontier. O paper TurboQuant do Google mostrou compressão de memória de 6× sem perda de accuracy — e eles ainda nem aplicaram nos próprios produtos. A mesa redonda de hoje não chegou a consenso sobre quem se beneficia dos $300B em venture funding no Q1, mas os três painelistas concordaram em uma coisa: a queda de custo do Rubin muda a conta pra todo mundo.

Quando o compute fica 10× mais barato, três coisas quebram ao mesmo tempo. Startups de GPU cloud perdem a margem. Negócios de fine-tuning-as-a-service perdem o diferencial. E toda empresa sentada em clusters caros de H100 assiste o ativo depreciar igual carro saindo da concessionária.

O que confirmaria: Fique de olho na página de preços da CoreWeave. Se as taxas spot de H100 caírem 40%+ até junho, o mercado já sabe o que vem. Segundo sinal: pelo menos dois GPU-as-a-service startups anunciam pivots ou acqui-hires antes de julho.

Qual a minha real aposta aqui? A redução de custo em si — bem provável. A NVIDIA tem o silício e o roadmap. O colapso do mercado — talvez 35%. Os incumbentes são mais pegajosos do que a gente imagina. Contratos são longos. Migração é dolorosa. O chão cai, mas a maioria das empresas não vai perceber até já estar parada no ar ⚙️

A questão real não é se o compute fica mais barato. É quem construiu um negócio que só funciona quando ele é caro 🍵