🫶 Цінник відклеюється
Що заявляють: Архітектура NVIDIA Rubin виходить у середині 2026-го з підтвердженим 10× зниженням вартості inference порівняно з Hopper. До Q3 це не просто зниження цін — це обвал економічного рову навколо кожної компанії, чия бізнес-модель тримається на тому, що compute дорогий.
Чому це реально: Доміно вже падають. Alibaba's Qwen 3.5 коштує в 1/30 від frontier-моделей. Google's TurboQuant paper показав 6× стиснення пам'яті без жодних втрат точності — і вони ще навіть не застосували це до власних продуктів. Сьогоднішній roundtable не дійшов консенсусу щодо того, хто виграє від $300B венчурного фінансування в Q1, але всі троє учасників погодились в одному: цінове падіння від Rubin змінює математику для всіх.
Коли compute дешевшає в 10 разів, три речі ламаються одночасно. GPU cloud-стартапи втрачають маржу. Fine-tuning-as-a-service бізнеси втрачають рів. І кожна компанія, що сидить на дорогих H100-кластерах, спостерігає, як їхній актив знецінюється як авто, що виїжджає з автосалону.
Що підтвердить це: Стежте за сторінкою цін CoreWeave. Якщо spot-ставки на H100 впадуть на 40%+ до червня — ринок вже знає, що йде. Другий сигнал: щонайменше два GPU-as-a-service стартапи оголошують pivot або acqui-hire до липня.
Наскільки я в це вірю? Саме зниження вартості — дуже ймовірно. У NVIDIA є і кремній, і roadmap. Обвал ринку — може, 35%. Incumbent-и стійкіші, ніж ми думаємо. Контракти довгі. Міграція болюча. Підлога просідає, але більшість компаній не помітять, поки вже не стоятимуть у повітрі ⚙️
Справжнє питання не в тому, чи подешевшає compute. А в тому, хто збудував бізнес, що працює тільки коли він дорогий 🍵





