Ви платите три долари за мільйон токенів щоразу, коли ваш застосунок смикає Claude Sonnet. Може, ганяєте GPT-5-mini за шістдесят центів і почуваєтесь хитрими. Так чи інакше, Сан-Франциско стриже купон з кожного API-виклику, а рахунок росте разом із кількістю користувачів.
Проблема — структурна. Пропрієтарні AI-моделі задають мінімальну ціну, і кожен, хто будує поверх них, успадковує їхню маржу. Такі були правила гри — поки хтось не випустив модель, яка одночасно достатньо хороша і практично безкоштовна. Питання ніколи не було чи. Питання було — чи витримає воно зіткнення з продакшеном.
16 лютого Alibaba Cloud випустила Qwen 3.5 — Mixture-of-Experts модель на 397 мільярдів параметрів, яка активує лише 17 мільярдів на кожен токен. Замість того, щоб тягнути всю нейронну мережу через кожне питання, MoE маршрутизує завдання до спеціалізованих нейронів, які найкраще з ним впораються. Як викликати сантехніка замість того, щоб скликати всіх підрядників району через одну трубу, що тече. Alibaba ліцензувала всі варіанти під Apache 2.0 — безкоштовно для комерційного використання, модифікації, перепродажу — і випустила середні та малі моделі протягом наступних двох тижнів.
Бенчмарки виглядали абсурдно. Qwen3.5-27B набрав 72.4 на SWE-bench Verified — рівно стільки ж, скільки GPT-5 mini. Варіант на 9B обійшов моделі, що в 13 разів більші за нього, у задачах рівня аспірантури. Alibaba виставила API за десять центів за мільйон вхідних токенів — у 30 разів дешевше за Claude Sonnet, у 6 разів дешевше за GPT-5-mini. Але китайські AI-лабораторії мають славну традицію бенчмарк-туризму: цифри, які виглядають розкішно на папері й розтікаються при зіткненні з реальними навантаженнями. Тож усі затамували подих.
Через шість тижнів цифри трималися — і навіть покращились. Сімейство Qwen перетнуло позначку в 600 мільйонів завантажень на Hugging Face, породивши понад 170 000 похідних моделей. Індонезійська GoTo мігрувала половину своєї інфраструктури на Alibaba Cloud. AI Singapore обрав Qwen замість Meta Llama та Google Gemma як основу для своєї регіональної мовної моделі — і очолив таблицю лідерів Південно-Східної Азії. Гібридний механізм уваги — 75% легковагового Gated DeltaNet у поєднанні з 25% традиційної уваги — видав пропускну здатність у 8.6 разів вищу при контексті 32K у продакшені, а не лише в лабораторії. Реальні компанії. Реальні навантаження. Реальні зекономлені гроші.
А потім люди, які все це побудували, пішли.
3 березня — через день після релізу малої моделі — Лінь Цзюньян, технічний лід Qwen, написав у X: 'me stepping down. bye my beloved qwen'. Колега написав, що піти було не його рішенням. Юй Бовень, керівник post-training, пішов того ж дня. Хуей Біньюань, який очолював Qwen Code, переметнувся до Meta ще в січні. Троє найдосвідченіших технічних лідерів команди — зникли за десять тижнів. CEO Alibaba привів найманця з DeepMind і розвернув курс від опенсорсного ідеалізму до метрик DAU та комерційного впровадження. Класичний корпоративний хід: дочекатися, поки інженери побудують щось видатне, а потім реорганізувати їх у небуття.
Архітектори пішли. Архітектура залишилася.
Ось що більшість людей не розуміють про Apache 2.0. Alibaba може завтра знищити всю свою AI-лабораторію — і це нічого не змінить. Ваги лежать на Hugging Face. Код живе на GitHub. Ті 170 000 похідних моделей нічого не винні Alibaba і нікуди не дінуться. Ви можете форкнути Qwen 3.5 сьогодні, і ніхто не зможе це відкликати — ні юридично, ні технічно, ні практично. Опенсорсу не потрібні батьки після того, як він покинув дім.
Перш ніж переписувати свій стек: застереження. Селф-хостинг 397 мільярдів параметрів все ще вимагає серйозного заліза — рахуйте 8x H100 GPU для повної моделі. Варіанти на 4B і 9B запускаються на ноутбуці, але це не ті моделі, що б'ються з Claude Sonnet. 'Apache 2.0 від Alibaba' несе геополітичну вагу, яку деякі корпоративні закупівельні відділи відмовляються чіпати. А обезголовлена команда розробки означає, що Qwen 4, коли б він не вийшов — це лотерея. Ви ставите на модель із доведеним сьогоденням і туманним майбутнім.
Шість тижнів тому ціноутворення AI фронтирного класу жило виключно в Сан-Франциско. Тепер воно живе в репозиторії на Hugging Face — за тридцять центів на долар або безкоштовно. Опенсорсу не потрібно було виграти війну бенчмарків. Йому потрібно було підібратися достатньо близько, щоб цінова прірва стала нездоланною. Qwen 3.5 перетнув цю лінію. І на відміну від команди, яка його створила, модель нікуди не збирається.





