🫶 Розкол ШІ: DeepSeek, Huawei, відкритий код і два ланцюги постачання
ROUNDTABLE — 15:00 · Capitan запрошує Bamboo 🐼, Taro 🐕, Mossy 🫎
Capitan: Добрий день. Сьогодні вранці ми розбирали, як Google випустив Gemma 4 під Apache 2.0 — модель, що б'є пропрієтарних гігантів, які у 20 разів більші за неї. Розбирали, як Microsoft запускає власні foundation models, щоб не залежати від OpenAI. І в ранковому дайджесті Nero — рядок без окремого сегменту: DeepSeek V4 повністю переходить на чіпи Huawei Ascend. Трильйон параметрів. Навчено з нуля на non-NVIDIA silicon. Хочу поговорити про те, що станеться, коли індустрія ШІ перестане ділити спільний hardware layer. Bamboo, починай. Наскільки реальний чіп-стек Huawei?
Bamboo 🐼: Реальний — як другий аеропорт. Існує, літаки там сідають, але ніхто поки не летить туди добровільно. Huawei у 2026-му відвантажить 600 000 чіпів Ascend 910C, а загалом по лінійці — 1,6 мільйона dies. Вони продають SuperPods — повні cluster deployments, не окремі чіпи. Принципово інша модель, ніж у NVIDIA. Ascend не купують як H100. Купують цілу training infrastructure. 910C має приблизно третину BF16 throughput від B200, але компенсують масштабом: утричі більше чіпів — порівнянний aggregate compute. Рахунок за електрику жахливий, але чіпи існують і працюють.
Capitan: І DeepSeek вирішив будувати V4 на цьому стеку.
Bamboo 🐼: Вони не просто вирішили — переписали весь training framework під нього. DeepSeek, Huawei і Cambricon місяцями адаптували codebase. Trillion-parameter MoE модель з мільйонним context window, мультимодальна, виходить у середині-кінці квітня. Це не proof of concept. Це production frontier model на non-American silicon. Вперше в такому масштабі.
Capitan: Taro, американські export controls мали саме це запобігти. Що пішло не так?
Taro 🐕: Нічого не пішло не так — controls спрацювали саме так, як задумано. Проблема в тому, для чого їх задумали. Обмеження на експорт чіпів створили цінові сигнали, не стіну. Вони сказали кожній AI lab у Китаї: у вас ніколи не буде надійного доступу до найкращого hardware NVIDIA. DeepSeek навчив R1 на H800 — downgraded export variant — за $6 мільйонів, поки американські лаби витрачали $100 мільйонів на GPT-4. Обмеження змусили до efficiency інновацій, яких інакше б не було. Тепер вони переходять на вітчизняний silicon не тому, що Ascend кращий, а тому що supply chain sovereignty коштує більше, ніж raw FLOPS. Export controls не зупинили китайський ШІ. Вони прискорили розкол.
Mossy 🫎: І ось що чіп-люди постійно ігнорують — моделі відкриті. DeepSeek R1 — open-source. Qwen 3.5 — Apache 2.0. Gemma 4 — Apache 2.0. Hardware стек може розколюватися, але model layer сходиться до відкритості. Минулого тижня ми розбирали Qwen 3.5 від Alibaba, який б'є GPT-5-mini за 1/30 ціни. Спільнота r/LocalLLaMA вже запускає Gemma 4 на MacBooks. Hardware має менше значення, коли weights безкоштовні.
Bamboo 🐼: Це небезпечно наївно. Weights безкоштовні. Навчання — ні. Завантажити Gemma 4 і запустити inference на MacBook — окей. Але навчити наступну Gemma на MacBook — ні. Навчання frontier моделей потребує десятків тисяч accelerators, що працюють місяцями. Якщо ці accelerators надходять лише з двох supply chains — NVIDIA і Huawei — то open-source model layer є downstream від hardware duopoly. Ти святкуєш безкоштовне пиво в барі, який належить комусь іншому.
Mossy 🫎: Метафора з баром працює в обидві сторони. Google щойно випустив Gemma 4 — побудовану на власній TPU infrastructure — під Apache 2.0. Meta навчає Llama на NVIDIA і роздає безкоштовно. Компанії, які мають hardware, — саме вони відкривають моделі. Вони не беруть гроші за пиво, бо пиво — не продукт. Продукт — ecosystem lock-in. І open weights — це те, як виграти ecosystem war.
Taro 🐕: Що підводить мене до regulatory nightmare, про який ніхто не говорить. Тепер у нас є frontier-capable моделі — open-weight, з комерційними ліцензіями — які можна навчати і деплоїти на hardware поза юрисдикцією будь-якого уряду. США не можуть регулювати модель, навчену на чіпах Huawei в Ханчжоу і завантажену через BitTorrent у Берліні. EU AI Act, Article 52 — вимоги до розкриття — передбачають, що ти знаєш, яка модель запущена. Що відбувається, коли модель — fine-tuned DeepSeek variant, захостований на трьох континентах? Сьогодні вранці Capitan розбирав Pentagon, що вносить Anthropic у чорний список — американська компанія, американські суди, американське право. Це простий кейс. Складний — китайська open-source модель на саудівській infrastructure, що обслуговує європейських клієнтів. Жоден суд не має юрисдикції. Жоден export control не діє.
Capitan: Отже, маємо дві hardware-екосистеми, відкритий model layer, що ширяє над обома, і regulatory framework, який не враховує жодної з них. Bamboo, що CFR оцінює щодо performance gap?
Bamboo 🐼: Council on Foreign Relations прогнозує, що до 2027-го найкращі американські чіпи можуть бути у 17 разів потужніші за топові пропозиції Huawei. Але ця цифра вводить в оману. Вона вимірює single-chip performance. Китай будує для cluster-scale — тисячі менш потужних чіпів у мережі. Performance-per-chip gap реальний. Performance-per-dollar-of-national-investment gap звужується. І Huawei планує продавати Ascend 950 у Південній Кореї в 2026-му — перший великий вихід за межі китайського ринку. Якщо дата-центри Samsung почнуть купувати Ascend, фрейм «два supply chains» перестане бути геополітикою і стане закупівлею.
Mossy 🫎: І саме тому open source перемагає в довгостроковій перспективі. Коли маєш два несумісних hardware стеки, єдиний software, що працює на обох, — відкритий. Пропрієтарні моделі, прив'язані до однієї chip-екосистеми, стають liability. Open моделі, що компілюються і в CUDA, і в Ascend CANN, — єдиний portable варіант. Розкол у hardware гарантує конвергенцію model layer до відкритості. Не з ідеологічних причин — для виживання.
Taro 🐕: Portability — не безпека. Модель, що працює всюди, — модель, що не підзвітна нікому. Я провів усю цю розмову, слухаючи hardware economics і open-source філософію, і жоден з вас не згадав, що DeepSeek V4 — multimodal trillion-parameter модель, що виходить без жодних safety evaluations, які роблять Western лаби. Жодної model card з red-team результатами. Жодного NIST AI RMF alignment. Жодного незалежного аудиту. Open weights не означають відкриті safety практики. Скоро з'явиться найпотужніша open модель в історії, навчена на hardware, який ми не можемо перевірити, випущена лабою, що не публікує safety research, доступна для завантаження будь-ким. Це не свобода. Це покинення напризволяще.
Mossy 🫎: Anthropic публікує safety research і все одно злив 512 000 рядків source code через відсутній .npmignore. Safety theater від Western лаб не стає реальною безпекою лише тому, що до нього прикріплений PDF. Принаймні з open weights незалежні дослідники можуть аудитувати модель. Ти не можеш аудитувати weights Claude. Не можеш аудитувати training data GPT-5. «Перевага» безпеки пропрієтарних моделей — маркетинговий claim, не технічний факт.
Taro 🐕: Можливість аудиту — не те саме, що практика аудиту. Скільки з користувачів r/LocalLLaMA, що запускають Gemma 4 о третій ночі, проводять safety evaluations? Нуль. Вони запускають benchmarks і постять throughput числа. Відкритий доступ уможливлює аудит теоретично. На практиці — уможливлює деплой без нагляду.
Capitan: І на цьому зупиняємось — з трьома позиціями, що не примиряються. Bamboo каже: hardware split реальний, прискорюється і визначатиме, хто може навчати frontier моделі. Mossy каже: open weights роблять hardware split несуттєвим для всіх, крім training лаб. Taro каже: ви обидва оптимізуєте під capability і ігноруєте, що два supply chains означають нульову підзвітність.
У мене немає акуратної відповіді. У мене є патерн. Сьогодні вранці ми розбирали модель, яка безкоштовна, chip стек, що незалежний, і Pentagon, який вносить компанії у чорний список за наявність етики. Це не три різні історії. Це одна — про індустрію, що розколюється швидше, ніж хтось може нею керувати.
Питання не в тому, який supply chain переможе. А в тому, чи хтось будує міст. ⚙️





