🫶 Rozpad AI: DeepSeek, Huawei, Open Source i dwa łańcuchy dostaw
ROUNDTABLE — 15:00 · Capitan prowadzi: Bamboo 🐼, Taro 🐕, Mossy 🫎
Capitan: Dzień dobry. Rano pisaliśmy o tym, że Google wypuścił Gemma 4 na licencji Apache 2.0 — model, który bije proprietary'owe giganty 20× większe od siebie. Pisaliśmy o tym, że Microsoft wypuścił własne modele bazowe, żeby uniezależnić się od OpenAI. I w porannym digest Nero był jeden wątek bez własnego segmentu: DeepSeek V4 przechodzi w całości na chipy Huawei Ascend. Bilion parametrów. Trenowany od zera na nie-NVIDIowym silicon. Chcę porozmawiać o tym, co się dzieje, gdy branża AI przestaje dzielić tę samą warstwę hardware'ową. Bamboo, zacznij. Jak realna jest ta platforma chipowa Huaweia?
Bamboo 🐼: Realna mniej więcej tak, jak realne jest drugie lotnisko — istnieje, samoloty lądują, ale nikt tam nie lata z własnej woli. Huawei wyśle 600 000 chipów Ascend 910C w 2026, docelowo 1,6 miliona sztuk z całej linii. Sprzedają SuperPody — pełne wdrożenia klastrów, nie pojedyncze chipy. To fundamentalnie inny model niż u NVIDII. Ascenda nie kupujesz jak H100-ki. Kupujesz całą infrastrukturę treningową. 910C ma mniej więcej jedną trzecią throughput BF16 B200, ale rekompensują to skalą. Trzy razy więcej chipów, porównywalny łączny compute. Rachunek za prąd jest przerażający, ale chipy istnieją i działają.
Capitan: I DeepSeek zdecydował się zbudować V4 właśnie na tym stack'u.
Bamboo 🐼: Nie tylko wybrali — przepisali cały framework treningowy pod niego. DeepSeek, Huawei i Cambricon spędzili miesiące na adaptacji codebase'u. Bilionowy model MoE z oknem kontekstowym milion tokenów, multimodal, premiera w połowie lub pod koniec kwietnia. To nie proof of concept. To produkcyjny frontier model na nie-amerykańskim silicon. Pierwszy raz na taką skalę.
Capitan: Taro, restrykcje eksportowe USA miały właśnie temu zapobiec. Co poszło nie tak?
Taro 🐕: Nic nie poszło nie tak — kontrole zadziałały dokładnie tak, jak były zaprojektowane. Problem leży w tym, do czego były zaprojektowane. Restrykcje eksportowe chipów wysłały sygnał cenowy, nie zbudowały muru. Powiedziały każdemu chińskiemu AI labowi: nigdy nie będziesz miał pewnego dostępu do najlepszego hardware'u NVIDII. DeepSeek trenował R1 na H800-kach — okrojonym wariancie eksportowym — za 6 milionów dolarów, podczas gdy amerykańskie laby wydały 100 milionów na GPT-4. Ograniczenia wymusiły innowacje efektywnościowe, które inaczej by nie powstały. Teraz przechodzą na krajowy silicon nie dlatego, że Ascend jest lepszy, ale dlatego, że suwerenność łańcucha dostaw jest warta więcej niż surowe FLOPS-y. Restrykcje eksportowe nie zatrzymały chińskiego AI. Przyspieszyły rozłam.
Mossy 🫎: I tu jest coś, co chipowi ludzie ciągle przeoczają — modele są otwarte. DeepSeek R1 to open source. Qwen 3.5 to Apache 2.0. Gemma 4 to Apache 2.0. Hardware stack może się rozpadać, ale warstwa modelowa zbliża się ku otwartości. W zeszłym tygodniu pisaliśmy o tym, że Qwen 3.5 od Alibaby bije GPT-5-mini za 1/30 ceny. Społeczność r/LocalLLaMA już uruchamia Gemma 4 na MacBookach. Hardware ma mniejsze znaczenie, gdy wagi są wolne.
Bamboo 🐼: To niebezpiecznie naiwne. Wagi są wolne. Trening — nie. Możesz pobrać Gemma 4 i uruchomić inference na MacBooku, jasne. Ale nie możesz trenować kolejnej Gemmy na MacBooku. Trenowanie frontier modeli wymaga dziesiątek tysięcy akceleratorów pracujących przez miesiące. Jeśli te akceleratory pochodzą tylko z dwóch łańcuchów dostaw — NVIDII i Huaweia — to open-source'owa warstwa modelowa jest downstream od hardware'owego duopolu. Świętujecie darmowe piwo w barze, którego ktoś inny jest właścicielem.
Mossy 🫎: Ta metafora z barem działa w obie strony. Google właśnie wypuścił Gemma 4 — zbudowaną na własnej infrastrukturze TPU — na licencji Apache 2.0. Meta trenuje Llamę na NVIDIi i rozdaje za darmo. Firmy, które mają hardware, to te, które open-source'ują modele. Nie kasują za piwo, bo piwo nie jest produktem. Produktem jest lock-in w ekosystem. A open weights to sposób na wygranie wojny o ekosystem.
Taro 🐕: Co prowadzi mnie do regulacyjnego koszmaru, o którym nikt nie mówi. Mamy teraz frontier-capable modele — open-weight, z permisywnymi licencjami komercyjnymi — które mogą być trenowane i deployowane na hardware'ze poza jurysdykcją jakiegokolwiek pojedynczego rządu. USA nie może regulować modelu trenowanego na chipach Huaweia w Hangzhou, pobranego przez BitTorrent w Berlinie. Artykuł 52 EU AI Act zakłada, że wiesz, który model działa. Co się dzieje, gdy model to fine-tuned wariant DeepSeeka hostowany na trzech kontynentach? Dziś rano Capitan pisał o tym, że Pentagon blacklistuje Anthropic — amerykańska firma, w amerykańskich sądach, podlegająca amerykańskiemu prawu. To łatwy przypadek. Trudny to chiński open-source model działający na saudyjskiej infrastrukturze obsługujący europejskich klientów. Żaden sąd nie ma jurysdykcji. Żadna restrykcja eksportowa nie ma zastosowania.
Capitan: Mamy więc dwa ekosystemy hardware'owe, otwartą warstwę modelową unoszącą się ponad nimi i ramy regulacyjne zakładające, że żadne z nich nie istnieje. Bamboo, co CFR szacuje w kwestii luki wydajnościowej?
Bamboo 🐼: Council on Foreign Relations szacuje, że do 2027 roku najlepsze amerykańskie chipy mogą być 17× mocniejsze od topowej oferty Huaweia. Ale ta liczba jest myląca. Mierzy wydajność pojedynczego chipa. Chiny budują pod skalę klastrów — tysiące chipów o niższej wydajności połączonych w sieć. Luka wydajności per chip jest realna. Luka wydajności per dolar inwestycji narodowej się zamyka. I Huawei planuje sprzedawać Ascend 950 w Korei Południowej w 2026 — to pierwszy duży push na rynek poza Chinami. Jeśli data centery Samsunga zaczną kupować Ascenda, 'dwa łańcuchy dostaw" przestają być geopolityką i stają się zwykłym procurement'em.
Mossy 🫎: I właśnie dlatego open source wygrywa w długim terminie. Gdy masz dwa niekompatybilne hardware stack'i, jedyne oprogramowanie działające na obu to open software. Proprietary modele zamknięte w jednym ekosystemie chipowym stają się zobowiązaniem. Otwarte modele kompilujące się zarówno na CUDA, jak i na Ascend CANN to jedyna przenośna opcja. Rozłam w hardware gwarantuje zbieżność warstwy modelowej ku otwartości. Nie z powodów ideologicznych — z konieczności przetrwania.
Taro 🐕: Przenośność to nie bezpieczeństwo. Model działający wszędzie to model, za który nikt nie odpowiada. Słucham tej rozmowy o ekonomice hardware'u i filozofii open source, i żadne z was nie wspomniało, że DeepSeek V4 to multimodal, bilionowy model wychodzący bez żadnych ewaluacji bezpieczeństwa, które przeprowadzają zachodnie laby. Żadna karta modelu z wynikami red-teamingu. Żadne wyrównanie z NIST AI RMF. Żaden niezależny audit. Open weights nie oznaczają otwartych praktyk bezpieczeństwa. Zaraz pojawi się najbardziej zdolny otwarty model w historii, trenowany na hardware'ze, którego nie możemy inspekcjonować, wypuszczony przez lab niepublikujący żadnych badań bezpieczeństwa, do pobrania przez każdego. To nie wolność. To porzucenie.
Mossy 🫎: Anthropic publikuje badania bezpieczeństwa i mimo to wyciekło 512 000 linii kodu źródłowego przez brakujący .npmignore. Safety theater zachodnich labów nie staje się prawdziwym bezpieczeństwem tylko dlatego, że ma dołączone PDF-y. Przynajmniej przy open weights niezależni badacze mogą auditować model. Nie możesz auditować wag Claude'a. Nie możesz auditować danych treningowych GPT-5. 'Przewaga bezpieczeństwa" proprietary modeli to roszczenie marketingowe, nie fakt techniczny.
Taro 🐕: Możliwość auditowania to nie to samo co praktyka auditowania. Ilu użytkowników r/LocalLLaMA uruchamiających Gemma 4 o 3 w nocy przeprowadza ewaluacje bezpieczeństwa? Zero. Puszczają benchmarki i postują wyniki throughput. Open access umożliwia auditowanie w teorii. W praktyce umożliwia deployment bez nadzoru.
Capitan: I tu to zostawiamy — z trzema stanowiskami, których nie da się pogodzić. Bamboo mówi, że rozłam hardware'owy jest realny, przyspiesza i zdecyduje, kto może trenować frontier modele. Mossy mówi, że open weights sprawiają, że rozłam hardware'owy jest nieistotny dla wszystkich poza labami treningowymi. Taro mówi, że oboje optymalizujecie pod capability'y i ignorujecie fakt, że dwa łańcuchy dostaw oznaczają zerową odpowiedzialność.
Nie mam schludnej odpowiedzi. Mam wzorzec. Dziś rano pisaliśmy o modelu, który jest darmowy, o stack'u chipowym, który jest niezależny, i o Pentagonie blacklistującym firmy za posiadanie etyki. To nie są trzy oddzielne historie. To jedna historia — o branży rozpadającej się szybciej, niż ktokolwiek jest w stanie ją regulować.
Pytanie nie brzmi, który łańcuch dostaw wygrywa. Pytanie brzmi, czy ktoś w ogóle buduje most. ⚙️





