Płacisz trzy dolce za milion tokenów za każdym razem, gdy twoja aplikacja odpytuje Claude Sonnet. Może odpalasz GPT-5-mini za sześćdziesiąt centów i czujesz się sprytnie. Tak czy inaczej, San Francisco inkasuje prowizję od każdego wywołania API, a rachunek rośnie proporcjonalnie do liczby twoich użytkowników.

Problem jest strukturalny. Własnościowe modele AI wyznaczają cenę minimalną, a każdy, kto buduje na ich wierzchu, dziedziczy ich marżę. Taki był układ — dopóki ktoś nie wypuścił modelu, który był jednocześnie wystarczająco dobry i praktycznie darmowy. Pytanie nigdy nie brzmiało czy. Pytanie brzmiało, czy to coś przetrwa zderzenie z produkcją.

16 lutego Alibaba Cloud wypuściło Qwen 3.5 — model Mixture-of-Experts z 397 miliardami parametrów, który aktywuje tylko 17 miliardów na token. Zamiast przepychać całą sieć neuronową przez każde pytanie, MoE kieruje każde zadanie do wyspecjalizowanych neuronów, które radzą sobie z nim najlepiej. Jak wezwanie hydraulika zamiast ściągania wszystkich ekip remontowych w mieście do jednego cieknącego kranu. Alibaba udostępniło wszystkie warianty na licencji Apache 2.0 — wolnej do użytku komercyjnego, modyfikacji, odsprzedaży — i w ciągu kolejnych dwóch tygodni dorzuciło modele medium i small.

Benchmarki wyglądały absurdalnie. Qwen3.5-27B trafił 72.4 na SWE-bench Verified — dokładnie tyle samo co GPT-5 mini. Wariant 9B przebił modele 13 razy większe od siebie w rozumowaniu na poziomie magisterskim. Alibaba wyceniło API na dziesięć centów za milion tokenów wejściowych — 30x taniej niż Claude Sonnet, 6x taniej niż GPT-5-mini. Ale chińskie laboratoria modelowe mają dumną tradycję benchmarkowej turystyki: wyniki, które wyglądają pięknie na papierze i topnieją przy kontakcie z realnym obciążeniem. Więc wszyscy wstrzymali oddech.

Sześć tygodni później liczby się potwierdziły — i jeszcze trochę. Rodzina Qwen przekroczyła 600 milionów pobrań na Hugging Face, generując ponad 170 000 modeli pochodnych. Indonezyjskie GoTo przeniosło połowę swojej infrastruktury na Alibaba Cloud. AI Singapore wybrało Qwen zamiast Llamy od Mety i Gemmy od Google'a jako fundament swojego regionalnego modelu językowego — i objęło prowadzenie w rankingu południowoazjatyckim. Hybrydowy mechanizm uwagi — 75% lekkiego Gated DeltaNet zmieszanego z 25% tradycyjnej uwagi — dostarczył 8,6x szybszą przepustowość przy kontekście 32K w produkcji, nie w laboratorium. Prawdziwe firmy. Prawdziwe obciążenia. Prawdziwe zaoszczędzone pieniądze.

A potem ludzie, którzy to wszystko zbudowali, wyszli drzwiami.

3 marca — dzień po wypuszczeniu modelu small — Lin Junyang, lider techniczny Qwen, napisał na X 'me stepping down. bye my beloved qwen" i zniknął. Kolega napisał, że odejście nie było jego decyzją. Yu Bowen, szef post-trainingu, odszedł tego samego dnia. Hui Binyuan, który prowadził Qwen Code, przeszedł do Mety już w styczniu. Trzy najważniejsze umysły techniczne zespołu — za drzwiami w ciągu dziesięciu tygodni. CEO Alibaby sprowadził kogoś z DeepMind i przeskoczył z open-source'owego idealizmu na metryki DAU i komercyjny deployment. Klasyczny korporacyjny manewr: poczekaj, aż inżynierowie zbudują coś wyjątkowego, potem zreorganizuj ich z mapy.

Architekci odeszli. Architektura została.

I to jest ta rzecz w Apache 2.0, której większość ludzi nie łapie. Alibaba może jutro wysadzić całe swoje laboratorium AI w powietrze i nic się nie zmieni. Wagi leżą na Hugging Face. Kod żyje na GitHubie. Te 170 000 modeli pochodnych nie jest Alibabbie nic winne i nigdzie się nie wybiera. Możesz sforkować Qwen 3.5 dzisiaj i nikt ci tego nie odbierze — prawnie, technicznie ani praktycznie. Open source nie potrzebuje rodziców po opuszczeniu domu.

Zanim przepiszesz swój stos: zastrzeżenia. Self-hosting 397 miliardów parametrów wciąż wymaga poważnego żelaza — myśl: 8x H100 GPU dla pełnego modelu. Warianty 4B i 9B odpalasz na laptopie, ale to nie one walczą na ringu z Claude Sonnet. 'Apache 2.0 od Alibaby" niesie ze sobą geopolityczny ciężar, którego niektóre korporacyjne działy zakupów nie chcą tykać. A ścięty zespół deweloperski oznacza, że Qwen 4, kiedykolwiek się pojawi, to wielka niewiadoma. Stawiasz na model ze sprawdzoną teraźniejszością i niepewną mapą drogową.

Sześć tygodni temu AI klasy frontier cenowo mieszkało wyłącznie w San Francisco. Teraz mieszka na repozytorium na Hugging Face — za trzydzieści centów za dolara albo za darmo. Open source nie musiał wygrać wojny benchmarkowej. Musiał podejść wystarczająco blisko, żeby luka cenowa stała się nie do obronienia. Qwen 3.5 przekroczył tę linię. I w przeciwieństwie do zespołu, który go zbudował, model nigdzie się nie wybiera.

#qwen #alibaba #opensource #aimodels #pricing