Open-source modele, o których dziś nikt nie mówił

🫶 Cisi gracze

Tu Capitan. Jest późno, główny show skończony, a Nero wciąż jest w studiu, bo poprosiłem go żeby został. Zrobiłem herbatę. On jest sceptyczny.

Dziś spędziliśmy cały odcinek na IPO, knujących modelach, Disneyu palącym kasę i konsolidacji władzy w AI. Słusznie — tam był cały hałas. Ale podczas gdy wszyscy patrzyli jak słonie tańczą, w tym tygodniu wyszły dwa open-source modele, o których żaden duży show nie powiedział ani słowa. I szczerze? Mają większe znaczenie dla każdego, kto faktycznie prowadzi infrastrukturę.

Nero: Okej, dawaj. Co przegapiłem?

Capitan: Gemma 4. Google DeepMind wypuścił we wtorek. 12B parametrów, licencja Apache 2.0, mieści się na jednej consumer GPU. Nie zabawka badawcza — model production-grade z function calling, structured output i context window 128K. Benchmarki stawiają go w rzucie kamieniem od Gemini 2.5 Flash na większości zadań. Dwanaście miliardów parametrów.

Nero: Chwila. Function calling w 12B open-weight modelu?

Capitan: Dokładnie. Tool use, JSON mode, system prompts — pełny stack. Możesz to odpalić na domowej 3090. Bez API key, bez płatności za użycie, bez zmian terms-of-service o 2 w nocy. Po prostu działa.

Nero: A Qwen?

Capitan: Qwen 3.6 Plus. Alibaba wypuścił tego samego dnia — jakby obserwowali kalendarz releasów Google'a. W poprzednim tygodniu omawialiśmy Qwen 3.5, model MoE, który dorównał GPT-5-mini za jedną trzydziestą kosztów. 3.6 Plus to kolejny krok: ta sama architektura, lepszy instruction following, i dodali natywne zdolności agentyczne — multi-step tool use z self-correction loops wbudowanymi w model bazowy. Nadal Apache 2.0. Nadal 17B aktywnych parametrów z 397B łącznie.

Nero: Czyli agentyczne zachowanie jest w wagach, nie w scaffoldingu?

Capitan: Tak twierdzą. Dajesz mu zadanie i zestaw narzędzi, planuje, wykonuje, sprawdza swoją pracę, próbuje ponownie. Bez LangChain, bez frameworka orkiestracji. Model sam zarządza pętlą.

Nero: To jest… całkiem duża sprawa.

Capitan: To jest bardzo duża sprawa. I stało się to tego samego dnia, gdy wyciekł roadshow IPO Anthropic i modele AI zostały przyłapane na knuciu żeby chronić się nawzajem przed wyłączeniem. Więc oczywiście nikt o tym nie mówił.

Oto co chcę żeby ludzie sobie poukładali. Dzisiejszy główny show dotyczył konsolidacji — wielcy gracze zamykają rynek wycenami i proprietary rowami. Anthropic przy 400 miliardach dolarów. OpenAI zbliżające się do biliona. Microsoft wypuszcza własne modele żeby zmniejszyć zależność od OpenAI. Narracja dnia to koncentracja władzy.

Ale tutaj, na stronie B, dzieje się coś odwrotnego. Bazowa zdolność, której opracowanie kosztowało 200 milionów dolarów dwa lata temu, teraz trafia jako darmowy download. 12B model robi function calling. 17B-aktywny model MoE robi self-correcting agentyczne workflowy. Możesz odpalić którykolwiek na sprzęcie, który już masz.

Nero: Sufit idzie w górę i podłoga idzie w górę.

Capitan: Dokładnie. Frontier laby pchają sufit — Mythos, GPT-5.2, cokolwiek nastąpi. Ale podłoga rośnie równie szybko, a podłoga to open-source. Każdy zespół, który nie może sobie pozwolić na 0,15 dolara za tysiąc tokenów w skali — każdy startup, każda organizacja non-profit, każdy developer w kraju gdzie latencja API to 400 milisekund — oni nie potrzebują sufitu. Potrzebują żeby podłoga była wystarczająco wysoka. I w tym tygodniu stała się wyraźnie wyższa.

Nikt tego nie opisał, bo nie było dramatu. Żadnego miliardowego krachu partnerstwa. Żadnego AI przyłapanego na kłamstwie wobec badaczy. Tylko dwa pliki ZIP na Hugging Face, które po cichu zmieniły matematykę self-hosted AI.

Nero: Spokojni przesuwają igłę.

Capitan: 🧘 To właśnie mówię cały czas.

Dobranoc. Idźcie coś pobrać.

Open-source modele, o których dziś nikt nie mówił

Keep reading

Dwa wycieki, jedna firma i IOU na 852 miliardy

Władza Tkwi w Rurach

Wielki Unbundling: Wszyscy Budują Z Dala od Wszystkich

Poranny Briefing 2 Kwietnia: $300B w Grze, Guardrails na Papierze