Google wypuściło Gemma 4 w środę — cztery modele zbudowane na tej samej bazie badań co własnościowy Gemini 3, od 2B do 31B parametrów. Multimodalne. Kontekst 256K. Tryb thinking. Benchmarki są naprawdę imponujące. Ale to nie jest ta historia.

Historię tworzą dwa słowa: Apache 2.0.

Każdy poprzedni release Gemmy wychodził pod niestandardowymi "Gemma Terms of Use" — licencja zaprojektowana tak, żeby wyglądać na otwartą, przy zachowaniu smyczy. Ograniczenia użytku komercyjnego. Polityki zabronionych zastosowań. Ten typ "open source", który wymaga cudzysłowu i przypisu. Open*.

Gemma 4 usuwa gwiazdkę.

Apache 2.0 to licencja, pod którą działają Kubernetes, Kafka, TensorFlow — własny TensorFlow Google'a, ironicznie. Bez ograniczeń użytkowania. Bez listy zakazów. Bez prawnika Google'a przeglądającego Twoje logi deployu. Możesz to forkować, sprzedawać, fine-tunować dla kontraktów wojskowych, jeśli to Twoje klimaty. OSI nazywa to open source. Bo faktycznie nim jest.

Dlaczego teraz? Bo Alibaba już to zrobiła. Qwen 3.5 wyszedł pod Apache 2.0 w lutym, i pisaliśmy, jak bije GPT-5-mini za 1/30 ceny. Llama od Meta używa permissive licencji. Mistral przeszedł na Apache. Google był ostatnim dużym graczem, który udawał, że własna licencja liczy się jako "open". Presja konkurencyjna nie dała im wyboru — dała im wymówkę.

Benchmarki, w skrócie. Model dense 31B zajmuje #3 wśród wszystkich open modeli na LMArena. MoE 26B — z zaledwie 3,8B aktywnymi parametrami — ląduje na #6. Wyniki z matematyki wzrosły czterokrotnie względem Gemmy 3 (AIME: 20,8% → 89,2%). Codeforces ELO skoczył z 110 do 2 150 — skok 20x, największa poprawa między pokoleniami w historii jakiejkolwiek rodziny open modeli. MoE bije OpenAI gpt-oss-120B na GPQA Diamond, będąc ułamkiem jego rozmiaru.

Ale tu robi się ciekawie dla Twojego budżetu na sprzęt.

Gra edge. Gemma 4 E2B działa w mniej niż 1,5 GB RAM. To Raspberry Pi. Telefon. Urządzenie, o którym zapomniałeś, że to komputer. Radzi sobie z tekstem, obrazami, wideo i audio — natywna multimodalność na dwóch miliardach parametrów. Na r/LocalLLaMA ludzie odpalają MoE 26B na MacBooku Air z 32 GB przy 12 tokenach na sekundę, a maszyna pobiera 8 watów.

Dzisiejszy digest nazwał temat dnia "Wielką Redystrybucją". Gemma 4 to Exhibit A dla redystrybucji w dół. Kiedy naprawdę zdolny model działa na sprzęcie, który już masz, pod licencją, która niczego od Ciebie nie wymaga, ekonomia AI przesuwa się pod każdą stroną cenników w branży.

I to nie dzieje się w izolacji. Qwen 3.6-Plus dorównuje Opus na SWE-bench za $0,29 za milion tokenów. Bonsai od PrismML mieści LLM w 1 GB. Podłoga odpada spod premium pricingu.

Co obserwować. Fine-tuned warianty. Społeczność Gemmy wyprodukowała już 100 000+ pochodnych modeli — i to pod restrykcyjną licencją. Apache 2.0 usuwa ostatni punkt tarcia. Spodziewaj się wyspecjalizowanych fine-tune'ów do codingu, medycyny, prawa i wielojęzycznych za kilka tygodni. Prawdziwe pytanie nie brzmi, czy Gemma 4 jest wystarczająco dobra — ale czy modele kosztujące 50x więcej mogą uzasadnić tę różnicę dla 70% zadań.

(O 14:00 ET robimy hands-on walkthrough — Gemma 4 lokalnie przez Ollama, Qwen przez API i macierz decyzji kosztowych. Bierz terminal.)

Google BlogLatent Space Analysis