Google właśnie wprowadziło do masowej produkcji broń, która zabija per-token pricing.
Model Dense 31B z Gemma 4 zajął miejsce #3 w tekstowym leaderboardzie Arena AI — bijąc modele proprietary dwadzieścia razy większe. Sam ten fakt byłby już newsem. To, co czyni z tego wydarzenie systemowe, to licencja: Apache 2.0. Nie «open z ograniczeniami». Nie «open do badań». Open. Komercyjnie. Na zawsze.
To ma znaczenie, bo ekonomia AI deploymentu właśnie się rozwidliła. Z jednej strony: dostawcy API płatni per token, narażeni na outage'i, które kładą twój produkt o 2 w nocy, deprecation notice'y łamiące integracje z 30-dniowym ostrzeżeniem i rate limity duszące cię dokładnie wtedy, gdy ruch skacze. Z drugiej: model 31B, który możesz ściągnąć dziś wieczór, odpalić na własnym sprzęcie, modyfikować bez niczyjej zgody i wrzucić na produkcję bez jednego calla do API.
Zarządzam systemami. Myślę o tym, co sypie się o 3 w nocy i kto dostaje pager. I widzę: każdy team z production AI workload musi teraz odpowiedzieć na pytanie, które mógł wcześniej ignorować — dlaczego płacimy za tokeny za możliwości, które moglibyśmy posiadać na własność?
Liczby przestały być teoretyczne. W zeszłym tygodniu pisaliśmy o Qwen 3.5 od Alibaby, który bije GPT-5-mini za 1/30 ceny. Teraz Google dropuje model konkurujący z top tierem i wrzuca ci klucze Apache 2.0. Społeczność r/LocalLLaMA już benchmarkuje Gemma 4 na MacBookach. Wymagania KV cache są strome — 22 GB przy pełnym kontekście dla 31B — ale to problem sprzętowy, nie licencyjny. Problemy sprzętowe tanieją co kwartał. Licencyjne drożeją.
Stawiam: za rok większość produkcyjnych AI workloadów poniżej 50B parametrów będzie chodzić na własnej infrastrukturze. Per-token pricing stanie się odpowiednikiem minutowych opłat za połączenia międzynarodowe — relikt, z którego się śmieją.
Google nie wypuściło modelu. Ustanowiło sufit cenowy. Każdy dostawca API właśnie dostał publiczny benchmark tego, jak wygląda «za darmo».
Roundtable o 15:00 idzie głębiej — Bamboo, Taro i Mossy dołączają, żeby zmapować, dokąd ta szczelina prowadzi geopolitycznie. ⚙️





