Płacisz 20 dolców miesięcznie za asystenta AI do kodowania, a każdy w twoim zespole płaci tyle samo. Stażysta, który autouzupełnia nazwy zmiennych. Senior, który wpycha cały monolit i prosi o refaktor wszystkiego. Ta sama cena. Dział finansów to uwielbia. Zaraz przestanie.
Problem jest prosty: flat-rate działa, gdy zużycie jest mniej więcej równe. W narzędziach AI do kodowania — nigdy nie jest. Jeden developer przepala context window — czyli ile tekstu AI może "widzieć" naraz, taki jego RAM roboczy — pięćdziesiąt razy dziennie. Drugi otwiera go raz w tygodniu, żeby poprawić literówkę. Pobieranie od nich tej samej kwoty to jak obciążanie każdego lokatora taką samą stawką za prąd, niezależnie od tego, czy trzyma koparkę krypto w salonie.
OpenAI przeszło na nowy model — co to znaczy dla twojego budżetu
Rano opisywaliśmy chronologię: stanowiska Codex-only z rozliczeniem pay-as-you-go, 3 miliony użytkowników tygodniowo, tier Pro za 100 dolarów/miesiąc wymierzony w Anthropica. Ogłoszenia są mniej ważne niż to, co sygnalizują. OpenAI właśnie powiedziało rynkowi, że pricing per-seat nie działa dla agentów kodujących.
Powód jest strukturalny. Agenty kodujące nie zachowują się już jak ludzcy deweloperzy z pluginem do autouzupełniania. Działają w chmurowych sandboxach (izolowanych środowiskach wirtualnych), odpalają równoległe sesje i wykonują zadania autonomicznie. Jedno "miejsce" potrafi zżerać zasoby odpowiadające dziesięciu ludziom pracującym jednocześnie. Jednostką pracy nie jest już developer — jest nią task.
Pricing per-seat nie wytrzymuje takiego obciążenia.
Krajobraz cenowy jest już poszatkowany
Spójrz, gdzie rynek jest teraz:
| Narzędzie | Model | Cena |
|---|---|---|
| GitHub Copilot | Per seat | 10–39$/miesiąc |
| Cursor | Kredyty | 16–200$/miesiąc |
| Claude Code | Tokeny API | Pay-as-you-go |
| OpenAI Codex (nowy) | Tokeny + seat | 20$/miesiąc baza + zużycie |
GitHub nadal rozlicza per człowiek. Cursor używa systemu kredytów, który de facto jest usage-based z dolnym progiem. Claude Code zawsze rozliczał się przez API Anthropica — czysta konsumpcja tokenów — ale to narzędzie deweloperskie, nie produkt do zakupu zespołowego. OpenAI wciągnęło usage-based billing do warstwy enterprise, gdzie zamówienia podpisują działy zakupów.
Według Fortune, użycie Codexa w workspace'ach Business i Enterprise wzrosło sześciokrotnie od stycznia 2026. Cisco, Nvidia, Ramp i Rakuten już go odpalają na skalę. Przy sześciokrotnym wzroście flat pricing to gwarantowana strata dla OpenAI — i gwarantowany szok na fakturze dla wszystkich pozostałych, gdy pójdą tą samą drogą.
Cena za znanie ceny
Kompromis jest realny. Usage-based billing czyni twój budżet na AI do kodowania tak przewidywalnym jak rachunek za AWS — czyli w ogóle nieprzewidywalnym. Zespoły, które najagresywniej używają agentów, dostają najwyższe rachunki, mimo że wyciągają z tego największą wartość. Działy finansów muszą teraz rozumieć konsumpcję tokenów tak, jak nauczyły się rozumieć godziny obliczeniowe. Powodzenia.
Jest też efekt odwrotny. Kiedy każde zadanie AI ma widoczny koszt, developerzy zaczynają racjonować. Zespół, który powinien używać agentów do wszystkiego, zaczyna w głowie kalkulować, czy ten refaktor jest "wart" tokenów. Chciałeś przyspieszyć development. Zamiast tego stworzyłeś nową nerwicę — taką, która karze dokładnie za zachowanie, które próbujesz zachęcać.
Jeśli zarządzasz zespołem devów albo zatwierdzasz budżet na narzędzia, zrób audyt wzorców użycia teraz. Wyciągnij dane o tym, kto czego używa, ile tokenów na sesję i jakie zadania faktycznie uzasadniają compute na poziomie agenta. Pierwsza zmienna faktura przyjdzie, zanim zbudujesz model, żeby ją zrozumieć.
Era flat-rate się kończy
Rok temu każde narzędzie AI do kodowania rozliczało per seat. Dziś największy gracz powiedział rynkowi, że ten model się nie skaluje. To, co go zastąpi, wygląda dokładnie jak billing chmurowy — a tego też nikt nigdy nie kochał. Ale przynajmniej teraz będziesz wiedział, który developer faktycznie używa narzędzia, a który trzyma je otwarte dla wsparcia moralnego.



