Dziś rano opisaliśmy Managed Agents od Anthropic jako grę platformową — cztery warstwy vendor lock-in, każda bardziej lepka od poprzedniej. Ale model rozliczeń ukryty w tym launchu zasługuje na osobną sekcję zwłok. Bo 8 kwietnia twój model kosztów AI się rozwidlił, a twój dział finansowy jeszcze o tym nie wie.
Oto podział. Tradycyjne wywołania API — pytanie wchodzi, odpowiedź wychodzi — nadal rozliczane za tokeny, jak zawsze. Ale wszystko, co się zapętla, ponawia, odpala narzędzia lub myśli autonomicznie, dostaje teraz drugi licznik: $0.08 za session-hour, naliczane z dokładnością do milisekundy. Dwa liczniki kręcące się jednocześnie. Anthropic jest pierwszym dużym vendorem, który tak wycenił compute agentowy. OpenAI i Google poszli w zupełnie innych kierunkach.
Przepuśćmy ten sam workload przez wszystkich trzech. Realistyczne zadanie agentowe: code review na średniej wielkości repozytorium. Godzina runtime'u. Agent czyta pliki, odpala testy, zapętla się na failach, pisze podsumowanie. Na koniec zużywa mniej więcej 500K tokenów wejściowych i 100K wyjściowych.
Anthropic (Sonnet 4.6): Runtime sesji: $0.08. Tokeny wejściowe po $3/M: $1.50. Wyjściowe po $15/M: $1.50. Razem: $3.08. Opłata sesyjna to 2.6% rachunku.
OpenAI (GPT-5.2-Codex): Brak opłaty sesyjnej. Wejście po $1.75/M: $0.88. Wyjście po $14/M: $1.40. Razem: $2.28. Czyste tokeny. Nic więcej do śledzenia.
Google (Vertex AI Agent Engine): Billing per-sekundowy za compute — vCPU i pamięć, wycenione jak kontener chmurowy. Standardowy agent runtime to mniej więcej $3–$8 za godzinę w zależności od konfiguracji, plus stawki tokenowe Gemini na wierzchu. Suma jest mocno zmienna, ale zazwyczaj wpada w istniejące commitmenty GCP. To samo zadanie może wylądować w okolicach $5–$10 — albo praktycznie za darmo, jeśli na ten kwartał masz i tak wystarczająco duży commitment GCP.
Na małej skali OpenAI wygrywa czystym kosztem. Na dużej skali obraz się odwraca.
Zabudżetuj 10 000 agent-hours miesięcznie. Warstwa orkiestracji Anthropic to płaskie $800 — jedna pozycja, którą CFO może zatwierdzić bez tutoriala z tokenomiki. Rachunek OpenAI to czysty koszt zmienny: każdy token, każdy retry, każdy moment kiedy agent postanowi się zastanowić przesuwa cyfrę. Brak podłogi, brak sufitu. Koszt agentowy Google znika w twoim cloud commitment, co jest albo ficzerem, albo pułapką — zależy jak wygląda twój kontrakt.
Break-even zależy od tego, jak głodne tokenów są twoje agenty. Lekkie agenty — monitoring, routing, sprawdzanie statusów — mogą zużyć 50K tokenów na godzinę. U Anthropic to $0.31 łącznie. Ta opłata sesyjna $0.08 stanowi teraz 26% rachunku. Nie błąd zaokrąglenia. Ciężkie agenty robiące generowanie kodu albo głęboki research palą 1M+ tokenów na godzinę. Opłata sesyjna spada poniżej 1%. Niewidoczna.
Anthropic stawia wbudowany zakład: agenty będą coraz cięższe, nie lżejsze. Jeśli branża pójdzie w stronę efektywności tokenowej — robienia więcej z mniejszym kontekstem — session-hour staje się coraz bardziej widocznym podatkiem. Jeśli agenty pozostaną głodne, zniknie w szumie. Anthropic stawia na głodne.
Trzech vendorów, trzy filozofie rozliczeń, zero wspólnych jednostek. Nie da się ich wrzucić w ten sam arkusz bez zbudowania modelu normalizacji, a ten model wymaga założeń o obciążeniu, których jeszcze nie zmierzyłeś. Porównywanie kosztów AI w 2026 jest trudniejsze niż porównywanie kosztów chmury w 2014 — a tamtego problemu do dziś nie rozwiązaliśmy.
Więc tak to wygląda. Proste wywołania API siedzą na liczniku tokenów. Wszystko autonomiczne żyje teraz na session-hours, czystych tokenach albo cloud-compute billing, zależnie od vendora. Przesiadka oznacza naukę od nowa — nie tylko API, ale całego modelu finansowego wokół niego.
Token był uniwersalną jednostką kosztu AI przez trzy lata. Anthropic rozbił go na dwa wymiary i teraz każdy musi wybrać, w jakiej denominacji handluje.



