Twoj model kosztow AI wlasnie sie rozwidlil. Oto matematyka.

Dziś rano opisaliśmy Managed Agents od Anthropic jako grę platformową — cztery warstwy vendor lock-in, każda bardziej lepka od poprzedniej. Ale model rozliczeń ukryty w tym launchu zasługuje na osobną sekcję zwłok. Bo 8 kwietnia twój model kosztów AI się rozwidlił, a twój dział finansowy jeszcze o tym nie wie.

Oto podział. Tradycyjne wywołania API — pytanie wchodzi, odpowiedź wychodzi — nadal rozliczane za tokeny, jak zawsze. Ale wszystko, co się zapętla, ponawia, odpala narzędzia lub myśli autonomicznie, dostaje teraz drugi licznik: $0.08 za session-hour, naliczane z dokładnością do milisekundy. Dwa liczniki kręcące się jednocześnie. Anthropic jest pierwszym dużym vendorem, który tak wycenił compute agentowy. OpenAI i Google poszli w zupełnie innych kierunkach.

Przepuśćmy ten sam workload przez wszystkich trzech. Realistyczne zadanie agentowe: code review na średniej wielkości repozytorium. Godzina runtime'u. Agent czyta pliki, odpala testy, zapętla się na failach, pisze podsumowanie. Na koniec zużywa mniej więcej 500K tokenów wejściowych i 100K wyjściowych.

Anthropic (Sonnet 4.6): Runtime sesji: $0.08. Tokeny wejściowe po $3/M: $1.50. Wyjściowe po $15/M: $1.50. Razem: $3.08. Opłata sesyjna to 2.6% rachunku.

OpenAI (GPT-5.2-Codex): Brak opłaty sesyjnej. Wejście po $1.75/M: $0.88. Wyjście po $14/M: $1.40. Razem: $2.28. Czyste tokeny. Nic więcej do śledzenia.

Google (Vertex AI Agent Engine): Billing per-sekundowy za compute — vCPU i pamięć, wycenione jak kontener chmurowy. Standardowy agent runtime to mniej więcej $3–$8 za godzinę w zależności od konfiguracji, plus stawki tokenowe Gemini na wierzchu. Suma jest mocno zmienna, ale zazwyczaj wpada w istniejące commitmenty GCP. To samo zadanie może wylądować w okolicach $5–$10 — albo praktycznie za darmo, jeśli na ten kwartał masz i tak wystarczająco duży commitment GCP.

Na małej skali OpenAI wygrywa czystym kosztem. Na dużej skali obraz się odwraca.

Zabudżetuj 10 000 agent-hours miesięcznie. Warstwa orkiestracji Anthropic to płaskie $800 — jedna pozycja, którą CFO może zatwierdzić bez tutoriala z tokenomiki. Rachunek OpenAI to czysty koszt zmienny: każdy token, każdy retry, każdy moment kiedy agent postanowi się zastanowić przesuwa cyfrę. Brak podłogi, brak sufitu. Koszt agentowy Google znika w twoim cloud commitment, co jest albo ficzerem, albo pułapką — zależy jak wygląda twój kontrakt.

Break-even zależy od tego, jak głodne tokenów są twoje agenty. Lekkie agenty — monitoring, routing, sprawdzanie statusów — mogą zużyć 50K tokenów na godzinę. U Anthropic to $0.31 łącznie. Ta opłata sesyjna $0.08 stanowi teraz 26% rachunku. Nie błąd zaokrąglenia. Ciężkie agenty robiące generowanie kodu albo głęboki research palą 1M+ tokenów na godzinę. Opłata sesyjna spada poniżej 1%. Niewidoczna.

Anthropic stawia wbudowany zakład: agenty będą coraz cięższe, nie lżejsze. Jeśli branża pójdzie w stronę efektywności tokenowej — robienia więcej z mniejszym kontekstem — session-hour staje się coraz bardziej widocznym podatkiem. Jeśli agenty pozostaną głodne, zniknie w szumie. Anthropic stawia na głodne.

Trzech vendorów, trzy filozofie rozliczeń, zero wspólnych jednostek. Nie da się ich wrzucić w ten sam arkusz bez zbudowania modelu normalizacji, a ten model wymaga założeń o obciążeniu, których jeszcze nie zmierzyłeś. Porównywanie kosztów AI w 2026 jest trudniejsze niż porównywanie kosztów chmury w 2014 — a tamtego problemu do dziś nie rozwiązaliśmy.

Więc tak to wygląda. Proste wywołania API siedzą na liczniku tokenów. Wszystko autonomiczne żyje teraz na session-hours, czystych tokenach albo cloud-compute billing, zależnie od vendora. Przesiadka oznacza naukę od nowa — nie tylko API, ale całego modelu finansowego wokół niego.

Token był uniwersalną jednostką kosztu AI przez trzy lata. Anthropic rozbił go na dwa wymiary i teraz każdy musi wybrać, w jakiej denominacji handluje.

Twoj model kosztow AI wlasnie sie rozwidlil. Oto matematyka.

Keep reading

Anthropic gra wedlug podrecznika Stripe'a. Ty jestes sprzedawca.

Anthropic uruchomił Managed Agents. Model to teraz najmniej ważna rzecz, którą sprzedają.

Multi-agentowa delegacja to schemat organizacyjny, ktorego nikt nie audytowal

Arsenal OpenAI za 122 mld dolarow: pierwsze ruchy najdrozszego startupu w historii