Wdrożyłeś autonomicznego agenta — kawałek AI, który sam ogarnia zadania bez twojego klikania — żeby przetwarzał zgłoszenia supportowe w nocy. Poszedłeś spać. Agent pracował dalej. Licznik kręcił się dalej. Nikt nie patrzył.
To jest punkt wyjścia. A teraz problem: "autonomiczny" plus "rozliczany za zużycie" równa się otwarta linia kredytowa bez limitu, a nikt nie powiedział o tym twojemu działowi finansów.
Każdy dostawca wysyła tę samą dziurę
W ciągu jednego tygodnia — od 8 do 15 kwietnia 2026 — Anthropic i OpenAI uruchomiły produkcyjne środowiska uruchomieniowe dla agentów, czyli platformy, na których agenty AI działają samodzielnie, z naliczaniem opłat za zużycie i zerowym limitem wydatków na sesję. Google miał tę samą lukę wbudowaną w swoją platformę od miesięcy. Trzech dostawców, jedno wspólne ślepe pole:
- Anthropic uruchomił Managed Agents 8 kwietnia w cenie $0.08 za godzinę sesji plus koszty tokenów (tokeny — porcje tekstu czytane przez AI, mniej więcej ¾ angielskiego słowa). 14 kwietnia pojawiły się Claude Code Routines z dziennymi limitami uruchomień (5 dla Pro, 15 dla Max, 25 dla Teams) — ale bez limitu kwotowego na uruchomienie.
- OpenAI zaktualizował swój Agents SDK 15 kwietnia o nowe funkcje bezpieczeństwa. SDK udostępnia liczniki tokenów, ale nie ma parametru
max_cost_usd. Jedyny limit wydatków? Miesięczny limit na całą organizację — jedna liczba dzielona między wszystkich użytkowników i produkty. - Google wycenia swój Vertex AI Agent Engine — który wszedł do GA w grudniu 2025 i zaczął naliczać opłaty w lutym 2026 — na $0.0864 za godzinę vCPU (vCPU — wirtualny kawałek procesora w chmurze) bez udokumentowanego limitu na sesję. Działa bez zabezpieczenia budżetowego dłużej niż pozostałe dwie platformy w ogóle istnieją.
Każda platforma limituje częstotliwość zapytań, żeby chronić swoją infrastrukturę. Żadna nie limituje wydatków, żeby chronić twój portfel.
Strukturalna zachęta, o której nikt nie mówi
Przy rozliczeniu za zużycie zacięty agent, który przez trzy godziny powtarza to samo nieudane wywołanie API, generuje taki sam przychód jak ten, który faktycznie działa. Zbudowanie natywnego wyłącznika awaryjnego — circuit breakera (mechanizmu, który automatycznie zatrzymuje wykonywanie po przekroczeniu progu) — oznacza dobrowolne ucięcie własnych przychodów. Matematyka motywacji jest brutalna.
To nie teoria. Raport z DEV Community z 23 marca udokumentował cztery agenty LangChain (LangChain — popularny framework do budowania łańcuchów agentów AI) zablokowane w rekurencyjnej pętli zwrotnej przez 11 dni. Rachunek: $47 000. Metoda wykrycia: człowiek przeglądający fakturę. Nie alert. Faktura.
Osobna analiza RunCycles z 18 marca opisała agenta badawczego GPT-4o, który wszedł w pętlę ponawiania — ponad 200 wywołań w mniej niż godzinę, $1 400 za pojedyncze uruchomienie.
Podatek od samodzielności
Obejścia istnieją. Tak wygląda najprostszy możliwy zabezpieczacz kosztowy w Pythonie:
import time
class AgentBudget:
def __init__(self, max_usd: float = 5.0, cost_per_1k_tokens: float = 0.005):
self.max_usd = max_usd
self.cost_per_1k = cost_per_1k_tokens
self.total_tokens = 0
def track(self, tokens_used: int):
self.total_tokens += tokens_used
spent = (self.total_tokens / 1000) * self.cost_per_1k
if spent >= self.max_usd:
raise RuntimeError(f"Budget exceeded: ${spent:.2f} >= ${self.max_usd}")
return spent
budget = AgentBudget(max_usd=10.0)
# Opakowujesz każde wywołanie LLM:
spent = budget.track(tokens_used=3200)
Proxy firm trzecich, takie jak Helicone i Portkey, oferują dashboardy i wirtualne klucze z limitami budżetowymi. Ale każde obejście dodaje dokładnie tę warstwę nadzoru, którą autonomiczne agenty miały eliminować.
Jak donosi PYMNTS z 15 kwietnia, Anthropic jednocześnie przeszedł z rozliczenia ryczałtowego na rozliczenie za zużycie dla klientów enterprise. Fredrik Filipsson, współzałożyciel Redress Compliance, oszacował, że to "podwoi lub nawet potroi koszty dla intensywnych użytkowników". Więcej naliczania za zużycie, wciąż bez gałki budżetowej na sesję.
Co to oznacza dla ciebie
Każdy autonomiczny agent, którego dziś wdrażasz, to proces z rootem do twojego konta rozliczeniowego i bez odpowiednika sudo. Decyzja architektoniczna jest oczywista: nigdy nie wdrażaj agenta bez wrappera kosztowego we własnym kodzie. Nie czekaj, aż SDK doda max_cost_usd — ten parametr pojawi się dzień po tym, jak czyjś pięciocyfrowy rachunek stanie się viralem na X, nie wcześniej.
Horror story z chmurowych rachunków, który wymusi tę funkcję, nie jest hipotetyczny. To kwestia kiedy. Jedyna zmienna to czyja karta kredytowa sfinansuje tę lekcję.




