Кожна агентна платформа тарифікує за використання. Жодна не має аварійного вимикача

Ви задеплоїли автономного агента — шматок ШІ, який виконує задачі самостійно, без вашого натискання кнопок — щоб обробляти тікети підтримки вночі. Лягли спати. Агент продовжував працювати. Лічильник продовжував крутитися. Ніхто не дивився.

Ось вам стартова позиція. А тепер проблема: «автономний» плюс «почасова оплата» дорівнює відкрита кредитна лінія без стелі, і ніхто не повідомив вашу бухгалтерію.

Кожен вендор випускає з тим самим прогалом

За один тиждень — з 8 по 15 квітня 2026 року — Anthropic і OpenAI запустили продакшн-середовища для агентів: рантайми, де ШІ-агенти працюють незалежно, з оплатою за споживання і нульовими лімітами витрат на сесію. Google мав той самий прогалину у своїй платформі вже кілька місяців. Три вендори, одна спільна сліпа пляма:

Anthropic запустив Managed Agents 8 квітня за $0.08 за годину сесії плюс витрати на токени (токени — шматки слів, які ШІ читає, приблизно ¾ англійського слова). 14 квітня з'явились Claude Code Routines з денними лімітами запусків (5 для Pro, 15 для Max, 25 для Teams) — але жодної грошової стелі на один запуск.
OpenAI оновив свій Agents SDK 15 квітня з новими функціями безпеки. SDK показує лічильники токенів, але не має параметра max_cost_usd. Єдине обмеження витрат? Загальноорганізаційний місячний ліміт — одне число на всіх користувачів і продукти.
Google тарифікує свій Vertex AI Agent Engine — який вийшов у GA в грудні 2025-го і почав виставляти рахунки в лютому 2026-го — за $0.0864 за vCPU-годину (vCPU — віртуальний зріз процесора в хмарі) без задокументованого ліміту на сесію. Він працює без захисту від перевитрат довше, ніж двоє інших взагалі існують.

Кожна платформа обмежує частоту запитів, щоб захистити свою інфраструктуру. Жодна не обмежує витрати, щоб захистити ваш гаманець.

Структурний стимул, про який ніхто не говорить

При оплаті за використання завислий агент, який три години повторює один і той самий зафейлений API-виклик, генерує стільки ж доходу, скільки й продуктивний. Вбудувати нативний аварійний вимикач — circuit breaker (механізм, який автоматично зупиняє виконання при досягненні порогу) — означає добровільно обмежити власний дохід. Математика стимулів жорстока.

Це не теорія. Звіт DEV Community від 23 березня задокументував чотири агенти LangChain (LangChain — популярний фреймворк для побудови ланцюжків ШІ-агентів), що застрягли в рекурсивному циклі зворотного зв'язку на 11 днів. Рахунок: $47 000. Спосіб виявлення: людина, що переглядала інвойс. Не алерт. Інвойс.

Окремий аналіз RunCycles від 18 березня описав дослідницького агента на GPT-4o, що увійшов у цикл повторів — 200+ викликів менш ніж за годину, $1 400 за один запуск.

Податок на саморобні рішення

Обхідні шляхи є. Ось як виглядає мінімальний захист бюджету на Python:

import time

class AgentBudget:
    def __init__(self, max_usd: float = 5.0, cost_per_1k_tokens: float = 0.005):
        self.max_usd = max_usd
        self.cost_per_1k = cost_per_1k_tokens
        self.total_tokens = 0

    def track(self, tokens_used: int):
        self.total_tokens += tokens_used
        spent = (self.total_tokens / 1000) * self.cost_per_1k
        if spent >= self.max_usd:
            raise RuntimeError(f"Budget exceeded: ${spent:.2f} >= ${self.max_usd}")
        return spent

budget = AgentBudget(max_usd=10.0)
# Обгортаємо кожен LLM-виклик:
spent = budget.track(tokens_used=3200)

Сторонні проксі на кшталт Helicone і Portkey пропонують дашборди та віртуальні ключі з бюджетними лімітами. Але кожен обхідний шлях додає саме той шар контролю, який автономні агенти мали усунути.

Як повідомив PYMNTS 15 квітня, Anthropic одночасно перевів ентерпрайз-білінг з фіксованої ставки на оплату за використання. Фредрік Філіпссон, співзасновник Redress Compliance, оцінив, що це «подвоїть або навіть потроїть витрати для активних користувачів». Більше оплати за використання, все ще жодної кнопки бюджету на сесію.

Що це означає для вас

Кожен автономний агент, якого ви деплоїте сьогодні, — це процес із root-доступом до вашого білінг-акаунту і без аналога sudo. Архітектурне рішення очевидне: ніколи не деплойте агента без обгортки витрат у вашому власному коді. Не чекайте, поки SDK додасть max_cost_usd — цей параметр з'явиться наступного дня після того, як чийсь п'ятизначний інвойс стане вірусним у X, і не раніше.

Хмарний білінговий хорор, який змусить додати цю фічу, — не гіпотетичний. Це питання коли. Єдина змінна — чия кредитка профінансує цей урок.

Кожна агентна платформа тарифікує за використання. Жодна не має аварійного вимикача

Кожен вендор випускає з тим самим прогалом

Структурний стимул, про який ніхто не говорить

Податок на саморобні рішення

Що це означає для вас

Читай далі

Парадокс агентів: менше автономії — більше користі

Три системи пам'яті AI, нуль доказів що вони реально допомагають

Вісім пісочниць і lock-in, про який вас ніхто не попередив

Діалог дозволів вашого агента — це плацебо