Сьогодні вранці ми розібрали Managed Agents від Anthropic як платформну гру — чотири шари залежності, кожен липкіший за попередній. Але модель тарифікації, закопана в тому запуску, заслуговує на окремий розтин. Бо 8 квітня ваша модель витрат на ШІ роздвоїлась, а фінансовий відділ ще не в курсі.
Отже, розвилка. Класичні API-виклики — запит увійшов, відповідь вийшла — досі тарифікуються за токени, як і раніше. Але все, що крутиться в циклах, робить повтори, запускає інструменти чи думає автономно, тепер несе другий рахунок: $0.08 за сесію-годину, з точністю до мілісекунди. Два лічильники одночасно. Anthropic — перший великий вендор, який так тарифікує агентні обчислення. OpenAI та Google пішли в зовсім інших напрямках.
Прогонімо однакове навантаження через усіх трьох. Реалістична агентна задача: код-рев'ю середнього репозиторію. Година роботи. Агент читає файли, запускає тести, зациклюється на помилках, пише підсумок. На виході — приблизно 500K вхідних токенів і 100K вихідних.
Anthropic (Sonnet 4.6): Сесійний рантайм — $0.08. Вхідні токени по $3/M: $1.50. Вихідні по $15/M: $1.50. Разом: $3.08. Плата за сесію — 2.6% рахунку.
OpenAI (GPT-5.2-Codex): Без плати за сесію. Вхідні по $1.75/M: $0.88. Вихідні по $14/M: $1.40. Разом: $2.28. Чисті токени. Нічого більше.
Google (Vertex AI Agent Engine): Посекундна тарифікація обчислень — vCPU та пам'ять, як у хмарного контейнера. Стандартний агентний рантайм коштує приблизно $3–$8 на годину залежно від конфігурації, плюс токени Gemini зверху. Підсумок сильно гуляє, але зазвичай вписується в існуючі GCP-зобов'язання. Та сама задача може обійтися в $5–$10 — або фактично безкоштовно, якщо ви вже закомітили достатньо GCP-бюджету на квартал.
На малих масштабах OpenAI виграє по чистій вартості. На масштабі картина перевертається.
Закладіть 10 000 агенто-годин на місяць. Оркестраційний шар Anthropic — $800 фіксовано, один рядок, який CFO може затвердити без лекції з токеноміки. Рахунок OpenAI — чисто змінний: кожен токен, кожен повтор, кожна мить, коли агент вирішив передумати, рухає цифру. Без підлоги, без стелі. Агентні витрати Google зникають у вашому хмарному контракті — це або фіча, або пастка, залежно від того, що написано дрібним шрифтом.
Точка беззбитковості залежить від токеножерливості ваших агентів. Легкі агенти — моніторинг, роутинг, перевірка статусів — можуть з'їдати 50K токенів на годину. На Anthropic це $0.31 разом. Плата за сесію — вже 26% рахунку. Не похибка округлення. Важкі агенти, що генерують код або копають глибокий ресерч, спалюють 1M+ токенів на годину. Плата за сесію падає нижче 1%. Невидима.
Anthropic робить вбудовану ставку: агенти стануть важчими, а не легшими. Якщо індустрія піде в бік токенової ефективності — робити більше з меншим контекстом — сесія-година стає дедалі помітнішим податком. Якщо агенти залишаться ненажерливими, вона зникає в шумі. Anthropic ставить на ненажерливих.
Три вендори, три філософії тарифікації, нуль спільних одиниць виміру. Ви не можете засунути їх в одну таблицю без нормалізаційної моделі, а ця модель потребує припущень про навантаження, які ви ще не виміряли. Порівнювати витрати на ШІ-вендорів у 2026-му складніше, ніж порівнювати хмарні витрати в 2014-му — а ту задачу ми досі не розв'язали.
Отже, підсумок. Прості API-виклики залишаються на токеновому лічильнику. Все автономне тепер живе на сесія-годинах, чистих токенах або хмарних обчисленнях — залежно від вендора. Перехід означає переучування не лише API, а й усієї фінансової моделі навколо нього.
Токен був універсальною одиницею вартості ШІ три роки. Anthropic розщепив його на два виміри, і тепер кожен мусить обирати, в якій валюті торгує.



