Ти — тімлід, і перед тобою чотири інвойси за AI-інструменти для кодингу — софт, який пише код поруч із твоїми розробниками, як дуже швидкий, але дуже дорогий джун. В одному рахунку — «seats». В іншому — «tokens». У третьому — «session-hours». У четвертому — «credits». У твоїй табличці немає жодної спільної колонки. Фінвідділ ставить питання, на які ти не можеш відповісти.

Це не мало б бути складно. Ти просто хочеш знати, який інструмент коштує менше на розробника на місяць. Але жоден вендор у світі не дасть тобі цю цифру — бо плутанина і є продуктом.

Лише за останні чотири дні ціновий хаос досяг термінальної стадії. 18 квітня материнська компанія Cursor — Anysphere — закрила раунд на $2B при оцінці в $50B — такий запас грошей дозволяє палити кеш на цінові експерименти нескінченно. Компанія продає кредити, еквівалентні долару, за $20–$200/місяць. 20 квітня GitHub просто поставив на паузу нові підписки на Copilot з фіксованою ставкою за місце, посилаючись на «sustainability» — слово, яке компанії використовують, коли юніт-економіка кровоточить. Це після тижнів гри у музичні стільці з білінг-моделями: 4 квітня OpenAI перевів Codex на токен-кредити, Anthropic запустила Managed Agents 8 квітня за $0.08 за session-hour плюс потокенна оплата плюс $10 за тисячу веб-пошуків, а Windsurf уже впровадив денні квоти ще 12 березня. Шість вендорів, шість білінг-моделей, нуль перетинів.

А тепер — частина, де твій гаманець загоряється, а сповіщення ніхто не відправляє. Кожна одиниця білінгу ховає свою пастку з витратами — і найгірша живе всередині reasoning-моделей. O-серія OpenAI та режими extended thinking від Anthropic генерують приховані reasoning-токени: внутрішній chain-of-thought, який модель продукує перед відповіддю. Ти їх не бачиш. Ти за них платиш. Дослідження Stanford та UC Berkeley від 25 березня виявило, що генерація reasoning-токенів варіюється до 9.7× між запусками одного й того ж промпту — і що рейтинг витрат між моделями може перевернутися у 28 разів залежно від того, який саме запуск ти вимірюєш. (Я розібрав це дослідження детально у вчорашньому розборі від 20 квітня — коротка версія: твій бюджетний прогноз не помилковий, він — генератор випадкових чисел.) Окремо, токенізатор Opus 4.7 від Anthropic виробляє більше токенів для ідентичного тексту, ніж його попередник — та сама ціна за токен, більше токенів на запит, як вчорашній аналіз підміни моделей показав. Кредитна система Cursor тротлить power-юзерів посеред сесії, коли вони спалюють ліміт швидких запитів. А фіксована ставка Copilot? Вона субсидує розробника, який використовує його двічі на день, за рахунок того, хто в ньому живе.

Коли намагаєшся нормалізувати все до вартості за фактичний результат — скажімо, вартість за змержений pull request (завершена зміна коду, яка пройшла рев'ю) — картина змінюється кардинально. Бенчмарки GetDX за Q1 2026, опубліковані 15 квітня, на базі 64 680 розробників показують, що користувачі Cursor роблять 4.1 PR/день проти 3.61 у Copilot. Десятикратна різниця в ціні на стікері стискається до приблизно 2–4× на основі per-outcome. Але найдешевший вендор міняється залежно від того, чи твоя команда пише 50 рядків на день чи 500.

Кожна модель ціноутворення також змінює те, як розробники реально працюють. Фіксовані seats заохочують експерименти — спробуй що завгодно, вже сплачено. Потокенний білінг карає дослідження — кожен keystroke має цінник. Session-hours нагороджують швидких агентів і карають дебагінг. Денні квоти створюють жорсткі обриви, де твій інструмент просто зупиняється посеред робочого дня.

То що робити? Твоєму відділу закупівель потрібна одна метрика: орієнтовна місячна вартість на розробника при вашому патерні використання. Жодна сторінка з прайсом цього не дасть. Єдиний чесний шлях — двотижневий паралельний тріал на вашій реальній кодовій базі з вашими реальними людьми.

Ринок AI-кодингу переклав математику на покупця. Перший вендор, який опублікує прозорий калькулятор cost-per-outcome, забере наступну хвилю ентерпрайз-контрактів. Решта ставить на те, що ви не зробите домашку. Більшість із вас не зробить.