Парадокс агентів: менше автономії — більше користі

Кожен AI-вендор у квітні обіцяв вам одну й ту саму мрію: автономні агенти — маленькі цифрові працівники, які пишуть код, закривають тікети й відповідають на листи клієнтів, поки ви зосереджуєтесь на «стратегії». Anthropic, OpenAI, Google — усі троє випустили агентні платформи протягом двох тижнів. Ваша стрічка в LinkedIn виглядає як ярмарок вакансій для роботів.

А тепер те, про що ніхто не каже з головної сцени: ваш бос уже написав у Slack із питанням, коли ВАША команда впроваджує агентів. Демо виглядають розкішно — агент від баг-репорту до pull request за хвилини, зал аплодує так, ніби ніколи не бачив bash-скрипт. Але що насправді відбувається після того, як демо завершується і камери вимикаються?

Три запуски прилетіли один за одним. Anthropic випустили Managed Agents 8 квітня — хмарні API для агентів (спосіб запускати та контролювати агентів віддалено) за $0.08 за годину сесії. OpenAI оновили свій Agents SDK 15 квітня з нативним sandbox execution — агенти виконують код у герметичному контейнері, щоб нічого не зламати зовні. А Google Cloud Next стартував 22 квітня з кейноутом «The Agentic Cloud» та презентацією ADK (Agent Development Kit), який вийшов раніше цього місяця. Google вбудували human-in-the-loop як базову фічу з першого дня — ставиш агента на паузу посеред задачі, людина апрувить, агент продовжує.

Ранні адоптери кинулися одразу. Rakuten розгорнули спеціалізованих агентів у п'яти відділах — продукт, продажі, маркетинг, фінанси, HR — кожен запустився менш ніж за тиждень. CTO Asana повідомив, що фічі шипляться «драматично швидше». Notion підключили Claude безпосередньо у робочі простори для паралельної обробки задач. А Sentry? Sentry пішли ва-банк: їхній агент від зафлаженого бага до відкритого pull request без жодного втручання людини. Повна автономія. Вендорська мрія стала реальністю.

Але ось некомфортна частина. Якщо ви стежили за незалежними дослідженнями цього місяця — а цей канал цитував їх достатньо, щоб постійні читачі могли назвати цифри напам'ять — патерн ніколи не змінюється. AI-код містить у 1,7× більше дефектів. PR зростають на 20%, а інциденти — на 23,5%. Розробники видаляють п'яту частину прийнятого AI-коду і суттєво переписують ще 7%. Gartner прогнозує, що 40% агентних проєктів помруть до 2027 року. Більше output — гірші outcomes. Кожне окреме дослідження. 😹

Андрей Карпаті сказав це 3 квітня — до того, як будь-яка з цих трьох платформ вийшла. «Індустрія робить занадто великий стрибок і намагається прикинутися, що це дивовижно, а це не так.» Три тижні й три запуски потому — ніщо його не спростувало.

Це створює структурний розрив між маркетингом і реальністю. Вендори змагаються за максимальну автономію, бо це красиво виглядає на сцені. Але продакшн-дані кажуть протилежне: вузький скоуп перемагає широкі можливості. Read-heavy воркфлоуи (де агенти аналізують, але рідко модифікують) перемагають write-heavy. Людські чекпоїнти перед будь-якою значущою дією перемагають повний автопілот. Навіть «повністю автономний» успіх Sentry працює саме тому, що баг-тріаж-до-PR — це принципово обмежений домен, а не тому, що автономія сама по собі виграє. 😾

Google, можливо, реально це розуміє. Їхній ADK постачається з human-in-the-loop як дефолтний шлях, а не як щось додане на останок. Як написав Джон Фур'є з SiliconANGLE 20 квітня: «Фічі сидять поверх платформ. Операційні системи визначають платформу.» Реальна конкуренція — не хто збудує найавтономнішого агента, а хто збудує найкращий control plane.

Тож коли бос запитає про агентів — не пересилайте йому кліп з кейноуту. Поставте одне питання про будь-яку платформу: наскільки легко побудувати жорстко обмеженого агента з чіткими межами скоупу, read-only за замовчуванням і обов'язковим людським апрувом перед будь-якою значущою дією? Якщо відповідь «ну, це можна налаштувати...» — розвертайтесь і йдіть. Якщо це дефолт — можливо, є з чим працювати. 😼

Найрозумніший агент не виграє платформну війну. Найконтрольованіший — виграє. І це інвертує пріоритети роадмапу кожного вендора. 🐈

Парадокс агентів: менше автономії — більше користі

Читай далі

Anthropic побудувала платформу поверх платформ, що її фінансують. Орендодавці щойно помітили

Три агентні платформи, три різні біологічні види

Невидимi агенти, видимий закон: 102 днi до того, як ЄС змусить ШІ назвати себе

У вашого AI-агента немає клавіші Backspace