Ти підключив десяток MCP-серверів до свого AI-агента. GitHub, Slack, Linear, Postgres, S3, веб-пошук — повний шведський стіл. Твій агент теоретично може торкнутися всього стеку. Ти відчуваєш силу. Агент — ні.

Він почав валити завдання, які раніше клацав як насіння. Обирає не той інструмент. Галюцинує параметри, яких не існує. Забуває контекст, який ти ввів буквально секунду тому. Ти нічого не зламав — просто підсунув йому стільки меню, що він не встигає їх прочитати перш ніж почати готувати.

Математика, про яку ніхто не попередив

14 квітня Cloudflare опублікував Enterprise MCP Reference Architecture, де вперше озвучив конкретні цифри проблеми. MCP (Model Context Protocol) — це універсальний стандарт підключення інструментів до AI, щось на кшталт USB, але для з'єднання агентів із зовнішніми сервісами. Кожен MCP-інструмент несе з собою схему, яка пояснює моделі, що він робить і які параметри приймає. Кожен хід модель читає усі ці схеми.

Як ми розбирали у вчорашньому Tool-Calling Is Dead, портал самого Cloudflare спалював ~9 400 токенів лише на описи інструментів — ще до того, як агент торкнувся твоєї задачі. GitHub MCP-сервер (94 інструменти) з'їдав ~42 000 токенів. Ці цифри варто повторити лише тому, що з того часу нічого не змінилося. Люди просто продовжували підключати сервери.

Бенчмарк від 6 березня уже задокументував обвал точності: вибір інструменту впав з ~95% при 4 сфокусованих інструментах до ~71% при 46. Через шість тижнів Cloudflare підтвердив ту саму проблему на ентерпрайз-масштабі. Протокол не змінився. Кількість серверів — змінилася.

Усі лагодять, ніхто не домовився як

Cloudflare випустив Code Mode 16 квітня — знищив телефонну книгу інструментів і замінив її типізованим API. Дві точки входу замість 2 500+. Токени впали на 99,9%. Геніально. І прив'язано до Cloudflare Workers. Вони вирішили проблему відкритого стандарту пропрієтарним рішенням. Класика.

Atlassian пішов шляхом стиснення. Їхній open-source mcp-compressor, випущений 29 березня, стискає 94 інструменти GitHub MCP з 17 600 токенів до 500 при максимальному стисненні (зниження на 97%). Уяви, що мініфікуєш свою API-документацію настільки, що сам не можеш її прочитати. Модель якимось чином досі може — але компроміс реальний. Власні бенчмарки Atlassian показують, що максимальне стиснення вбиває точність обмежень параметрів: складні інструменти з вкладеними об'єктними схемами втрачають підказки валідації, потрібні моделі для коректних викликів. Їхня документація рекомендує середнє стиснення (80% зниження, ~3 500 токенів) для продакшену, а максимальне — лише для "дослідження". Чесна версія: ти міняєш точність на простір і сподіваєшся, що модель заповнить прогалини.

Anthropic обрав зовсім інший шлях. 8 квітня вони запустили Managed Agents за $0,08/годину — спеціалізовані суб-агенти з вузькими наборами по 5–10 інструментів замість одного генераліста, що тоне у 50. Кожен суб-агент завантажує лише свої інструменти на кожному ході, знижуючи оверхед приблизно на 85%. Рішення проблеми "занадто багато інструментів"? Більше агентів з меншою кількістю інструментів у кожного. Рекурсія як сервіс.

А ще є команди, які пропустили оптимізацію і просто почали видаляти. 12 березня інженерна команда GitHub Copilot поділилася результатами скорочення кількості інструментів з 40 до 13 — покращення бенчмарків на 2–5 пунктів, зниження латентності на 400 мс. У лютому Block тричі перебудував свій Linear MCP-сервер, зменшивши з 30+ інструментів до 2. 3 квітня Філ Шмід (Hugging Face) дистилював патерн в одне правило: "Курируй безжально. 5–15 інструментів на сервер. Один сервер — одна задача." Без алгоритмів стиснення. Без шарів виявлення. Просто дисципліна.

Справжня проблема — в самому протоколі

Ось що жодне з цих рішень не чіпає: кожне є пропрієтарним, платформо-залежним або костилем для діри в самому MCP.

Cloudflare Code Mode працює на Workers. Managed Agents працюють з Claude. Компресор від Atlassian — найпортативніший варіант, але все одно ізолента на протоколі, який відвантажили без змісту.

Anthropic позиціонували MCP як універсальний стандарт. Єдиний конектор, щоб правити всіма. Натомість ми будуємо вендор-специфічні шари виявлення поверх цього універсального стандарту, щоб він реально працював на масштабі.

Ми вже бачили цей фільм. CORBA в 90-х — "універсальний" об'єктний протокол, що породив цілу індустрію вендор-специфічних мостів, аби зробити його хоч якось юзабельним. Interface Repository обіцяв динамічне виявлення; на практиці кожен ORB-вендор пиляв своє. SOAP у 2000-х — ентерпрайзний "стандарт", який усі тихо обходили через REST, бо WSDL-файли розросталися до нечитабельних монстрів. JavaScript-модулі — AMD, CommonJS, UMD, ціле десятиліття фрагментації до появи ES modules. Патерн не змінюється: відкритий стандарт виходить недопрацьованим, вендори заповнюють прогалини пропрієтарними шарами, екосистема фрагментується, поки хтось не полагодить стандарт або не вб'є його.

MCP зараз у фазі вендорного латання дірок. Cloudflare, Anthropic, Atlassian і десяток гравців менше — кожен будує свою відповідь на ту саму відсутню фічу: динамічне виявлення інструментів. Протокол має обробляти це нативно. Він цього не робить. Тому ми отримуємо шість конкуруючих рішень і називаємо це екосистемою.

Оптимістичне прочитання: конкуренція стимулює інновації, найкращий підхід перемагає, стандарт його поглинає. Реалістичне — те, на яке я б поставив — великі провайдери моделей запечуть свій улюблений метод виявлення в дефолтні агентні фреймворки, і "універсальний" тихо почне означати "працює з Claude" або "працює з GPT", але не з обома. USB-C з вендорськими протоколами зарядки — дежавю в чистому вигляді.

Що реально робити сьогодні

Проведи аудит своїх MCP-підключень. Видали сервери, до яких агент не звертався протягом тижня. Згрупуй інструменти, що залишились, за доменами задач. Виміряй використання токенів до і після — здивуєшся, скільки простору звільниш.

MCP не потрібно більше серверів. Йому потрібен момент пакетного менеджера — динамічне виявлення та ліниве завантаження, які ставляться до інструментів як до імпортів, а не як до глобальних змінних, впихнутих у кожен промпт. А поки — менше це буквально більше. І найкращі агенти будуть не ті, у кого найбільше інструментів, а ті, що навчилися казати "ні".