Ви підключили свого AI-агента — програму, що діє самостійно, викликаючи зовнішні інструменти для виконання завдань — до десятка MCP-серверів (Model Context Protocol — універсальний стандарт підключення AI-інструментів, як USB, тільки для даних). Протестували. Демо пройшло на ура. Викотили в продакшн, де реальні системи ламаються по-справжньому.
А потім трапився перший таймаут. Агент повторив той самий запит дев'ять разів, спалив $12 на токенах (шматки тексту, які AI обробляє і за які ви платите), і вигадав фейковий результат. Бо ніщо — буквально ніщо в протоколі — не повідомило йому, що помилка перманентна.
Чотири пріоритети, жодного про помилки
19 квітня проєкт MCP опублікував свій роадмап на 2026 рік. Чотири пріоритети: еволюція транспорту, комунікація агентів, governance, enterprise-готовність. Таксономія помилок — те, що ламає кожного продакшн-агента — не потрапила до списку. Не згадана. Не запланована. Нікому й на думку не спала.
Це не та дрібниця, на яку можна махнути рукою. Офіційна специфікація MCP (поточна редакція: 25 листопада 2025) визначає помилки виконання інструментів як isError: true плюс довільний текстовий рядок англійською — та сама структура, що й у успішної відповіді, тільки з перемкнутим булевим значенням. Жодного поля з кодом помилки. Жодного заголовка retry-after. Жодного рівня серйозності. Специфікація буквально каже, що помилки інструментів містять «actionable feedback, який мовні моделі можуть використовувати для самокорекції». Цей «actionable feedback» — неструктуроване речення англійською, яке LLM має прочитати й інтерпретувати самотужки.
HTTP — протокол, яким користується ваш браузер — розв'язав це понад тридцять років тому. 404 — «не існує». 429 — «притримай коней». 503 — «спробуй пізніше». Три цифри. Таблиця відповідностей. MCP просить імовірнісну мовну модель робити те, з чим має справлятися if-statement.
Кожен клеїть власну ізоленту
Олексій Тюрін опублікував MCP Reliability Playbook 9 березня 2026 року через Google Cloud Community. Він мусив винайти власну таксономію помилок — CircuitOpenError, TimeoutError, RateLimitError — як кастомні типізовані помилки, бо протокол не надає жодних. Circuit breaker із порогом 50% помилок, експоненційний backoff із jitter. 317 тестів лише для того, щоб інструменти не клали його агента. Все кастомне. Все per-server. Все несумісне з ізолентою інших.
Тим часом дослідники з Polytechnique Montreal проаналізували 407 MCP-специфічних багів у 385 репозиторіях (публікація від 5 березня 2026) і з'ясували, що обробка відповідей інструментів — найчастіша категорія збоїв: 66,7% опитаних розробників стикалися з нею. А баг Claude Code від 11 березня показав, що протокол ламається ще примітивніше: коли MCP-інструменти повертали дані в полі content без structuredContent, Claude Code сприймав порожню відповідь і ретраїв нескінченно. Агент не знав, що вже отримує правильну відповідь.
Цифри не брешуть
Дослідження AWS Heroes від 18 березня оцифрувало масштаб шкоди: 97,1% MCP-інструментів мають щонайменше одну проблему з якістю опису, а ланцюжки викликів із 95% успішності кожного окремого дають лише 85,7% загальної надійності. Додайте до цього ланцюжка неструктуровану обробку помилок — і ви граєте в рулетку з продакшн-трафіком.
AAIF MCP Summit 19 квітня в Нью-Йорку зібрав 1 200 учасників, а CEO Linux Foundation Джим Землін назвав MCP «Linux для агентів». Сміливе порівняння — Linux поставлявся з нормальними кодами помилок з першого дня.
Що робити прямо зараз
Поки Anthropic — власник протоколу — не випустить ревізію специфікації MCP з машиночитаними типами помилок, обгортайте свої MCP-інструменти структурованими error-конвертами: рядок error_type, булеве is_retryable та числове retry_delay_seconds. Встановіть жорсткий бюджет ретраїв per-tool на стороні клієнта. Максимум три спроби. Потім — гучний fail.
Екосистема інструментів для агентів повторює хаос обробки помилок ранньої вебери, тільки в 10 разів швидше. Десь між «tool error» і «$12 спалених токенів» чекає свого винахідника трицифровий код статусу. Платформа, яка відправить його першою, отримає рівень надійності, від якого залежатимуть усі інші — так само, як 200 OK став невидимою інфраструктурою, про яку ніхто не думає.
А поки що ваш агент гадає. І гадає він так собі.




