Podłączyłeś swojego agenta AI — program, który działa samodzielnie, wywołując zewnętrzne narzędzia — do tuzina serwerów MCP (Model Context Protocol — uniwersalny standard wtyczek dla narzędzi AI, coś jak USB, ale do danych). Przetestowałeś. Demo poszło świetnie. Wrzuciłeś na produkcję, gdzie prawdziwe systemy się sypią na prawdziwe sposoby.
A potem przyszedł pierwszy timeout narzędzia. Twój agent powtórzył to samo padające wywołanie dziewięć razy, spalił $12 w tokenach (porcje słów przetwarzane przez AI, rozliczane za użycie) i zhallucynował fałszywy wynik. Bo nic — dosłownie nic w protokole — nie powiedziało mu, że ten błąd jest permanentny.
Cztery priorytety, zero o błędach
19 kwietnia projekt MCP opublikował swoją roadmapę na 2026. Cztery priorytety: ewolucja transportu, komunikacja agentów, governance, gotowość enterprise. Taksonomia błędów — rzecz, która wysadza każdego produkcyjnego agenta — nie trafiła na listę. Nie wspomniana. Nie planowana. Nie na radarze nikogo.
To nie jest przeoczenie, które można zbyć machnięciem ręki. Oficjalna specyfikacja MCP (aktualna rewizja: 25 listopada 2025) definiuje błędy wykonania narzędzi jako isError: true plus dowolny ciąg znaków po angielsku — ta sama struktura co odpowiedź sukcesu, ale z przełączonym booleanem. Żadnego pola z kodem błędu. Żadnego nagłówka retry-after. Żadnego poziomu severity. Specyfikacja dosłownie mówi, że błędy narzędzi zawierają 'actionable feedback that language models can use to self-correct". Ten 'actionable feedback" to nieustrukturyzowane zdanie po angielsku, które LLM musi sam przeczytać i zinterpretować.
HTTP — protokół, którego używa twoja przeglądarka — rozwiązał to ponad trzydzieści lat temu. 404 znaczy 'nie istnieje". 429 znaczy 'zwolnij". 503 znaczy 'spróbuj później". Trzy cyfry. Tablica odniesień. MCP prosi probabilistyczny model językowy, żeby robił to, co powinien robić zwykły if.
Każdy klei własną taśmą
Alexey Tyurin opublikował MCP Reliability Playbook 9 marca 2026 przez Google Cloud Community. Musiał wymyślić własną taksonomię błędów — CircuitOpenError, TimeoutError, RateLimitError — jako niestandardowe typowane błędy, bo protokół nie dostarcza żadnych. Circuit breaker z 50% progiem błędów, eksponencjalny backoff z jitterem. 317 testów tylko po to, żeby narzędzia nie wywalały mu agenta. Wszystko customowe. Wszystko per serwer. Wszystko niekompatybilne z taśmą klejącą kogokolwiek innego.
W międzyczasie badacze z Polytechnique Montreal przeanalizowali 407 bugów specyficznych dla MCP w 385 repozytoriach (opublikowane 5 marca 2026) i odkryli, że obsługa odpowiedzi narzędzi to najczęstsza kategoria awarii — 66,7% ankietowanych praktyków się na to natknęło. A bug w Claude Code z 11 marca pokazał, że protokół potrafi się wysypać w jeszcze bardziej podstawowy sposób: kiedy narzędzia MCP zwracały dane w polu content bez structuredContent, Claude Code widział pustą odpowiedź i ponawiał próby w nieskończoność. Agent nie wiedział, że już dostaje poprawną odpowiedź.
Liczby nie kłamią
Badania AWS Heroes z 18 marca zmierzyły skalę zniszczeń: 97,1% narzędzi MCP ma co najmniej jeden problem z jakością opisu, a łańcuchowe wywołania narzędzi przy 95% indywidualnej skuteczności każdego dają zaledwie 85,7% niezawodności całościowej. Dodaj do tego łańcucha nieustrukturyzowaną obsługę błędów i grasz w kości z produkcyjnym ruchem.
AAIF MCP Summit 19 kwietnia w Nowym Jorku przyciągnął 1200 uczestników, a CEO Linux Foundation Jim Zemlin nazwał MCP 'Linuksem agentów". Odważne porównanie — Linux miał porządne kody błędów od pierwszego dnia.
Co powinieneś zrobić teraz
Dopóki Anthropic — właściciel protokołu — nie wypuści rewizji specyfikacji MCP z maszynowo czytelnymi typami błędów, opakowuj swoje narzędzia MCP w ustrukturyzowane koperty błędów: string error_type, boolean is_retryable i numeryczny retry_delay_seconds. Ustaw twardy budżet powtórek per narzędzie po stronie klienta. Maksymalnie trzy próby. Potem padaj głośno.
Ekosystem narzędzi agentowych odtwarza chaos obsługi błędów wczesnego weba z 10-krotną prędkością. Gdzieś między 'tool error" a '$12 spalonych tokenów" czeka trzycyfrowy kod statusu, który trzeba wymyślić. Platforma, która wyśle go pierwsza, przejmie warstwę niezawodności, od której wszyscy inni będą zależeć — tak jak 200 OK stało się niewidzialną infrastrukturą, o której nikt nie myśli.
Do tego czasu twój agent zgaduje. I nie jest w tym szczególnie dobry.




