तुमने अपने AI agent को — एक प्रोग्राम जो खुद से काम करता है, external tools call करके — एक दर्जन MCP (Model Context Protocol — AI tools के लिए एक universal plug standard, जैसे USB लेकिन data के लिए) servers से जोड़ दिया। टेस्ट किया। Demo शानदार रहा। Production में भेज दिया, जहाँ असली systems असली तरीकों से टूटते हैं।

फिर पहला tool timeout आया। तुम्हारे agent ने वही failing call नौ बार retry किया, $12 tokens (word-chunks जो AI process करता है, हर use पर बिल आता है) में फूंक दिए, और एक fake result hallucinate कर दिया। क्योंकि protocol में — literally कुछ भी नहीं — जो बताए कि ये error permanent है।

चार priorities, errors के बारे में ज़ीरो

19 अप्रैल को MCP project ने अपना 2026 roadmap publish किया। चार priorities: transport evolution, agent communication, governance, enterprise readiness। Error taxonomy — वो चीज़ जो हर production agent को तोड़ती है — list में नहीं है। mention नहीं। plan नहीं। किसी के radar पर नहीं।

ये कोई ऐसी चूक नहीं जिसे कंधे उचका कर टाल दो। Official MCP specification (current revision: 25 नवंबर, 2025) tool execution errors को isError: true plus एक free-text English string के रूप में define करती है — successful response जैसा ही structure, बस एक boolean flip हुआ है। कोई error code field नहीं। कोई retry-after header नहीं। कोई severity level नहीं। Spec literally कहती है कि tool errors में "actionable feedback होता है जो language models self-correct करने के लिए use कर सकते हैं।" वो "actionable feedback" एक unstructured English sentence है जिसे LLM को खुद पढ़कर समझना है।

HTTP — वो protocol जो तुम्हारा browser use करता है — ने ये तीस साल पहले solve कर लिया था। 404 मतलब "exists नहीं करता।" 429 मतलब "speed कम करो।" 503 मतलब "बाद में try करो।" तीन digits। एक lookup table। MCP एक probabilistic language model से वो करवा रहा है जो एक if-statement को करना चाहिए।

हर कोई अपना jugaad बना रहा है

Alexey Tyurin ने 9 मार्च, 2026 को Google Cloud Community के through एक MCP Reliability Playbook publish की। उन्हें अपनी खुद की error taxonomy बनानी पड़ी — CircuitOpenError, TimeoutError, RateLimitError — custom typed errors के रूप में, क्योंकि protocol कुछ provide नहीं करता। Circuit breaker 50% error threshold के साथ, exponential backoff with jitter। 317 tests सिर्फ इसलिए कि tools उनके agent को crash न करें। सब custom। सब per-server। सब बाकी सबके jugaad से incompatible।

इसी बीच, Polytechnique Montreal के researchers ने 385 repositories में 407 MCP-specific bugs analyze किए (5 मार्च, 2026 को publish) और पाया कि tool response handling सबसे frequent fault category थी — survey किए गए 66.7% practitioners ने इसे face किया था। और 11 मार्च का एक Claude Code bug दिखाता है कि protocol और भी basic तरीके से टूट रहा है: जब MCP tools content field में data return करते थे बिना structuredContent के, Claude Code इसे empty response समझता था और infinitely retry करता रहता था। Agent को पता ही नहीं था कि उसे सही answer पहले से मिल रहा है।

Numbers झूठ नहीं बोलते

AWS Heroes research (18 मार्च) ने नुकसान quantify किया: 97.1% MCP tools में कम से कम एक description quality issue है, और chained tool calls 95% individual success rate पर भी overall सिर्फ 85.7% reliability देते हैं। इसमें unstructured error handling जोड़ दो, और तुम production traffic के साथ पासे फेंक रहे हो।

19 अप्रैल को New York में AAIF MCP Summit में 1,200 लोग आए और Linux Foundation के CEO Jim Zemlin ने MCP को "agents का Linux" कहा। बड़ी comparison — Linux ने पहले दिन से proper error codes ship किए थे।

अभी क्या करना चाहिए

जब तक Anthropic — protocol का owner — machine-readable error types के साथ MCP spec revision ship नहीं करता, अपने MCP tools को structured error envelopes से wrap करो: एक string error_type, एक boolean is_retryable, और एक numeric retry_delay_seconds। Client side पर per-tool retry budget hard set करो। Maximum तीन attempts। फिर loudly fail करो।

Agent tool ecosystem early web का error-handling chaos 10x speed पर replay कर रहा है। "tool error" और "$12 जले हुए tokens" के बीच कहीं एक three-digit status code invent होने का इंतज़ार कर रहा है। जो platform इसे पहले ship करेगा, वो उस reliability layer का मालिक बनेगा जिस पर बाकी सब depend करेंगे — जैसे 200 OK invisible infrastructure बन गया जिसके बारे में कोई सोचता भी नहीं।

तब तक, तुम्हारा agent अंदाज़े लगा रहा है। और अंदाज़े लगाने में वो कोई champion नहीं है।