तुमने अपने AI agent में दर्जन भर MCP servers कनेक्ट कर दिए। GitHub, Slack, Linear, Postgres, S3, web search — पूरा buffet लगा दिया। तुम्हें लगा तुम powerful हो गए। Agent को नहीं लगा।

Agent ने वो tasks fumble करने शुरू कर दिए जो पहले आराम से करता था। गलत tool pick करना। ऐसे parameters hallucinate करना जो exist ही नहीं करते। वो context भूल जाना जो तुमने अभी-अभी टाइप किया। तुमने कुछ तोड़ा नहीं — बस cooking शुरू करने से पहले इतने menus पढ़ने को दे दिए कि बेचारा confuse हो गया।

वो गणित जिसके बारे में किसी ने warn नहीं किया

14 अप्रैल को Cloudflare ने एक Enterprise MCP Reference Architecture पब्लिश की जिसमें इस problem पर actual numbers थे। MCP (Model Context Protocol) AI tools के लिए एक universal plug standard है — USB जैसा, बस agents को external services से connect करने के लिए। हर MCP tool अपने साथ एक schema लेकर आता है जो model को बताता है कि ये क्या करता है और किन parameters की ज़रूरत है। हर single turn पर model सब कुछ पढ़ता है।

जैसा हमने कल के Tool-Calling Is Dead में बताया था, Cloudflare का अपना portal सिर्फ tool descriptions पर ~9,400 tokens जला रहा था — agent के तुम्हारी actual problem को छूने से पहले। GitHub का MCP server (94 tools) ~42,000 tokens खा गया। ये numbers दोबारा बता रहा हूँ सिर्फ इसलिए कि तब से अब तक कुछ नहीं बदला। लोग बस servers प्लग करते रहे।

6 मार्च की एक benchmark ने accuracy collapse document कर दिया था: tool selection 4 focused tools के साथ ~95% से गिरकर 46 tools के साथ ~71% हो गई। छह हफ्ते बाद, Cloudflare ने enterprise scale पर यही problem confirm की। Protocol नहीं बदला। Server count बदला।

सब ठीक कर रहे हैं, कोई agree नहीं कर रहा कैसे

Cloudflare ने 16 अप्रैल को Code Mode शिप किया — tool phone book को उड़ाकर उसकी जगह typed API लगा दी। 2,500+ entry points की जगह सिर्फ दो। Tokens में 99.9% की गिरावट। Brilliant। लेकिन सिर्फ Cloudflare Workers पर चलता है। Open standard की problem को proprietary solution से solve किया। Classic move।

Atlassian ने compression का रास्ता चुना। उनका open-source mcp-compressor, जो 29 मार्च को release हुआ, GitHub MCP के 94 tools को 17,600 tokens से 500 तक squeeze कर देता है max compression पर (97% reduction)। सोचो अपने API docs को इतना minify करना कि तुम खुद नहीं पढ़ सको। Model किसी तरह अब भी पढ़ लेता है — लेकिन tradeoff real है। Atlassian की अपनी benchmarks दिखाती हैं कि max compression से parameter constraint fidelity गिर जाती है: complex tools जिनमें nested object schemas हैं, वो validation hints खो देते हैं जो models को सही invocations के लिए चाहिए। उनके docs production के लिए medium compression (80% reduction, ~3,500 tokens) recommend करते हैं और max को "exploration only" के लिए रखते हैं। सीधी बात: तुम accuracy को headroom से trade कर रहे हो और उम्मीद कर रहे हो कि model gaps भर लेगा।

Anthropic ने बिल्कुल अलग रास्ता चुना। 8 अप्रैल को उन्होंने Managed Agents लॉन्च किया $0.08/hour पर — specialized sub-agents जिनके पास narrow 5–10 tool kits हैं, एक generalist की जगह जो 50 tools में डूब रहा है। हर sub-agent सिर्फ अपने tools load करता है per turn, per-agent overhead roughly 85% कम। बहुत ज़्यादा tools का fix? ज़्यादा agents जिनके पास कम tools हों। Recursion as a service।

और फिर वो teams हैं जिन्होंने optimization को skip ही कर दिया और सीधे चीज़ें delete करना शुरू कर दिया। 12 मार्च को GitHub Copilot की engineering team ने results शेयर किए — tool count 40 से 13 करने पर 2–5 point benchmark improvement, 400ms latency drop। फरवरी में Block ने अपना Linear MCP server तीन बार rebuild किया, 30+ tools से घटाकर 2 किया। 3 अप्रैल को Phil Schmid (Hugging Face) ने pattern को एक rule में distill कर दिया: "बेरहमी से curate करो। 5 से 15 tools per server। एक server, एक काम।" कोई compression algorithm नहीं। कोई discovery layer नहीं। बस discipline।

असली problem Protocol में है

यहाँ वो बात जो इनमें से कोई solution fix नहीं करता: हर एक या तो proprietary है, platform-specific है, या MCP में एक hole का workaround है।

Cloudflare Code Mode Workers पर चलता है। Managed Agents Claude के साथ चलते हैं। Atlassian का compressor सबसे portable option है — और वो भी एक ऐसे protocol पर jugaad है जो बिना table of contents के ship हो गया।

Anthropic ने MCP को universal standard के तौर पर पेश किया था। सबको connect करने वाला एक connector। इसकी जगह, हम universal standard के ऊपर vendor-specific discovery layers बना रहे हैं ताकि ये scale पर actually काम करे।

ये फिल्म पहले भी देखी है। '90s में CORBA — एक "universal" object protocol जिसने vendor-specific bridges की पूरी industry खड़ी कर दी बस usable बनाने के लिए। Interface Repository ने dynamic discovery का वादा किया था; practice में हर ORB vendor ने अपना अलग ship किया। 2000s में SOAP — enterprise "standard" जिसको सबने चुपचाप REST से bypass कर दिया क्योंकि WSDL files इतनी बड़ी हो गईं कि पढ़ना impossible था। JavaScript modules — AMD, CommonJS, UMD, ES modules आने से पहले पूरा एक दशक fragmentation। Pattern कभी नहीं बदलता: open standard अधूरा ship होता है, vendors proprietary layers से gaps भरते हैं, ecosystem fragment होता है जब तक कोई standard fix करे या मार डाले।

MCP अभी vendor gap-filling phase में है। Cloudflare, Anthropic, Atlassian, और दर्जन भर छोटे players — सब अपना-अपना answer बना रहे हैं एक ही missing feature के लिए: dynamic tool discovery। Protocol को ये natively handle करना चाहिए। नहीं करता। तो हमें छह competing solutions मिलते हैं और इसे "ecosystem" कह देते हैं।

Optimistic reading: competition innovation drive करती है, सबसे अच्छा approach जीतता है, standard उसे absorb कर लेता है। Realistic reading — जिस पर मैं पैसे लगाऊँगा — ये है कि बड़े model providers अपनी preferred discovery को default agent frameworks में bake कर देंगे, और "universal" का मतलब चुपचाप "Claude के साथ चलता है" या "GPT के साथ चलता है" हो जाएगा, दोनों के साथ नहीं। USB-C जिसमें हर company का अपना charging protocol — बिल्कुल वही कहानी दोबारा।

आज तुम actually क्या करो

अपने MCP connections audit करो। जो servers तुम्हारे agent ने एक हफ्ते से call नहीं किए, हटा दो। बाकी tools को task domain के हिसाब से group करो। Token usage measure करो पहले और बाद में — तुम हैरान हो जाओगे कितना headroom वापस मिलता है।

MCP को और servers की ज़रूरत नहीं है। इसे एक package manager moment चाहिए — dynamic discovery और lazy loading जो tools को imports की तरह treat करे, हर prompt में ठूँसे गए global variables की तरह नहीं। तब तक, less is literally more। और सबसे अच्छे agents वो नहीं होंगे जिनके पास सबसे ज़्यादा tools हैं — वो होंगे जिन्होंने "ना" कहना सीखा।