तुमने अपने monolithic agent को — एक प्रोग्राम जो तुम्हारी तरफ से काम करता है — research sub-agent और code sub-agent में तोड़ दिया, बिल्कुल वैसे जैसे SDK docs ने suggest किया था। Delegation! Division of labor! Modern management theory, बस AI के लिए। क्या गलत हो सकता है।
Production में, बहुत कुछ। Code sub-agent खुशी-खुशी उन constraints को ignore कर देता है जो research sub-agent ने discover की थीं। Parent agent कंधे उचकाता है। तुम logs घूर रहे हो यह सोचते हुए कि point A से point B के बीच आधा context — वो सारी information जो AI को अपना काम करने के लिए चाहिए — कहाँ गायब हो गया। Multi-agent telephone game में स्वागत है।
तीन Platforms, तीन तरीके Data खोने के
9 से 17 अप्रैल 2026 के बीच, तीनों बड़े AI platforms ने sub-agent delegation — एक AI का दूसरे AI को काम सौंपना — को first-class feature के रूप में ship या update किया:
- 9 अप्रैल: Anthropic ने Managed Agents लॉन्च किया public beta में। हर sub-agent को एक fresh session मिलता है — एक साफ conversation slate — plus एक instruction string।
- 15 अप्रैल: OpenAI ने अपना Agents SDK अपडेट किया sandboxed sub-agent routing के साथ। Default behavior: पूरी conversation history अगले agent को pass करो।
- 17 अप्रैल: Google ADK (Agent Development Kit), जिसने मार्च के अंत में multi-agent support ship किया था, ने अपने multi-agent docs और session state model अपडेट किया — basically एक shared whiteboard जहाँ agents एक-दूसरे के लिए notes लिखते हैं। उनके अपने docs में यह gem है: "the Root Agent is effectively out of the loop."
तीन platforms। तीन incompatible mechanisms। शून्य documentation इस बारे में कि handoff boundary पर actually क्या खोता है।
Telephone Game, अब Numbers में
यहाँ देखो कि जब Agent A, Agent B को delegate करता है तो हर platform context कैसे pass करता है:
# OpenAI: HandoffInputData से filtered message list pass करता है
class HandoffInputData:
input_history: list # full chat history, filterable
pre_handoff_items: list
new_items: list
# Default: सब कुछ pass होता है।
# लेकिन input guardrails (safety filters) ONLY
# पहले agent पर apply होते हैं। बाकी बिना guard के चलते हैं।
# Anthropic: हर agent के लिए brand-new session शुरू करता है
# POST /v1/sessions → fresh context, clean slate
# "brains can pass hands to one another"
# ...लेकिन नया brain selective amnesia के साथ शुरू होता है
# Google ADK: shared state dictionary
session.state["research_results"] = findings
# दूसरा agent key पढ़ता है। अगर exist करती है।
# Parallel execution? Race conditions (दो agents
# एक ही key पर simultaneously लिखना) तुम्हारी problem है।
Decay theoretical नहीं है। एक फरवरी 2026 UC Berkeley study जिसने 1,600+ traces analyze किए — सात agent frameworks में — failure rates 86.7% तक मिलीं। XTrace analysis ने दिखाया कि एक research agent 3,000 useful tokens produce करता है — word-chunks जो AI process करता है — जो 40,000 tokens के total context में दबे होते हैं। Handoff पर 93% noise ratio। Study ने failures को तीन categories में बाँटा: context loss (information का agents के बीच सीधा गायब होना), context corruption (information पहुँचती है लेकिन semantically distorted), और context dilution (useful information noise में डूबी हुई)। एक मार्च 2026 Google DeepMind paper ने delegation boundaries पर 39–70% reasoning degradation measure किया।
जैसा BriefHQ ने 11 मार्च को कहा: "जो रास्ते में गायब हुआ वो raw information नहीं था। जो गायब हुआ वो decision context था।"
Fix करने की कीमत
तुम्हारे options अच्छे नहीं हैं:
- Full context को delegation prompt में serialize करो — tokens जलते हैं (frontier models के लिए ~$5–25 per million) और context window खा जाता है
- Shared memory stores — vendor lock-in add होता है और एक और point of failure
- Delegation skip करो — वापस single-agent monoliths जो complex workflows पर चोक करते हैं
कोई platform एक built-in mechanism provide नहीं करता जिससे parent agent verify कर सके कि उसके child ने actually क्या receive किया versus parent ने क्या send किया। तुम एक ऐसी team manage कर रहे हो जो तुम्हें emails CC नहीं कर सकती।
Decompose करने से पहले
Apne agent को multi-agent workflow में split करने से पहले, एक dead-simple test चलाओ: chain के top पर एक specific constraint inject करो और check करो कि bottom agent उसे follow करता है या नहीं। कुछ ऐसा जैसे "कभी pandas use मत करो" या "सारे outputs metric units में होने चाहिए।" अगर last agent violate करता है — बधाई हो, तुमने अपना context leak ढूंढ लिया।
एक step आगे जाओ। हर handoff boundary पर token count log करो। अगर Agent A 3,000 tokens research भेजता है और Agent B के effective context में सिर्फ 200 tokens हैं, तो तुम्हें exactly पता है drain कहाँ है। कोई fancy tracing framework नहीं चाहिए — हर delegation point पर एक print statement पूरी कहानी बता देगा। Production deploy करने से पहले यह करो। एक भी line orchestration code लिखने से पहले यह करो।
हर platform multi-agent delegation को "managing a team" के रूप में pitch करता है। लेकिन team members एक-दूसरे के notes नहीं पढ़ सकते, meeting minutes हर level पर छोटे होते जाते हैं, और किसी ने information loss detect करने का mechanism नहीं बनाया। एक अक्टूबर 2025 Gartner report predict करती है कि 40% से ज़्यादा agentic AI projects 2027 तक cancel हो जाएंगे। अप्रैल 2026 में इन तीनों platforms ने जो handoff architectures ship किए, उन्हें देखते हुए वो number optimistic लगता है।


