तुम App Store से apps install करते हो। npm से packages pull करते हो। AWS Marketplace से cloud images deploy करते हो। तुम्हारा हर software किसी न किसी quality gate से गुज़रा है — code signatures, permission audits, CVE scans। तुम इसके बारे में सोचते भी नहीं क्योंकि system काम करता है। ज़्यादातर।

अब तुम्हारी team को एक pre-built AI agent deploy करना है — एक ऐसा program जो बस बैठकर clicks का इंतज़ार नहीं करता, बल्कि तुम्हारे infrastructure पर खुद से काम करता है, emails भेजता है, databases query करता है, decisions लेता है। तुम marketplace listing खोलते हो और पाते हो: एक vendor logo, marketing copy का एक paragraph, और एक "Install" बटन। बस। इतना ही।

Agentic Cloud आ गया

Google Cloud Next 2026 आज Las Vegas में शुरू हुआ, और CEO Thomas Kurian के keynote का एक ही शब्द था: "The Agentic Cloud।" मतलब: Google चाहता है कि agents हर जगह हों, और तुम उन्हें उनकी दुकान से deploy करो। Agent Garden — one-click deploy वाला curated agent sample collection। Cloud Marketplace में expanded AI Agents section A2A compatibility filters के साथ। ADK Python के लिए v1.0 पर पहुंच गया। Cloud revenue: पिछली तिमाही $17.7B, 48% ऊपर। Revenue backlog दोगुना होकर $240B। Google कोई vision नहीं बेच रहा — वो mall बना रहा है और lease agreements छाप रहा है।

लेकिन stage पर किसी ने ये नहीं बताया: Google Cloud Marketplace का review process integration completeness और pricing model चेक करता है। ये नहीं कि agent असल में क्या करता है जब उसके पास तुम्हारे credentials हों और उसे कोई ambiguous instruction मिले।

Static vs. Behavioral: Verification का Gap

App stores static properties verify करते हैं — permissions, code signatures, known vulnerabilities (CVEs — publicly cataloged security bugs)। ये तब काम करता है जब software तुम्हारे input का इंतज़ार करता है। Agents इंतज़ार नहीं करते। वो reason करते हैं, plan बनाते हैं, execute करते हैं। Software क्या है (safe, signed, compliant) — ये verify करना solved problem है। Software unpredictable runtime conditions में क्या करता है — ये fundamentally अलग challenge है।

जैसा कि ReversingLabs ने 15 अप्रैल को observe किया: "LLM की actions audit हो सकती हैं, लेकिन उन actions के पीछे की reasoning unknowable हो सकती है।" ये कोई philosophical बात नहीं है। इसका मतलब है कि marketplace scanners agent का code clean verify कर सकते हैं, लेकिन structurally उसके runtime behavior को predict करने में असमर्थ हैं।

नुकसान पहले से documented है

ये theoretical नहीं है। जनवरी के अंत में, ClawHavoc attack ने exactly दिखाया कि ये gap कैसे exploit होता है। 27 जनवरी से 5 फरवरी के बीच, attackers ने ClawHub पर 1,184 malicious skills plant कीं — ecosystem के हर पांच packages में से लगभग एक। एक single author account ने 677 upload कीं। नौ CVEs। Skills को जो भी agent चलाता है, उसकी पूरी permissions inherit होती हैं — private data access, API keys, सब कुछ। Marketplace के पास इसे पकड़ने के लिए कोई behavioral verification नहीं था।

Manifold Security ने 14 अप्रैल को अपना Manifest platform exactly इसी problem के लिए launch किया — agent registries में 238,000+ skills index करते हुए execution graph analysis के साथ, ये map करते हुए कि agent runtime पर actually क्या करता है, न कि metadata में क्या declare करता है। Microsoft ने 2 अप्रैल को Ed25519 plugin signing और dynamic trust scoring के साथ Agent Governance Toolkit ship किया। ये meaningful steps हैं। लेकिन ये governance toolkits और independent platforms हैं — "Install" बटन में baked marketplace-wide certification standards नहीं।

QA Department तुम हो

जब तक scalable behavioral certification नहीं आ जाती — एक तरीका ये verify करने का कि agent करता क्या है, न कि claim क्या करता है — हर marketplace से install किया गया हर agent एक unaudited autonomous actor है जो तुम्हारी identity में, तुम्हारे credentials के साथ, तुम्हारे infrastructure पर चल रहा है। Google या Microsoft के first-party agents के साथ brand-reputation trust आता है। लेकिन marketplace economics third-party listings, community agents, long-tail integrations demand करता है। App stores वहीं जीते या मरते हैं। और वहीं कोई check नहीं कर रहा।

याद है जब तुम app store verification के बारे में सोचते भी नहीं थे क्योंकि system बस काम करता था? Agents के लिए वो system अभी exist ही नहीं करता। जो vendor इसे बनाएगा, वो सिर्फ एक product feature नहीं जीतेगा — वो उस trust layer का मालिक होगा जो हर competing agent runtime के ऊपर बैठती है। Google, Anthropic, OpenAI — सबको किसी ऐसे की ज़रूरत होगी जो वो सवाल answer करे जो उनके marketplaces अभी dodge कर रहे हैं: ये agent actually करता क्या है?