दो हफ्ते पहले, तुमने एक agent pilot को green light दी। शायद Anthropic के चमचमाते नए Managed Agents थे, शायद OpenAI का updated Agents SDK। Vendor का demo शानदार था: एक junior-level task — ticket triage, boilerplate code, data cleanup — 90 seconds में गायब। तुमने calculation किया। कम junior hires, seniors "high-value work" के लिए free। ROI bulletproof लग रहा था।
पंचलाइन जो किसी ने slide पर नहीं डाली: तुम्हारे senior engineers अब agent outputs review करने में ज़्यादा time spend कर रहे हैं जितना juniors ने कभी उन्हें produce करने में नहीं किया। और इसका budget किसी ने नहीं बनाया था।
वो हफ्ता जिसने हज़ारों agents launch कर दिए
8 अप्रैल से 15 अप्रैल के बीच, तीन सबसे बड़े AI vendors ने production agents पर all-in कर दिया — autonomous AI systems जो सिर्फ़ सवालों के जवाब नहीं देते बल्कि अपने आप काम करते हैं। Anthropic ने 8 अप्रैल को Managed Agents ship किए, Notion, Rakuten, और Asana launch partners थे। Atlassian ने 10 अप्रैल को agents को Confluence में plug किया। OpenAI ने 15 अप्रैल को अपने Agents SDK को sandbox environments और long-horizon tasks के साथ expand किया। Enterprise agents रातोंरात "हम experiment कर रहे हैं" से "production में है" हो गए।
किसी ने नहीं पूछा कि आगे क्या होगा।
वो data जो कोई dashboard पर नहीं देखना चाहता
दरारें महीनों से दिख रही थीं — अगर कोई research पढ़ रहा होता।
Faros.ai ने study किया 10,000 से ज़्यादा developers का, 1,255 teams में (July 2025 में publish हुआ): individual devs ने 21% ज़्यादा tasks complete किए और 98% ज़्यादा pull requests merge किए — code के वो chunks जो review के लिए submit होते हैं। Win लगता है ना? लेकिन PR review time 91% बढ़ गया। Bugs 9% बढ़े। और company level पर? "AI adoption और key performance metrics के बीच कोई भी correlation गायब हो जाता है।" Individual velocity बढ़ी। Team output जस का तस। Agents ने काम हटाया नहीं — बस review queue में upstream shift कर दिया।
अब तक supporting numbers जाने-पहचाने हैं — CodeRabbit की report में AI-generated code में 1.7x ज़्यादा issues (December 2025), Princeton की finding कि agent reliability, capability की आधी speed से improve होती है (March 2026)। दोनों इस channel पर cover हो चुकी हैं। Faros data बताता है क्यों ये numbers scale पर इतना hurt करते हैं: bottleneck गायब नहीं हुआ। वो production से review में migrate हो गया।
Structural trap
ROI क्यों उलटा पड़ जाता है — और ये कोई bug नहीं जिसे patch किया जा सके।
Task करने के लिए competence चाहिए। एक autonomous system का output review करने के लिए competence plus judgment plus वो errors पकड़ने की ability चाहिए जिन पर AI खुद confident है। Supervision, execution से strictly harder है।
Addy Osmani ने इसे "comprehension debt" नाम दिया — कितना code exist करता है और कितना कोई इंसान actually समझता है, इसके बीच बढ़ता gap — O'Reilly Radar पर 13 अप्रैल को: "एक junior engineer अब इतनी तेज़ी से code generate कर सकता है कि senior engineer उसे critically audit नहीं कर पाता।" Anthropic की एक study जिसमें 52 engineers थे, February 2026 में publish हुई, उसमें पाया गया कि AI-assisted devs ने उसी code के comprehension tests में 17 percentage points कम score किया जो उन्होंने अभी-अभी "लिखा" था।
Human cost पहले से measurable है। Harvard Business Review ने report किया 5 मार्च को कि 14% AI users "brain fry" experience करते हैं — AI oversight से mental fatigue। Oversight सबसे ज़्यादा mentally taxing AI activity rank हुई। High oversight loads वाले workers ने 39% ज़्यादा major errors किए और 33% ज़्यादा decision fatigue experience की। और वो ज़्यादा छोड़ भी रहे हैं: 34% leave intent, बनाम 25% उनका जिन्हें brain fry नहीं।
Info-Tech Research Group के Shashi Bellamkonda ने इसे 5 अप्रैल को "oversight tax" कहा। उन्होंने एक Microsoft engineer का example दिया जो AI coding agent use कर रहा था और बोला कि वो "screen से हट नहीं सकता था" — ऐसा लग रहा था "जैसे कोई उसे घसीटते हुए ले जा रहा हो।" Engineer को उम्मीद थी कि काम किसी junior को दे देगा। मिला एक anxious babysitting shift जहाँ नज़र हटाने के consequences अनजाने थे।
वो price tag जो किसी ने तुम्हें बताया ही नहीं
Vendors output quality की परवाह किए बिना usage पर bill करते हैं। Agent supervision hours project accounting में invisible हैं — वो "senior engineer time" के रूप में दिखते हैं, कोई line item नहीं जो उन्हें उस agent से connect करे जिसने काम create किया। Expertise bottleneck जो agents से पहले तुम्हारी team को limit करता था, अब agents के बाद भी limit करता है, बस एक अलग layer पर।
Gartner की June 2025 prediction कि 40% से ज़्यादा agentic projects 2027 तक cancel हो जाएँगे, अब conservative लगने लगी है। OutSystems के survey ने 13 अप्रैल को पाया कि 94% IT leaders पहले से agent sprawl को लेकर चिंतित हैं, और सिर्फ़ 12% के पास इसे manage करने के लिए centralized platforms हैं। इसी बीच, 52% "human-on-the-loop supervision" पर depend हैं — corporate भाषा में "एक इंसान robot को देखता रहता है और भगवान से प्रार्थना करता है" कहने का शालीन तरीका।
तुम्हारे लिए इसका मतलब क्या है
Agents deploy करने से पहले, supervision cost per agent-hour calculate करो — सिर्फ़ agent-hour price नहीं। अगर तुम्हारी team में senior reviewers की कमी है, तो agents expertise gap को बंद करने की बजाय और बड़ा कर देते हैं। Vendor के ROI calculator में "तुम्हारे best engineer का पूरा मंगलवार इस बात में गया कि agent ने चुपचाप authentication तोड़ दिया" — इसका कोई field नहीं है।
अपने vendor से एक सवाल पूछो: expected supervision ratio क्या है? अगर वो तुम्हें blank stare दें, तो तुम्हें जवाब मिल गया।
Agent market का पहला real segmentation model quality या price से नहीं होगा। वो इससे होगा कि कौन सा platform actually supervision load कम करता है। ये metric अभी exist नहीं करता — और जब तक नहीं करता, हर ROI projection जो तुमने देखी है उसमें सबसे बड़ा variable missing है। दो हफ्ते पहले pitch थी "agents junior काम replace करेंगे।" आज सवाल ये है कि senior engineer की sanity कौन replace करेगा।


