2 अप्रैल से 16 अप्रैल 2026 के बीच पाँच creation features ship हुए। Maintenance features? शून्य। ये ratio ही बता देता है कि AI coding market असल में कहाँ है — और क्या honestly price करने से मना कर रहा है।

Cursor 3 (2 अप्रैल) ने parallel Agent Tabs launch किए — कई AI agents एक साथ अलग-अलग branches में code लिख रहे हैं। GitHub Copilot (4 अप्रैल) ने Autopilot mode जोड़ा — agents जो बिना तुमसे पूछे अपने tool calls खुद approve कर लेते हैं। Windsurf 2.0 (10 अप्रैल) ने Agent Command Center ship किया। Claude Code (14 अप्रैल) ने Routines introduce की — scheduled background agents जो triggers पर code generate करते हैं। OpenAI का Codex (16 अप्रैल) — multi-agent workflows। एक भी announcement ये नहीं बताती कि code ship होने के बाद उसका क्या होता है।

ये oversight नहीं है। ये product strategy है।

वो 60% जो कोई नहीं बेच रहा

Barry Boehm ने 1976 में establish किया कि maintenance पूरे software lifecycle cost का 60–80% खा जाता है। IBM ने इसे बार-बार confirm किया। पचास साल की software engineering में कुछ भी इस ratio को नहीं बदल पाया है।

AI इसे और बढ़ा रहा लगता है।

8 अप्रैल 2026 को arXiv पर publish हुई एक study ने दस बड़े Cursor-generated projects का analysis किया, जिनमें average 17,000 lines of code थीं। Functional correctness: 91% — code काम करता था। CodeScene, एक code health analysis tool, ने उन projects में 1,305 design issues खोजे: 28.4% duplicated code, methods average 171 lines (good practice 20–30 तक कहती है), और cyclomatic complexity — एक function में branching paths की count — average 17, recommended ceiling से लगभग दोगुना।

Demo ship हो जाता है। Codebase structurally hostile है हर उस इंसान के लिए जो इसे अगली बार छूता है — उस AI के लिए भी जिसने इसे लिखा।

हर major AI coding benchmark इस blind spot को reinforce करता है। SWE-bench bug fixes test करता है। HumanEval function generation test करता है। कोई benchmark ये नहीं पूछता "क्या ये model तीन महीने पहले बिना किसी design documentation के generate किए गए उलझे हुए codebase में safely एक feature जोड़ सकता है?" बिना उस benchmark के, vendors के पास maintainability optimize करने का zero market incentive है — वो चीज़ जिस पर असल में पैसा खर्च होता है।

AI structurally वो maintain क्यों नहीं कर सकता जो वो बनाता है

Maintenance के लिए तीन capabilities चाहिए जो creation में नहीं लगतीं: sessions के बीच consistent design decisions, ये समझना कि code क्यों exist करता है (सिर्फ क्या करता है नहीं), और duplicate करने की बजाय refactor करने का discipline।

Current AI tools तीनों में fail हैं।

हर नया session prior design choices की zero memory से शुरू होता है। Model वो pattern generate करता है जो current prompt को fit करता है, वो नहीं जो उसने पिछले मंगलवार को use किया था। इसीलिए arXiv study में 28.4% duplication मिला — AI एक ही problem को हर बार अलग तरीके से solve करता है क्योंकि उसे याद ही नहीं कि पहले solve कर चुका है।

METR randomized controlled trial — जुलाई 2025 में publish, अभी भी अपनी तरह का एकमात्र controlled study — ने perception और reality के बीच का gap quantify किया: 16 experienced developers अपनी खुद की repositories पर AI tools के साथ 19% slower काम कर रहे थे, पर believe कर रहे थे कि 20% faster हैं। Developers जो सोचते हैं हो रहा है और जो actually हो रहा है उसमें 39-percentage-point का delta। ये familiar codebases पर था। Unfamiliar AI-generated code पर, किसी ने measure नहीं किया है, क्योंकि किसी ने benchmark ही नहीं बनाया है।

Maintenance-first tool को actually क्या चाहिए होगा

अगर तुम एक AI coding tool design करो जो उस 60–80% काम के लिए हो जिस पर actually पैसा खर्च होता है, तो ये आज ship हो रही किसी भी चीज़ जैसा नहीं दिखेगा।

Metadata के रूप में design rationale। सिर्फ code क्या करता है नहीं — क्यों वो ऐसे structured है। हर AI-generated function के साथ constraints, considered alternatives, और design decisions का record होना चाहिए। Claude Code का CLAUDE.md सबसे करीबी approximation है: sessions के बीच persistent project context। पर ये एक text file है जो तुम manually maintain करते हो, automated architectural record नहीं।

Cross-session consistency enforcement। Maintenance-first tool detect करता जब model ऐसा pattern introduce करता है जो existing pattern को contradict करता हो और conflict को code generate होने से पहले block करता — बाद में human review के बाद नहीं। Cursor की codebase indexing (500MB तक, sub-second queries) इसके लिए retrieval layer provide करती है। बिना enforcement के retrieval एक library है बिना librarian के।

Default mode के रूप में refactoring। Current tools net-new code के लिए optimize हैं। Maintenance tool default रूप से existing code modify करता — नई file generate करने की बजाय logic add करने की सही जगह ढूँढता। ये functional correctness के साथ-साथ duplication को measure और minimize करता primary metric के रूप में।

Degradation gates। जब cyclomatic complexity thresholds cross करे, methods 30 lines से फूल जाएँ, duplication rates बढ़ें — tool commit करने से मना कर दे। Optional plugin के रूप में नहीं। Default के रूप में। जैसे type checker invalid code block करता है, maintenance-first tool unmaintainable code block करता।

JetBrains की longitudinal study जो 14 अप्रैल 2026 को publish हुई ने 800 developers को 151.9 million logged events के across track किया और एक signal surface किया जिस पर कोई coding tool act नहीं करता: developers अपना एक तिहाई से ज़्यादा समय AI suggestions verify करने में बिताते हैं, और accept की गई हर पाँच completions में से एक को बाद में delete करके reverse करते हैं। वो deletion pattern एक free training signal है — "model ने सोचा ये सही है, human ने prove किया कि गलत था" का corpus — जो हर IDE की telemetry में बैठा है। कोई इससे feedback loop बना सकता है जो उन reversals को ingest करे और शुरू से ही maintainable code generate करना सीखे। किसी ने नहीं बनाया, क्योंकि creation demos बिकते हैं। Prompt से app बनाते agent का 30-second screencast millions views लाता है। 171-line method को छह clean functions में carefully decompose करते agent का screencast — शायद एक conference talk मिल जाए।

Pricing की हकीकत

अगर तुमने इस quarter एक AI-built project greenlight किया है, तो ये बात कोई vendor तुम्हें नहीं बताएगा: पहले साल की maintenance के लिए creation cost का तीन गुना budget रखो। अगर तुम्हारे AI agent ने एक हफ्ते में 17,000 lines लिखीं, तो तुम्हारे engineers तीन हफ्ते design issues untangle करने में बिताएँगे इससे पहले कि safely extend कर सकें — और फिर हर feature addition के बाद ये cycle repeat होगा।

ज़्यादा honest approach: AI-generated code को एक disposable prototype मानो जिसकी shelf life छह महीने है। Demo करो, idea validate करो, फिर जो parts अपनी value prove कर चुके हैं उन्हें engineers से rebuild कराओ जो architecture समझते हैं।

अप्रैल 2026 में हर AI coding vendor creation को product के रूप में price और market करता है। Software में actual cost center कभी creation नहीं रहा है। जब तक कोई vendor maintenance multiplier build करके उसके पैसे नहीं लेता, तुम process का सबसे सस्ता phase खरीद रहे हो और बाकी सबके लिए full price भर रहे हो।