एक महीना पहले, तुम्हारा AI खर्चा एक साफ-सुथरी spreadsheet पर बैठा था। ChatGPT — $25 per seat। Claude — flat subscription। Slack — Salesforce के साथ bundled। Linear — per-user pricing। Predictable। Budgetable। तुम्हारे CFO की favourite line item।

वो model मर गया। बस पंद्रह दिन लगे इसे मारने में। Linear ने 24 मार्च को पहली गोली चलाई, एक agent launch किया जो तुम्हारे workspace में "full member" की तरह join होता है। 1 अप्रैल से 8 अप्रैल के बीच, तीन और vendors ने वही script follow किया — और इस script में हमेशा तीन moves होते हैं।

Playbook

तुमने launch posts पढ़ लिए होंगे। Salesforce ने 1 अप्रैल को Slack को "agentic operating system" बना दिया। OpenAI ने 2 अप्रैल को Codex को per-token billing पर switch किया। Anthropic ने 8 अप्रैल को Managed Agents ship किए$0.08 per session-hour पर। इस channel पर हर launch individually cover हो चुका है। अब जो matter करता है वो है pattern जो नीचे छुपा है।

Move एक: भाषा। हर vendor ने "feature" को "worker" से replace कर दिया। तुम्हारा AI अब tool नहीं है — ये teammate है। Linear agents projects में इंसानों के साथ join करते हैं। Slack bots तुम्हारे emails draft करते हैं जैसे वो कोई intern हो जो सच में हर thread पढ़ता है।

Move दो: pricing। Flat-rate subscriptions की जगह usage-based billing आ गई — per token, per hour, per task। Anthropic ने एक worked example publish किया: उनके Opus model से एक घंटे की coding work का खर्चा $0.705 आता है। एक agent 24/7 चलाओ तो सिर्फ runtime में करीब $58/month लगेगा, token costs अलग ऊपर से। OpenAI की नई per-token rates अकेले में छोटी दिखती हैं — जब तक तुम उन्हें ऐसे agent से multiply नहीं करते जो कभी सोता ही नहीं।

Move तीन: framing। जब कुछ $0.08/hour cost करता है, तो तुम उसकी comparison Jira licenses से करना बंद कर देते हो। तुम उसे contractor से compare करने लगते हो।

Headcount का जाल

यहीं पर बात खतरनाक होती है — और यहीं ज़्यादातर analysis रुक जाता है।

Enterprise headcount budgets software budgets से कहीं ज़्यादा बड़े होते हैं। PYMNTS की 30 मार्च की report में पाया गया कि 43% CFOs dynamic budget reallocation को agentic AI का top use case मानते हैं। Report explicitly AI को "workforce" नहीं कहती — लेकिन जब तुम किसी चीज़ को fixed SaaS line item की बजाय dynamically budget करते हो, तो तुम उसे headcount की तरह treat कर रहे हो चाहे वो शब्द बोलो या नहीं।

एक AI agent को $0.08/hour पर "hire" करना, $150 billing करने वाले human contractor के सामने हास्यास्पद रूप से सस्ता लगता है। यही comparison पूरी sales pitch है। ये दो चीज़ें छुपाती है।

पहला, agents multiply होते हैं। Coding agent एक testing agent spawn करता है। Testing agent एक review agent spawn करता है। Anthropic के Managed Agents explicitly sub-agents को feature के रूप में support करते हैं। $0.08/hour पर एक "hire" चुपचाप पाँच बन जाती है जो parallel में 24/7 चलती हैं। तुम्हारा अकेला सस्ता worker अब एक पूरा department बन गया जिसे किसी ने approve नहीं किया।

दूसरा, per-hour framing token costs को छुपा देती है। $0.705/hour वाला worked example एक specific workload assume करता है। Task complexity बदलो और वो number तीन गुना हो जाता है। Organizations पहले से ही AI models पर खर्च किए हर $1 के पीछे integration, compliance और monitoring पर $5-10 खर्च करती हैं। किसी के procurement framework में "synthetic employees" के लिए कोई column नहीं है।

AWS वाला सबक जो किसी ने नहीं सीखा

AWS ने हमें ये एक दशक पहले सिखाया था: usage-based billing design से ही unpredictable होती है। Companies cloud पर savings की उम्मीद से गईं और दो साल FinOps teams बनाने में लगा दिए ये समझने के लिए कि रात भर में bills तीन गुना क्यों हो गए। वही cycle फिर शुरू हो रहा है — बस AI agents के साथ एक extra layer है जो AWS में कभी नहीं थी: autonomy। एक misconfigured EC2 instance बड़ा bill बनाता है। एक misconfigured autonomous agent बड़ा bill भी बनाता है और रात 3 बजे production भी तोड़ देता है जब कोई देख नहीं रहा।

Slack के EVP Rob Seaman कहते हैं कि नई capabilities में "privacy protections built into the design" हैं और ये "user-initiated and opt-in" हैं। लेकिन Linear के agents पहले से 75% enterprise workspaces में operate कर रहे हैं, खुद tickets बना कर assign कर रहे हैं। "Opt-in" एक spectrum है, और ये spectrum लगातार "default-on" की तरफ खिसक रहा है।

किसी की HR policy autonomous agents को cover नहीं करती। किसी का procurement process ऐसे workers handle नहीं करता जो खुद को clone कर लें। किसी CFO की spreadsheet में ऐसे employee के लिए कोई row नहीं है जिसकी hourly rate सस्ती हो लेकिन घंटे unlimited हों।

क्या बदला

तुम्हारी अगली AI budget बात IT procurement के साथ नहीं होगी। ये headcount planning में होगी, उस open junior developer position वाली discussion के ठीक बगल में। बस AI को health insurance नहीं चाहिए, PTO नहीं लेता, और millisecond के हिसाब से bill करता है।

Software पंद्रह दिनों में labour बन गया। Invoice भी हर headcount budget की history वाले curve को follow करेगा — ऊपर, बिना किसी per-seat ceiling के रोकने के लिए।