तुम हर महीने $20 देते हो AI coding assistant के लिए, और टीम का हर बंदा भी उतना ही देता है। वो intern जो बस variable names autocomplete करता है। वो senior engineer जो पूरा monolith फीड करके बोलता है "refactor कर दे सब"। एक ही price। Finance वालों को ये बहुत पसंद है। अब पसंद आना बंद होने वाला है।
प्रॉब्लम सीधी है: flat-rate pricing तभी काम करती है जब सबका usage लगभग बराबर हो। AI coding tools में ऐसा कभी नहीं होता। एक developer दिन में पचास बार context window — यानी AI एक बार में कितना text "देख" सकता है, उसकी working memory समझ लो — खत्म कर देता है। दूसरा हफ्ते में एक बार खोलता है typo ठीक करने के लिए। दोनों से बराबर पैसे लेना वैसा ही है जैसे हर किरायेदार से एक ही बिजली का बिल लो — चाहे कोई drawing room में server farm चला रहा हो।
OpenAI ने switch कर दिया — तुम्हारे budget का क्या होगा
हमने आज सुबह timeline cover की: Codex-only seats जिनमें pay-as-you-go billing है, 30 लाख weekly users, और एक $100/month Pro tier जो Anthropic को टक्कर देने के लिए है। Announcements से ज़्यादा important ये है कि ये signal क्या है। OpenAI ने market को बता दिया कि per-seat pricing coding agents के लिए काम नहीं करती।
वजह structural है। Coding agents अब वो पुराने autocomplete plugin वाले developers नहीं रहे। ये cloud sandboxes (isolated virtual environments) में चलते हैं, parallel sessions spawn करते हैं, और tasks खुद-ब-खुद execute करते हैं। एक "seat" उतने resources खा सकती है जितने दस इंसान एक साथ काम करके खाते। काम की unit अब developer नहीं है — task है।
Per-seat pricing इस load में टूट जाती है।
Pricing landscape पहले से बिखरा हुआ है
देखो market अभी कहाँ खड़ा है:
| Tool | Model | Price |
|---|---|---|
| GitHub Copilot | Per seat | $10–39/month |
| Cursor | Credits | $16–200/month |
| Claude Code | API tokens | Pay-as-you-go |
| OpenAI Codex (new) | Tokens + seat | $20/month base + usage |
GitHub अभी भी per human charge करता है। Cursor एक credit system use करता है जो basically usage-based है with a floor। Claude Code हमेशा से Anthropic की API से bill होता रहा है — pure token consumption — लेकिन वो developer tool है, team purchasing product नहीं। OpenAI ने usage-based billing को enterprise layer में लाया, जहाँ procurement teams cheques sign करती हैं।
Fortune के मुताबिक, Business और Enterprise workspaces में Codex usage जनवरी 2026 से छह गुना बढ़ गया। Cisco, Nvidia, Ramp, और Rakuten पहले से इसे scale पर चला रहे हैं। छह गुना growth पर flat pricing OpenAI के लिए guaranteed loss है — और बाकी सबके लिए guaranteed sticker-shock जब वो भी follow करेंगे।
Cost जानने की cost
Tradeoff असली है। Usage-based billing तुम्हारे AI coding budget को उतना ही predictable बना देती है जितना तुम्हारा AWS bill होता है — मतलब, बिल्कुल भी predictable नहीं। जो teams agents को सबसे ज़्यादा aggressively use करती हैं उन्हें सबसे बड़ा bill मिलता है, भले ही वो सबसे ज़्यादा value extract कर रही हों। Finance departments को अब token consumption समझना पड़ेगा जैसे उन्होंने compute hours समझना सीखा था। All the best उनको।
एक और perverse incentive है। जब हर AI task की cost दिखाई देती है, developers rationing शुरू कर देते हैं। वो team जिसे हर चीज़ के लिए agents use करने चाहिए, अब mentally calculate करने लगती है कि ये refactor tokens के "worth" है या नहीं। तुम development accelerate करना चाहते थे। Instead तुमने एक नई anxiety create कर दी — जो exactly उसी behavior को punish करती है जिसे तुम encourage करना चाह रहे थे।
अगर तुम dev team manage करते हो या उसका tooling budget approve करते हो, तो अभी अपने usage patterns audit करो। Numbers निकालो — कौन क्या use कर रहा है, per session कितने tokens जा रहे हैं, और कौन से tasks actually agent-level compute justify करते हैं। पहला variable invoice आ जाएगा इससे पहले कि तुम इसे समझने का model बना पाओ।
Flat-rate का ज़माना खत्म हो रहा है
एक साल पहले, हर AI coding tool per seat charge करता था। आज, सबसे बड़े player ने market को बता दिया कि ये model scale नहीं करता। जो इसकी जगह आ रहा है वो बिल्कुल cloud billing जैसा दिखता है — और वो भी किसी को कभी पसंद नहीं आई। लेकिन कम से कम अब तुम्हें पता चलेगा कि कौन सा developer actually tool use कर रहा है और कौन बस moral support के लिए खोलकर बैठा है।



