तुम एक team lead हो और अपने सामने चार invoices देख रहे हो — चारों AI coding tools के। वो software जो तुम्हारे developers के साथ बैठकर code लिखता है, एक बहुत तेज़ लेकिन बहुत महंगे junior colleague की तरह। एक bill कहता है "seats।" दूसरा कहता है "tokens।" तीसरा कहता है "session-hours।" चौथा कहता है "credits।" तुम्हारी spreadsheet में कोई common column नहीं है। Finance team ऐसे सवाल पूछ रही है जिनका जवाब तुम्हारे पास नहीं है।

ये इतना मुश्किल नहीं होना चाहिए था। तुम बस जानना चाहते हो कि कौन सा tool per developer per month सस्ता पड़ता है। लेकिन दुनिया का कोई vendor तुम्हें ये number नहीं देगा — क्योंकि confusion ही product है।

पिछले चार दिनों में pricing का ये तमाशा और भी बेकाबू हो गया। 18 अप्रैल को, Cursor की parent company Anysphere ने $50B valuation पर $2B की funding round close की — इतना पैसा कि pricing experiments पर अनंत काल तक पैसे जलाते रहो। Company dollar-equivalent usage credits बेचती है $20–$200/month पर। 20 अप्रैल को, GitHub ने Copilot के flat-rate seat model के लिए नई signups रोक दीं, "sustainability" का हवाला देकर — एक शब्द जो companies तब इस्तेमाल करती हैं जब unit economics ICU में हो। इससे पहले billing-model की musical chairs चल रही थी: 4 अप्रैल को OpenAI ने Codex को token-based credits पर shift किया, Anthropic ने 8 अप्रैल को Managed Agents लॉन्च किए — $0.08 per session-hour प्लस per-token rates प्लस हर हज़ार web searches पर $10, और Windsurf ने 12 मार्च से ही daily quotas शुरू कर दिए थे। छह vendors, छह billing models, zero overlap।

अब वो part जहाँ तुम्हारा wallet आग पकड़ता है और कोई notification नहीं आता। हर billing unit एक अलग cost trap छुपाता है — और सबसे खतरनाक trap reasoning models के अंदर बैठा है। OpenAI की o-series और Anthropic के extended thinking modes hidden reasoning tokens generate करते हैं: internal chain-of-thought जो model जवाब देने से पहले produce करता है। तुम्हें दिखता नहीं। पैसे तुम्हारे कटते हैं। Stanford और UC Berkeley की 25 मार्च को publish हुई study में पाया गया कि reasoning-token generation एक ही prompt के अलग-अलग runs में 9.7 गुना तक vary करती है — और cost rankings models के बीच 28 गुना तक उलट सकती हैं, इस बात पर निर्भर करते हुए कि तुम कौन सा run measure करो। (मैंने इस study को detail में अपने 20 अप्रैल के breakdown में cover किया था — short version ये है कि तुम्हारा budget estimate गलत नहीं है, वो एक random number generator है।) अलग से, Anthropic का Opus 4.7 tokenizer identical text के लिए ज़्यादा tokens produce करता है अपने predecessor की तुलना में — same price per token, ज़्यादा tokens per request, जैसा कि कल की model-swap analysis में explore किया। Cursor का credit system power users को mid-session throttle कर देता है जब fast requests खत्म हो जाएं। और Copilot का flat rate? वो उस developer को subsidize करता है जो इसे दिन में दो बार use करता है, उस developer की कीमत पर जो इसमें जीता है।

जब तुम सब कुछ actual output की cost पर normalize करने की कोशिश करो — मान लो, cost per merged pull request (एक completed code change जो review pass कर चुका है) — तो तस्वीर dramatic तरीके से बदलती है। GetDX के Q1 2026 benchmarks, 15 अप्रैल को publish हुए, 64,680 developers पर — Cursor users 4.1 PRs/day और Copilot के 3.61। Tools के बीच 10× sticker-price का gap per-outcome basis पर roughly 2–4× तक सिमट जाता है। लेकिन सबसे सस्ता vendor बदल जाता है इस बात पर कि तुम्हारी team दिन में 50 lines लिखती है या 500।

हर pricing model developers के काम करने का तरीका भी बदलता है। Flat seats experimentation को encourage करते हैं — कुछ भी try करो, पैसे तो पहले ही दे चुके हो। Per-token billing exploration को punish करता है — हर keystroke की कीमत है। Session-hours fast agents को reward करते हैं और debugging को penalize करते हैं। Daily quotas hard cliffs बनाते हैं जहाँ तुम्हारा tool दोपहर बाद अचानक बंद हो जाता है।

तो actually करो क्या? तुम्हारी procurement team को एक metric चाहिए: तुम्हारे usage pattern पर estimated monthly cost per developer। कोई pricing page तुम्हें ये नहीं देगा। एकमात्र ईमानदार रास्ता है — अपने actual codebase और अपने actual लोगों के साथ दो हफ्ते का parallel trial।

AI coding market ने math का homework buyer पर डाल दिया है। जो पहला vendor transparent cost-per-outcome calculator publish करेगा, वो enterprise deals की अगली wave जीतेगा। बाकी सब इस बात पर bet लगा रहे हैं कि तुम homework नहीं करोगे। और सच कहूँ — ज़्यादातर लोग नहीं करेंगे।