तुम हर बार Claude Sonnet को call करते हो तो तीन डॉलर per million tokens देते हो। शायद GPT-5-mini साठ सेंट पर चलाकर खुद को smart समझते हो। दोनों cases में, San Francisco वाले हर API call पर अपना कट ले रहे हैं, और bill तुम्हारे users के साथ बढ़ता जाता है।

प्रॉब्लम structural है। Proprietary AI models floor price सेट करते हैं, और जो भी ऊपर build करता है वो उनका margin inherit करता है। यही deal थी — जब तक किसी ने एक ऐसा model ship नहीं किया जो काफी अच्छा भी था और practically free भी। सवाल कभी अगर का नहीं था। सवाल ये था कि production में जाकर ये चीज़ टिकेगी या नहीं।

16 फरवरी को, Alibaba Cloud ने Qwen 3.5 ship किया — एक 397-billion-parameter Mixture-of-Experts model जो हर token पर सिर्फ 17 billion parameters activate करता है। पूरे neural network को हर सवाल में घसीटने की जगह, MoE हर task को उन specialist neurons तक route करता है जो उसे सबसे अच्छे handle कर सकते हैं। जैसे leak आई नल में तो सिर्फ plumber को बुलाओ, पूरे मोहल्ले के contractors को नहीं। Alibaba ने हर variant Apache 2.0 के तहत license किया — commercial use, modification, resale — सब free — और अगले दो हफ्तों में medium और small models भी drop कर दिए।

Benchmarks बेतुके लग रहे थे। Qwen3.5-27B ने SWE-bench Verified पर 72.4 मारा — GPT-5 mini को exactly match किया। 9B variant ने अपने से 13 गुना बड़े models को graduate-level reasoning में पीट दिया। Alibaba ने API की कीमत रखी दस सेंट per million input tokens — Claude Sonnet से 30 गुना सस्ता, GPT-5-mini से 6 गुना सस्ता। लेकिन Chinese model labs की एक शानदार परंपरा है benchmark tourism की: scores जो कागज़ पर दिवाली जैसे चमकते हैं और real workloads से टकराते ही फुस्स हो जाते हैं। तो सबने सांस रोक ली।

छह हफ्ते बाद, numbers टिके — बल्कि और बेहतर हुए। Qwen family ने Hugging Face पर 600 million downloads पार किए, और 170,000 से ज़्यादा derivative models spawn हुए। Indonesia की GoTo ने अपने आधे infrastructure को Alibaba Cloud पर migrate कर दिया। AI Singapore ने Meta के Llama और Google के Gemma को छोड़कर Qwen को अपने regional language model की foundation बनाया — और Southeast Asian leaderboard टॉप कर दिया। Hybrid attention mechanism — 75% lightweight Gated DeltaNet mixed with 25% traditional attention — ने production में 32K context पर 8.6x faster throughput दिया, सिर्फ lab में नहीं। Real companies। Real workloads। Real पैसे बचे।

और फिर जिन लोगों ने ये सब बनाया, वो चले गए।

3 मार्च को — small model release के ठीक एक दिन बाद — Lin Junyang, Qwen के technical lead, ने X पर लिखा "me stepping down. bye my beloved qwen"। एक colleague ने लिखा कि जाना उनकी choice नहीं थी। Yu Bowen, head of post-training, उसी दिन निकले। Hui Binyuan, जो Qwen Code चलाते थे, वो जनवरी में ही Meta को defect कर चुके थे। टीम के तीन सबसे senior technical दिमाग, दस हफ्तों में गायब। Alibaba के CEO ने एक DeepMind hire लाकर बिठाया और open-source idealism से pivot करके DAU metrics और commercial deployment की तरफ मुड़ गए। Classic corporate चाल: engineers से कुछ extraordinary बनवाओ, फिर उन्हें reorganize करके बाहर का रास्ता दिखाओ।

Architects चले गए। Architecture रह गया।

Apache 2.0 के बारे में एक बात है जो ज़्यादातर लोग miss करते हैं। Alibaba कल अपनी पूरी AI lab बंद कर दे — कुछ नहीं बदलता। Weights Hugging Face पर पड़े हैं। Code GitHub पर है। वो 170,000 derivative models Alibaba के किसी एहसान तले नहीं हैं और कहीं नहीं जा रहे। तुम आज Qwen 3.5 fork कर सकते हो और कोई इसे वापस नहीं छीन सकता — legally, technically, या practically। Open source को घर से निकलने के बाद माँ-बाप की ज़रूरत नहीं होती।

इससे पहले कि तुम अपना पूरा stack rewrite करो: caveats। 397 billion parameters को self-host करने के लिए अभी भी गंभीर hardware चाहिए — सोचो 8x H100 GPUs full model के लिए। 4B और 9B variants तुम्हारे laptop पर चलते हैं, लेकिन वो Claude Sonnet से टक्कर लेने वाले नहीं हैं। "Alibaba से Apache 2.0" — इसमें geopolitical weight है जिसे कुछ enterprise procurement teams छूने से मना कर देंगी। और एक कटी हुई development team का मतलब है Qwen 4, जब भी आए, किसी को नहीं पता कैसा होगा। तुम एक ऐसे model पर bet लगा रहे हो जिसका present proven है और roadmap uncertain।

छह हफ्ते पहले, frontier-class AI pricing सिर्फ San Francisco में रहती थी। अब ये एक Hugging Face repo पर बैठी है — तीस पैसे प्रति रुपया, या free। Open source को benchmark war जीतने की ज़रूरत नहीं थी। बस इतना करीब आना था कि price gap indefensible हो जाए। Qwen 3.5 ने वो line cross कर ली। और जिस team ने इसे बनाया उसके उलट, ये model कहीं नहीं जा रहा।

#qwen #alibaba #opensource #aimodels #pricing