तुम्हारा app चल रहा है। Users खुश हैं। तुमने इसे OpenAI के Assistants API पर बनाया — एक system जहाँ AI server-side पर conversation history ("threads") manage करता है और multi-step tasks ("runs") चलाता है। 2024 में कभी production में डाला, और वो exactly वही करता है जो तुमने promise किया था। Life is good.
बस OpenAI ने decide कर लिया कि तुम्हारी foundation अब पुराने सीज़न का फैशन है।
26 अगस्त, 2025 को OpenAI ने announce किया कि Assistants API ठीक एक साल बाद — 26 अगस्त, 2026 को sunset हो जाएगा। फिर 15 अप्रैल, 2026 को उन्होंने एक major Agents SDK update ship किया — sandbox execution, persistent memory, और durable agent runs के साथ। तुम्हारा working code अब दो abstraction layers पीछे है उस चीज़ से जो OpenAI चाहता है कि तुम use करो। Migrate करने के लिए चार महीने बचे हैं। घड़ी टिक-टिक कर रही है।
छह साल में पाँच platforms
चलो गिनते हैं कि OpenAI ने developers से कितने rewrites करवाए हैं:
- Completions API (2020) — text भेजो, AI complete करे। Simple। अब deprecated है।
- Chat Completions API (मार्च 2023) — same idea, लेकिन conversation roles के structure में ("system", "user", "assistant")। अभी भी ज़िंदा है, पर docs में किनारे कर दिया गया।
- Assistants API (नवंबर 2023) — server-managed threads, runs, built-in file handling। Sunset अगस्त 2026।
- Responses API (मार्च 2025) — stateless single-turn calls, built-in tools जैसे web search और computer use के साथ। अभी का recommended path।
- Agents SDK (मार्च 2025, major update 15 अप्रैल, 2026) — autonomous agents बनाने के लिए Python library, specialized AIs के बीच handoffs, guardrails, और tracing के साथ।
पाँच platform-level shifts। हर एक core abstraction बदलता है — state कैसे manage करो, tools कैसे call करो, AI behavior कैसे orchestrate करो। कोई भी पिछले वाले पर cleanly map नहीं होता। और 2023 से pace है roughly हर 8-12 महीने — इतना fast कि तुम्हारा migration शायद पूरा ही न हो अगला platform आने से पहले।
Actually क्या टूटता है
Assistants API सब कुछ server-side store करता था: conversation threads, file uploads, assistant configurations। Responses API ने ये सब उखाड़ फेंका — default से stateless है। Conversation persistence चाहिए? नया Conversations API use करो और /responses/compact endpoint से long contexts को compress करो।
लेकिन असली दर्द यहाँ है। जिन developers ने Assistants API पर SaaS platforms बनाए, वो programmatically सैकड़ों assistants create कर सकते थे API के through — dynamically, at scale। Responses API का replacement? एक feature जिसका नाम है "Prompts" जो तुम सिर्फ dashboard UI से बना सकते हो। API से नहीं। Dashboard से। हाँ भाई, web page पर buttons click करके।
जैसा एक developer ने community forum में लिखा: "मेरे पास सैकड़ों हैं, dynamically created, deleted और edited।" एक और ने और भी सीधा बोला: "Honestly, it's all a total mess."
OpenAI staff ने deprecation announcement post किया। उसके नीचे आई complaints का जवाब देने की ज़रूरत उन्हें नहीं पड़ी।
Soft deprecation का खेल
यहाँ trick ये है: OpenAI ने ज़्यादातर पुरानी APIs को अभी तक hard-kill नहीं किया है। Assistants API अभी भी चलता है। Chat Completions अभी भी काम करता है। लेकिन documentation newest platform पर shift हो जाता है। StackOverflow answers newest SDK reference करते हैं। Official examples newest patterns showcase करते हैं। Community tutorials newest hype follow करती हैं।
तुम्हारा पुराना code अभी भी compile होता है। बस वो अनाथ हो जाता है — working software जिसके लिए कोई guide नहीं लिखता। ये deprecation नहीं है। ये resource starvation है।
इसी बीच, OpenAI DALL·E 2 & 3 (12 मई, 2026), Realtime API beta (7 मई, 2026), Sora 2 (24 सितंबर, 2026), और GPT-3.5-turbo-instruct (28 सितंबर, 2026) को भी sunset कर रहा है। अगर तुमने OpenAI के stack पर build किया है, तो तुम product roadmap नहीं, deprecation calendar manage कर रहे हो।
असली cost tokens नहीं है
Assistants से Responses पर migrate करने में engineering के हफ्ते लगते हैं। State management rewrite करो। Tool calling rewrite करो। Orchestration logic rewrite करो। और user को क्या मिलता है? कुछ नहीं। Product वही करता है जो पहले करता था। तुमने एक पूरा sprint जला दिया बस वहीं खड़े रहने के लिए।
लेकिन रुके रहने की भी अपनी कीमत है। Bug fixes slow हो जाती हैं। Enterprise clients पूछते हैं कि तुम latest platform पर क्यों नहीं हो। नए hires जिन्होंने current documentation से सीखा है, तुम्हारा codebase पढ़ने के लिए archaeology करनी पड़ती है।
चुन लो अपना ज़हर।
Agents SDK adopt करने से पहले
15 अप्रैल का Agents SDK update exactly वो चीज़ लगता है जो तुम्हें चाहिए — Cloudflare, E2B, Modal, Vercel के through native sandboxing, snapshotting के साथ durable runs, configurable memory — अगर तुम्हें भरोसा होता कि बारह महीने बाद भी यही वो चीज़ होगी जो OpenAI तुमसे use करवाना चाहेगा। लेकिन pattern देखो: OpenAI ने 2023 से roughly हर 8-12 महीने में एक नया developer platform ship किया है। Agents SDK foundation रहेगा — जब तक अगला foundation नहीं आ जाता।
Rewrite cost calculate करो। Token price नहीं। Rewrite cost।
सबसे महँगा API वो नहीं जो per call सबसे ज़्यादा charge करे। वो है जो तुमसे हर साल product rebuild करवाए सिर्फ इसलिए कि तुम उसे use करते रह सको।





