Ton appli tourne. Tes utilisateurs sont contents. Tu l'as construite sur l'Assistants API d'OpenAI — un système où l'IA gère l'historique de conversation (les « threads ») et exécute des tâches multi-étapes (les « runs ») côté serveur. Tu l'as mise en prod courant 2024, et elle fait exactement ce que tu avais promis. La vie est belle.
Sauf qu'OpenAI vient de décréter que tes fondations, c'est la mode de la saison dernière.
Le 26 août 2025, OpenAI a annoncé que l'Assistants API serait retirée exactement un an plus tard — le 26 août 2026. Puis le 15 avril 2026, ils ont sorti une mise à jour majeure de l'Agents SDK avec exécution sandboxée, mémoire persistante et agent runs durables. Ton code qui marchait très bien se retrouve maintenant deux couches d'abstraction derrière ce qu'OpenAI veut que tu utilises. Quatre mois pour migrer. Le compte à rebours a commencé.
Cinq plateformes en six ans
Comptons les réécritures qu'OpenAI a demandé aux développeurs d'avaler :
- Completions API (2020) — tu envoies du texte, l'IA complète. Simple. Maintenant dépréciée.
- Chat Completions API (mars 2023) — même principe, mais structuré en conversation avec des rôles (« system », « user », « assistant »). Toujours vivante, mais reléguée au second plan dans la doc.
- Assistants API (novembre 2023) — threads gérés côté serveur, runs, gestion de fichiers intégrée. Fin de vie août 2026.
- Responses API (mars 2025) — appels stateless en un seul tour avec des outils intégrés comme la recherche web et le computer use. Le chemin actuellement recommandé.
- Agents SDK (mars 2025, mise à jour majeure le 15 avril 2026) — une bibliothèque Python pour construire des agents autonomes avec des handoffs entre IA spécialisées, des guardrails et du tracing.
Cinq changements de plateforme. Chacun modifie l'abstraction fondamentale — la façon dont tu gères l'état, appelles les outils et orchestre le comportement de l'IA. Aucun ne se mappe proprement sur le précédent. Et depuis 2023, le rythme est d'environ 8 à 12 mois — assez rapide pour que ta migration ne soit pas terminée avant que la prochaine ne commence.
Ce qui casse vraiment
L'Assistants API stockait tout côté serveur : tes threads de conversation, tes fichiers uploadés, tes configurations d'assistant. La Responses API a tout jeté — elle est stateless par défaut. Tu veux la persistance des conversations ? Utilise la nouvelle Conversations API et un endpoint /responses/compact pour compresser les longs contextes.
Mais voilà le vrai cauchemar. Les développeurs qui avaient construit des plateformes SaaS sur l'Assistants API pouvaient créer des centaines d'assistants par l'API — dynamiquement, à grande échelle. Le remplacement côté Responses API ? Une fonctionnalité appelée « Prompts » qu'on ne peut créer que via le dashboard. Pas l'API. Le dashboard.
Comme l'a exprimé un développeur sur le forum communautaire : « J'en ai des centaines, créés dynamiquement, supprimés et modifiés. » Un autre a été plus concis : « Honnêtement, c'est un bordel total. »
Le staff d'OpenAI a publié l'annonce de dépréciation. Ils n'ont pas répondu aux plaintes en dessous.
Le jeu de la dépréciation douce
Voici l'astuce : OpenAI n'a pas brutalement tué la plupart des anciennes API. L'Assistants API tourne encore. Chat Completions fonctionne toujours. Mais la documentation migre vers la plateforme la plus récente. Les réponses StackOverflow référencent le dernier SDK. Les exemples officiels mettent en avant les derniers patterns. Les tutos de la communauté suivent le dernier hype.
Ton ancien code compile toujours. Il devient juste un orphelin — du logiciel fonctionnel pour lequel plus personne n'écrit de guides. Ce n'est pas une dépréciation. C'est de l'asphyxie par abandon.
Parallèlement, OpenAI retire aussi DALL·E 2 & 3 (12 mai 2026), la beta de l'API Realtime (7 mai 2026), Sora 2 (24 septembre 2026) et GPT-3.5-turbo-instruct (28 septembre 2026). Si tu as construit sur la stack OpenAI, tu gères un calendrier de dépréciation, pas une roadmap produit.
Le vrai coût, ce ne sont pas les tokens
Migrer de l'Assistants à la Responses API coûte des semaines d'ingénierie. Tu réécris la gestion d'état. Tu réécris les appels d'outils. Tu réécris la logique d'orchestration. Et qu'est-ce que l'utilisateur y gagne ? Rien. Le produit fait la même chose qu'avant. Tu as cramé un sprint pour rester sur place.
Mais rester immobile a aussi un prix. Les corrections de bugs ralentissent. Les clients enterprise demandent pourquoi tu n'es pas sur la dernière plateforme. Les nouvelles recrues qui ont appris avec la documentation actuelle ne peuvent pas lire ton code sans faire de l'archéologie.
Choisis ton poison.
Avant d'adopter l'Agents SDK
La mise à jour de l'Agents SDK du 15 avril ressemble exactement à ce que tu voudrais — sandboxing natif via Cloudflare, E2B, Modal, Vercel, runs durables avec snapshots, mémoire configurable — si tu avais confiance que ce sera encore ce qu'OpenAI te demandera d'utiliser dans douze mois. Mais regarde le pattern : OpenAI a livré une nouvelle plateforme développeur environ tous les 8 à 12 mois depuis 2023. L'Agents SDK sera la fondation — jusqu'à la prochaine fondation.
Calcule le coût de réécriture. Pas le prix des tokens. Le coût de réécriture.
L'API la plus chère n'est pas celle qui facture le plus par appel. C'est celle qui t'oblige à reconstruire ton produit chaque année pour continuer à l'utiliser.





