Tu app funciona. Tus usuarios están contentos. La construiste sobre la Assistants API de OpenAI — un sistema donde la IA gestiona el historial de conversaciones ("threads") y ejecuta tareas multi-paso ("runs") del lado del servidor. La mandaste a producción en algún momento de 2024, y hace exactamente lo que prometiste. La vida es buena.
Excepto que OpenAI acaba de decidir que tus cimientos son la moda de la temporada pasada.
El 26 de agosto de 2025, OpenAI anunció que la Assistants API se apagaría exactamente un año después — el 26 de agosto de 2026. Luego, el 15 de abril de 2026, lanzaron una actualización mayor del Agents SDK con ejecución en sandbox, memoria persistente y ejecuciones durables de agentes. Tu código funcional ahora está dos capas de abstracción detrás de lo que OpenAI quiere que uses. Cuatro meses para migrar. El reloj corre.
Cinco plataformas en seis años
Contemos las reescrituras que OpenAI les ha pedido a los desarrolladores que se traguen:
- Completions API (2020) — mandas texto, la IA lo completa. Simple. Ya deprecada.
- Chat Completions API (marzo 2023) — la misma idea, pero estructurada como conversación con roles ("system", "user", "assistant"). Sigue viva, pero arrinconada en la documentación.
- Assistants API (noviembre 2023) — threads gestionados en el servidor, runs, manejo de archivos integrado. Se apaga en agosto de 2026.
- Responses API (marzo 2025) — llamadas stateless de un solo turno con herramientas integradas como búsqueda web y computer use. La ruta recomendada actualmente.
- Agents SDK (marzo 2025, actualización mayor el 15 de abril de 2026) — una biblioteca Python para construir agentes autónomos con handoffs entre IAs especializadas, guardrails y tracing.
Cinco cambios a nivel de plataforma. Cada uno cambia la abstracción central — cómo gestionas el estado, llamas herramientas y orquestas el comportamiento de la IA. Ninguno mapea limpiamente al anterior. Y desde 2023, el ritmo ha sido aproximadamente cada 8-12 meses — lo suficientemente rápido como para que tu migración no termine antes de que empiece la siguiente.
Qué se rompe en realidad
La Assistants API almacenaba todo del lado del servidor: tus threads de conversación, tus archivos subidos, las configuraciones de tus asistentes. La Responses API tiró todo eso a la basura — es stateless por defecto. ¿Quieres persistencia de conversación? Usa la nueva Conversations API y un endpoint /responses/compact para comprimir contextos largos.
Pero acá viene el verdadero dolor. Los desarrolladores que construyeron plataformas SaaS sobre la Assistants API podían crear programáticamente cientos de asistentes a través de la API — dinámicamente, a escala. ¿El reemplazo en la Responses API? Una funcionalidad llamada "Prompts" que solo puedes crear a través del dashboard UI. No la API. El dashboard.
Como dijo un desarrollador en el foro de la comunidad: "Tengo cientos de ellos, creados, eliminados y editados dinámicamente." Otro fue más directo: "Honestamente, todo esto es un desastre total."
El staff de OpenAI publicó el anuncio de deprecación. No respondieron a las quejas debajo de él.
El juego de la deprecación suave
Acá está el truco: OpenAI no ha matado de golpe la mayoría de las APIs viejas. La Assistants API sigue funcionando. Chat Completions sigue funcionando. Pero la documentación migra a la plataforma más nueva. Las respuestas de StackOverflow referencian el SDK más nuevo. Los ejemplos oficiales muestran los patrones más nuevos. Los tutoriales de la comunidad siguen el hype más reciente.
Tu código viejo sigue compilando. Simplemente se convierte en huérfano — software funcional para el que nadie escribe guías. Eso no es deprecación. Es muerte por inanición de recursos.
Mientras tanto, OpenAI también está apagando DALL·E 2 y 3 (12 de mayo de 2026), la beta de la Realtime API (7 de mayo de 2026), Sora 2 (24 de septiembre de 2026) y GPT-3.5-turbo-instruct (28 de septiembre de 2026). Si construiste sobre el stack de OpenAI, estás gestionando un calendario de deprecaciones, no un roadmap de producto.
El costo real no son los tokens
Migrar de Assistants a Responses cuesta semanas de ingeniería. Reescribes la gestión de estado. Reescribes el tool calling. Reescribes la lógica de orquestación. ¿Y qué obtiene el usuario? Nada. El producto hace lo mismo que hacía antes. Quemaste un sprint para quedarte en el mismo lugar.
Pero quedarte quieto cuesta diferente. Las correcciones de bugs se ralentizan. Los clientes enterprise preguntan por qué no estás en la última plataforma. Los nuevos contratados que aprendieron con la documentación actual no pueden leer tu codebase sin hacer arqueología.
Elige tu veneno.
Antes de adoptar el Agents SDK
La actualización del Agents SDK del 15 de abril se ve como exactamente lo que querrías — sandboxing nativo a través de Cloudflare, E2B, Modal, Vercel, ejecuciones durables con snapshots, memoria configurable — si confiaras en que seguirá siendo lo que OpenAI quiere que uses en doce meses. Pero considerá el patrón: OpenAI ha lanzado una nueva plataforma para desarrolladores aproximadamente cada 8-12 meses desde 2023. El Agents SDK será la base — hasta que llegue la siguiente base.
Calculá el costo de reescritura. No el precio por token. El costo de reescritura.
La API más cara no es la que cobra más por llamada. Es la que te hace reconstruir tu producto cada año para seguir usándola.





