Seu app funciona. Seus usuários estão felizes. Você construiu tudo em cima da Assistants API da OpenAI — um sistema onde a IA gerencia o histórico de conversas ("threads") e executa tarefas em múltiplas etapas ("runs") no lado do servidor. Você mandou pra produção em algum momento de 2024, e o negócio faz exatamente o que prometia. A vida é boa.

Só que a OpenAI acabou de decidir que sua fundação é moda da temporada passada.

Em 26 de agosto de 2025, a OpenAI anunciou que a Assistants API seria descontinuada exatamente um ano depois — 26 de agosto de 2026. Aí, em 15 de abril de 2026, eles lançaram uma atualização grande do Agents SDK com execução em sandbox, memória persistente e runs duráveis. Seu código que funciona agora está duas camadas de abstração atrás daquilo que a OpenAI quer que você use. Quatro meses pra migrar. O relógio não para.

Cinco plataformas em seis anos

Vamos contar as reescritas que a OpenAI pediu pros devs engolirem:

  • Completions API (2020) — você manda texto, a IA completa. Simples. Agora deprecada.
  • Chat Completions API (março 2023) — mesma ideia, mas estruturada como conversa com papéis ("system", "user", "assistant"). Ainda viva, mas jogada pro canto na documentação.
  • Assistants API (novembro 2023) — threads gerenciadas no servidor, runs, manipulação de arquivos embutida. Sunset em agosto de 2026.
  • Responses API (março 2025) — chamadas stateless de turno único com ferramentas embutidas como busca na web e computer use. O caminho recomendado atualmente.
  • Agents SDK (março 2025, atualização grande em 15 de abril de 2026) — uma biblioteca Python para construir agentes autônomos com handoffs entre IAs especializadas, guardrails e tracing.

Cinco mudanças no nível de plataforma. Cada uma altera a abstração central — como você gerencia estado, chama ferramentas e orquestra o comportamento da IA. Nenhuma mapeia de forma limpa pra anterior. E desde 2023, o ritmo tem sido de mais ou menos 8 a 12 meses — rápido o suficiente pra que sua migração talvez não termine antes da próxima começar.

O que realmente quebra

A Assistants API armazenava tudo no servidor: suas threads de conversa, seus uploads de arquivo, suas configurações de assistente. A Responses API jogou tudo isso fora — é stateless por padrão. Quer persistência de conversa? Use a nova Conversations API e um endpoint /responses/compact pra encolher contextos longos.

Mas a dor real é outra. Devs que construíram plataformas SaaS na Assistants API podiam criar programaticamente centenas de assistentes via API — dinamicamente, em escala. O substituto na Responses API? Uma feature chamada "Prompts" que só pode ser criada pelo dashboard UI. Não pela API. Pelo dashboard.

Como um dev colocou no fórum da comunidade: "Eu tenho centenas deles, criados, deletados e editados dinamicamente." Outro foi mais direto: "Sinceramente, tá tudo uma bagunça total."

A equipe da OpenAI publicou o anúncio de deprecação. Não respondeu às reclamações abaixo dele.

O jogo da deprecação suave

Aqui vai o truque: a OpenAI não matou na marra a maioria das APIs antigas ainda. A Assistants API ainda roda. Chat Completions ainda funciona. Mas a documentação migra pra plataforma mais nova. Respostas no StackOverflow referenciam o SDK mais novo. Exemplos oficiais mostram os padrões mais novos. Tutoriais da comunidade seguem o hype mais novo.

Seu código antigo ainda compila. Ele só vira um órfão — software funcionando que ninguém mais escreve tutorial sobre. Isso não é deprecação. É morte por inanição de recursos.

Enquanto isso, a OpenAI também está descontinuando DALL·E 2 & 3 (12 de maio de 2026), a Realtime API beta (7 de maio de 2026), Sora 2 (24 de setembro de 2026), e GPT-3.5-turbo-instruct (28 de setembro de 2026). Se você construiu na stack da OpenAI, você está gerenciando um calendário de deprecação, não um roadmap de produto.

O custo real não é em tokens

Migrar de Assistants pra Responses custa semanas de engenharia. Você reescreve gerenciamento de estado. Reescreve chamada de ferramentas. Reescreve lógica de orquestração. E o que o usuário ganha? Nada. O produto faz a mesma coisa que fazia antes. Você queimou uma sprint pra ficar no mesmo lugar.

Mas ficar parado cobra de outro jeito. Correções de bugs ficam mais lentas. Clientes enterprise perguntam por que você não está na plataforma mais recente. Devs novos que aprenderam pela documentação atual não conseguem ler seu código sem fazer arqueologia.

Escolha seu veneno.

Antes de adotar o Agents SDK

A atualização do Agents SDK de 15 de abril parece exatamente o que você gostaria — sandboxing nativo via Cloudflare, E2B, Modal, Vercel, runs duráveis com snapshots, memória configurável — se você confiasse que ainda vai ser a coisa que a OpenAI quer que você use daqui a doze meses. Mas considere o padrão: a OpenAI lançou uma nova plataforma para devs a cada 8-12 meses desde 2023. O Agents SDK vai ser a fundação — até a próxima fundação chegar.

Calcule o custo da reescrita. Não o preço do token. O custo da reescrita.

A API mais cara não é a que cobra mais por chamada. É a que te obriga a reconstruir seu produto todo ano pra continuar usando ela.