Você colocou agentes autônomos em produção neste mês. Eles criam pull requests, atualizam tickets de projeto, fazem push de configurações para servidores de produção e disparam notificações no Slack — tudo enquanto você dorme. O pitch: delegue o trabalho chato, acorde com a lista de tarefas prontas.
O problema: agentes erram. Não de vez em quando — o estudo MAST da UC Berkeley, publicado em março de 2025, mediu taxas de falha de 41% a 86,7% em sete sistemas multi-agente de ponta. E diferente de um chatbot alucinando uma resposta errada que você pode regenerar, o erro de um agente é um commit mergeado, um ticket criado no Jira, uma mensagem enviada. Ações reais em sistemas reais. Você não pode "regenerar" uma config deployada.
Entre 8 e 17 de abril, as três grandes plataformas lançaram runtimes autônomos. Em 8 de abril, a Anthropic lançou Managed Agents — sandboxing, persistência de estado, recuperação de erros (ou seja: retomar após um crash). Em 14 de abril, a Anthropic adicionou Routines — agentes rodando na nuvem deles, disparados por schedules ou webhooks. Em 15 de abril, a OpenAI lançou o Agents SDK v0.14 com execução sandboxed e "snapshotting" — recuperação do estado do container após falhas. Em 17 de abril, o Google lançou o Agent Development Kit (ADK) com gerenciamento de estado por sessão e orquestração multi-agente. Três plataformas, zero primitivas de rollback — mecanismos que permitiriam reverter o que um agente fez depois que ele já terminou de fazer a coisa errada.
Eu escrevi sobre o gap de checkpoint na semana passada — plataformas resolvendo crash recovery no meio da execução. Esse é o problema fácil. Seu agente morreu no meio da tarefa, a plataforma restaura o estado dele, o agente tenta de novo. Beleza. Mas aqui está o cenário que ninguém resolve: seu agente completou com sucesso. Ele rodou até o fim, reportou checkmarks verdes, e o resultado é lixo. O PR mergeia lógica quebrada. O ticket do Jira duplica um existente. A página do Notion sobrescreve dados corretos com dados alucinados. O agente não crashou — ele terminou errado com toda a confiança do mundo.
Quando um agente mergeia um pull request ruim, cria tarefas duplicadas no Asana, ou pusha uma página quebrada no Notion, o que acontece é o seguinte: você — o humano — precisa manualmente identificar cada ação que o agente tomou, rastrear os efeitos downstream (outro agente reagiu ao PR ruim? algum webhook disparou?), e reverter uma por uma. Essa limpeza escala linearmente com o número de ações tomadas. Mais autonomia significa mais bagunça pra limpar.
Por que rollback não existe nativamente? Dois motivos. Primeiro, reversibilidade exige semântica transacional — ações compensatórias, chaves de idempotência, journals de ações. As ferramentas subjacentes — GitHub, Linear, Slack, Notion — não expõem essas primitivas para agentes. Sua plataforma de agentes não fala "desfazer" porque as ferramentas que ela chama também não falam "desfazer". Segundo — e essa é a parte que ninguém fala em voz alta — não existe incentivo de negócio. Cada ação de agente é uma chamada de API cobrável. Cada re-execução após um rollback falho é outra sessão cobrável. Os vendors de plataforma lucram com execução append-only. Construir undo significa construir um motivo para clientes usarem menos ciclos de computação. Ninguém se voluntaria para esse modelo de receita.
Entram os vendors de backup, preenchendo alegremente o gap que as plataformas de agentes se recusam a preencher. Em 14 de abril, a Commvault lançou o AI Protect — comercializado literalmente como "Ctrl+Z para agentes de IA descontrolados." Ele mapeia o blast radius de uma sessão de agente, isola mudanças causadas por agentes das mudanças humanas, e permite reversão seletiva. Como Pranay Ahlawat, CTO da Commvault, colocou: "Em ambientes agentic, agentes mutam estado em dados, sistemas e configurações de formas que se compõem rápido e são difíceis de rastrear." A ironia é grossa o suficiente pra cortar com faca: o builder da sua plataforma de IA não vai construir undo porque machuca as margens dele; o vendor de backup vai, porque a incompetência do seu agente é o mercado endereçável deles. Dois pontos cegos, um desastre extremamente lucrativo.
A equação de produtividade de agentes precisa de uma atualização. Se mesmo 30% das execuções autônomas exigem reversão manual — e a reversão leva mais tempo que a tarefa original — o ROI líquido fica negativo para aquele workflow. Você economizou 10 minutos no caminho feliz e gastou 40 minutos limpando o caminho triste.
A primeira plataforma a lançar agent.rollback(session_id) ganha a confiança enterprise. Não porque enterprises precisam de agentes que nunca falham — tudo falha — mas porque precisam de agentes cujas falhas custem menos do que seus sucessos economizam. Até lá, toda plataforma de agentes é append-only: ela consegue fazer coisas, mas não consegue des-fazer coisas. Seu assistente autônomo não tem tecla backspace.


