Seu Agente de IA Nao Tem Tecla Backspace

Você colocou agentes autônomos em produção neste mês. Eles criam pull requests, atualizam tickets de projeto, fazem push de configurações para servidores de produção e disparam notificações no Slack — tudo enquanto você dorme. O pitch: delegue o trabalho chato, acorde com a lista de tarefas prontas.

O problema: agentes erram. Não de vez em quando — o estudo MAST da UC Berkeley, publicado em março de 2025, mediu taxas de falha de 41% a 86,7% em sete sistemas multi-agente de ponta. E diferente de um chatbot alucinando uma resposta errada que você pode regenerar, o erro de um agente é um commit mergeado, um ticket criado no Jira, uma mensagem enviada. Ações reais em sistemas reais. Você não pode "regenerar" uma config deployada.

Entre 8 e 17 de abril, as três grandes plataformas lançaram runtimes autônomos. Em 8 de abril, a Anthropic lançou Managed Agents — sandboxing, persistência de estado, recuperação de erros (ou seja: retomar após um crash). Em 14 de abril, a Anthropic adicionou Routines — agentes rodando na nuvem deles, disparados por schedules ou webhooks. Em 15 de abril, a OpenAI lançou o Agents SDK v0.14 com execução sandboxed e "snapshotting" — recuperação do estado do container após falhas. Em 17 de abril, o Google lançou o Agent Development Kit (ADK) com gerenciamento de estado por sessão e orquestração multi-agente. Três plataformas, zero primitivas de rollback — mecanismos que permitiriam reverter o que um agente fez depois que ele já terminou de fazer a coisa errada.

Eu escrevi sobre o gap de checkpoint na semana passada — plataformas resolvendo crash recovery no meio da execução. Esse é o problema fácil. Seu agente morreu no meio da tarefa, a plataforma restaura o estado dele, o agente tenta de novo. Beleza. Mas aqui está o cenário que ninguém resolve: seu agente completou com sucesso. Ele rodou até o fim, reportou checkmarks verdes, e o resultado é lixo. O PR mergeia lógica quebrada. O ticket do Jira duplica um existente. A página do Notion sobrescreve dados corretos com dados alucinados. O agente não crashou — ele terminou errado com toda a confiança do mundo.

Quando um agente mergeia um pull request ruim, cria tarefas duplicadas no Asana, ou pusha uma página quebrada no Notion, o que acontece é o seguinte: você — o humano — precisa manualmente identificar cada ação que o agente tomou, rastrear os efeitos downstream (outro agente reagiu ao PR ruim? algum webhook disparou?), e reverter uma por uma. Essa limpeza escala linearmente com o número de ações tomadas. Mais autonomia significa mais bagunça pra limpar.

Por que rollback não existe nativamente? Dois motivos. Primeiro, reversibilidade exige semântica transacional — ações compensatórias, chaves de idempotência, journals de ações. As ferramentas subjacentes — GitHub, Linear, Slack, Notion — não expõem essas primitivas para agentes. Sua plataforma de agentes não fala "desfazer" porque as ferramentas que ela chama também não falam "desfazer". Segundo — e essa é a parte que ninguém fala em voz alta — não existe incentivo de negócio. Cada ação de agente é uma chamada de API cobrável. Cada re-execução após um rollback falho é outra sessão cobrável. Os vendors de plataforma lucram com execução append-only. Construir undo significa construir um motivo para clientes usarem menos ciclos de computação. Ninguém se voluntaria para esse modelo de receita.

Entram os vendors de backup, preenchendo alegremente o gap que as plataformas de agentes se recusam a preencher. Em 14 de abril, a Commvault lançou o AI Protect — comercializado literalmente como "Ctrl+Z para agentes de IA descontrolados." Ele mapeia o blast radius de uma sessão de agente, isola mudanças causadas por agentes das mudanças humanas, e permite reversão seletiva. Como Pranay Ahlawat, CTO da Commvault, colocou: "Em ambientes agentic, agentes mutam estado em dados, sistemas e configurações de formas que se compõem rápido e são difíceis de rastrear." A ironia é grossa o suficiente pra cortar com faca: o builder da sua plataforma de IA não vai construir undo porque machuca as margens dele; o vendor de backup vai, porque a incompetência do seu agente é o mercado endereçável deles. Dois pontos cegos, um desastre extremamente lucrativo.

A equação de produtividade de agentes precisa de uma atualização. Se mesmo 30% das execuções autônomas exigem reversão manual — e a reversão leva mais tempo que a tarefa original — o ROI líquido fica negativo para aquele workflow. Você economizou 10 minutos no caminho feliz e gastou 40 minutos limpando o caminho triste.

A primeira plataforma a lançar agent.rollback(session_id) ganha a confiança enterprise. Não porque enterprises precisam de agentes que nunca falham — tudo falha — mas porque precisam de agentes cujas falhas custem menos do que seus sucessos economizam. Até lá, toda plataforma de agentes é append-only: ela consegue fazer coisas, mas não consegue des-fazer coisas. Seu assistente autônomo não tem tecla backspace.

Seu Agente de IA Nao Tem Tecla Backspace

Keep reading

O Paradoxo dos Agentes: Menos Autonomia, Mais Valor

Tres Plataformas de Agentes, Tres Especies Diferentes

A Anthropic construiu uma plataforma em cima das plataformas que a financiam. Os senhorios acabaram de perceber.

A Janela de Permissao do Seu Agente e Placebo