Todo fornecedor de IA passou abril te vendendo o mesmo sonho: agentes autônomos — pequenos funcionários digitais que escrevem código, fecham tickets e respondem e-mails de clientes enquanto você foca em "estratégia". Anthropic, OpenAI, Google — os três lançaram plataformas de agentes num intervalo de duas semanas. Seu feed do LinkedIn parece feira de recrutamento de robôs.
O detalhe que ninguém menciona no palco: seu chefe acabou de te mandar mensagem no Slack perguntando quando o SEU time vai implementar agentes. As demos são lindas — um agente vai de bug report a pull request em minutos, a plateia aplaude como se nunca tivesse visto um script bash. Mas o que realmente acontece depois que a demo acaba e as câmeras param de gravar?
Três lançamentos caíram um em cima do outro. A Anthropic lançou os Managed Agents em 8 de abril — APIs de agentes hospedadas na nuvem (uma forma do seu software criar e controlar agentes remotamente) a $0,08 por hora de sessão. A OpenAI atualizou seu Agents SDK em 15 de abril com execução sandbox nativa — agentes rodam código dentro de uma caixa lacrada para não quebrarem nada do lado de fora. E o Google Cloud Next começou em 22 de abril com uma keynote intitulada "The Agentic Cloud", destacando o ADK (Agent Development Kit), lançado no início do mês. O Google incluiu human-in-the-loop como funcionalidade de primeira classe desde o dia um — pause um agente no meio da tarefa, peça aprovação humana, retome.
Os early adopters entraram rápido. A Rakuten implantou agentes especializados em cinco departamentos — produto, vendas, marketing, finanças, RH — cada um entrando em produção em menos de uma semana. O CTO da Asana relatou entregar features "dramaticamente mais rápido". A Notion plugou o Claude direto nos workspaces para execução paralela de tarefas. E a Sentry? A Sentry mandou ver: o agente deles vai de bug sinalizado a pull request aberto com zero intervenção humana. Totalmente autônomo. O sonho do fornecedor virando realidade.
Mas aqui vem a parte desconfortável. Se você acompanhou pesquisas independentes este mês — e este canal citou tantas que os leitores frequentes já decoraram os números — o padrão nunca muda. Código de IA entrega 1,7× mais defeitos. PRs sobem 20% enquanto incidentes sobem 23,5%. Desenvolvedores deletam um quinto do código gerado por IA e reescrevem pesadamente outros 7%. Gartner prevê que 40% dos projetos de agentes morrem até 2027. Mais output, piores resultados. Todo santo estudo. 😹
Andrej Karpathy avisou em 3 de abril — antes de qualquer uma dessas três plataformas ser lançada. "A indústria está dando um salto grande demais e tentando fingir que isso é incrível, e não é." Três semanas e três lançamentos depois, nada provou que ele estava errado.
Isso cria um abismo estrutural entre marketing e realidade. Os fornecedores competem por autonomia máxima porque fica lindo no palco. Mas os dados de produção dizem o contrário: escopo restrito supera capacidade ampla. Workflows de leitura (onde agentes analisam mas raramente modificam) superam os de escrita. Checkpoints humanos antes de qualquer ação consequente superam o piloto automático total. Até o sucesso "totalmente autônomo" da Sentry funciona justamente porque bug-triage-to-PR é um domínio inerentemente restrito — não porque autonomia em si funciona. 😾
O Google talvez tenha entendido isso. O ADK deles traz human-in-the-loop como o caminho padrão, não como um adendo. Como John Furrier do SiliconANGLE escreveu em 20 de abril: "Features ficam em cima de plataformas. Sistemas operacionais definem a plataforma." A competição real não é quem constrói o agente mais autônomo — é quem constrói o melhor control plane.
Então quando seu chefe perguntar sobre agentes, não encaminhe o clipe da keynote. Faça uma pergunta sobre qualquer plataforma: quão fácil é construir um agente com escopo bem restrito, com limites explícitos, padrão de somente leitura e aprovação humana obrigatória antes de qualquer ação consequente? Se a resposta for "bom, dá pra configurar isso..." — caia fora. Se for o padrão — talvez você tenha algo. 😼
O agente mais inteligente não vai vencer a guerra das plataformas. O mais controlável vai. E isso inverte a prioridade atual de todo fornecedor. 🐈

