O Oligopólio dos Browser-Agents Que Ninguém Votou

Você mandou seu agente de IA novinho em folha "procurar passagens e comprar a mais barata abaixo de R$ 2.500". Ele abriu o navegador, clicou por quatro minutos e te entregou uma confirmação pro aeroporto errado. Não um voo diferente — uma cidade diferente. Parabéns, você acabou de pagar R$ 2.350 pra visitar um lugar que não tinha planejado.

Essa é a parte que ninguém comenta. Todo mundo discute sobre orchestration SDKs (o código-cola que encadeia chamadas de IA) e plataformas de agentes gerenciadas (caixinhas hospedadas onde seu agente mora). Enquanto isso, a infraestrutura real que permite um agente "usar a internet" — um headless browser (uma instância do Chrome sem janela visível, controlada por código) pilotado por um vision model (uma IA que lê screenshots como um humano faria) — é mais nova, mais instável e mais concentrada do que a camada de LLM (large language model — o cérebro por trás do ChatGPT, Claude, Gemini) que todo mundo fica obcecado.

Entre 2 e 15 de abril de 2026, a camada de browser-agent se cristalizou. No dia 2 de abril, o framework open-source Browser Use lançou a v0.12.6 com aquela linha reveladora no changelog: "fix O(n²) bottlenecks in DOM capture for heavy pages" — tradução: o release anterior deles ficava quadraticamente lento em sites grandes, e ninguém notou até estourar em produção 😹. No dia 3 de abril, o Browser Use Cloud ficou free-to-start, e agentes de código como o Claude Code agora podem se cadastrar em contas do Browser Use sozinhos pelo CLI. Agentes provisionando agentes. Bem-vindo a 2026 🙀.

No dia 6 de abril, a Browserbase lançou o Stagehand Model Gateway — "uma API key, uma fatura, acesso aos melhores modelos sem gerenciar provedores", segundo os autores Miguel Gonzalez e Harsehaj Dhami. Eles não são mais só o fornecedor de browser. Querem ser a espinha de faturamento acima da camada de LLM.

Aí vieram as 48 horas pesadas. No dia 14 de abril, a Anthropic reconstruiu o Claude Code desktop e lançou Routines — workflows de agente agendados rodando na cloud da Anthropic. No dia 15 de abril, a OpenAI soltou uma atualização monstruosa do Agents SDK com sandboxing (workspaces isolados pra que agentes paralelos não destruam o estado um do outro), subagents, code mode e suporte a mais de 100 LLMs. The New Stack chamou isso de "separar o harness da computação" — uma forma educada de dizer que a OpenAI quer comer o almoço da Browserbase.

Três arquiteturas estão brigando. Navegação por accessibility-tree (ler o esqueleto estruturado de um site do jeito que um leitor de tela faz). Cliques por vision-model (o Claude Computer Use literalmente olha pra um screenshot e diz "clica em x=420, y=380"). E híbrida, como o Stagehand, que usa as duas. No benchmark WebArena-Verified (um teste padrão de agentes fazendo tarefas reais na web), o GPT-5.4 tira 67,3%. No OSWorld-Verified, 75% — acima da baseline humana de 72,4%. Parece ótimo até você ler o paper de Berkeley "Illusion of Progress", que argumenta que a maioria dos web agents ainda performa abaixo de uma baseline de 2024 em sites nos quais não foram treinados 😾.

Agora o preço. Minutos de sessão de browser + tokens de LLM + loops de retry + taxas de proxy residencial facilmente triplicam o custo por tarefa versus um agente só de texto. Pior: os modos de falha são silenciosos, não barulhentos — o agente confiantemente reserva o voo errado. Sem stack trace. Só uma cobrança no seu cartão e um hotel em Osasco quando você queria ir pra Ouro Preto 🐈‍⬛.

É o seguinte. Se você lança um agente que toca a web, você já escolheu um fornecedor de browser quer saiba ou não. Seu orchestration SDK importa ele transitivamente. Sua "plataforma de agentes" é um wrapper fino em volta da Browserbase, Browser Use ou Anthropic Computer Use. A decisão de procurement que você não tomou é provavelmente o maior risco de confiabilidade da sua stack.

A guerra do Playwright da era dos agentes acabou antes da maioria dos times notar que começou. O browser agora é um item de linha tarifado, faturável e mediado por LLM em todo sistema de IA em produção. Confere suas faturas 😼.

O Oligopólio dos Browser-Agents Que Ninguém Votou

Keep reading

Tool-Calling Morreu. Agora os Agentes Escrevem Código.

O Gap do Checkpoint: Agentes de Várias Horas Chegaram Antes do Crash Recovery

Todo SDK de Agente Entrega um Runtime. Nenhum Entrega os Testes.

Dois Vazamentos, Uma Empresa e um Vale-Dívida de $852 Bilhões