Você usa a API do Claude — um jeito do seu app conversar com a IA da Anthropic, tipo um garçom entre o seu código e a cozinha. Manda um prompt, recebe uma resposta, paga por token (um pedaço de palavra que a IA lê, mais ou menos ¾ de uma palavra em inglês). Negócio padrão. Se não gostar, troca pro GPT numa tarde.
Mas rodar agentes de IA — programas que usam IA pra completar tarefas de múltiplas etapas sozinhos — em produção exige uma infraestrutura que ninguém quer construir. Sandboxing, gerenciamento de estado, recuperação de erros, escalabilidade. A distância entre "funciona na demo" e "funciona numa terça às 3 da manhã quando tudo explode" mata a maioria dos projetos de agentes antes de saírem do papel.
Em 8 de abril, a Anthropic lançou o Managed Agents — um serviço na nuvem que hospeda, executa e gerencia seus agentes de IA nos servidores da Anthropic. O preço: $0,08 por session-hour (pense nisso como alugar um servidorzinho pro seu agente) mais os custos padrão de tokens. Notion, Rakuten, Asana e Sentry entraram como early adopters.
Veja o que você ganha por esses oito centavos. Cada agente roda num container isolado — uma caixa lacrada que não consegue tocar em nada fora dela — com checkpoints automáticos (pontos de salvamento pra seu agente retomar depois de um crash), permissões com escopo definido (ele só acessa o que você permitir) e suporte a sessões que rodam por horas. Segundo o SiliconANGLE, a Rakuten implementou agentes em cinco departamentos — produto, vendas, marketing, finanças, RH — em uma semana por agente. A Sentry conectou sua ferramenta de debugging com um agente Claude que agora escreve patches e abre pull requests (propostas de mudança de código enviadas pra revisão). A Notion integrou agentes que permitem engenheiros entregar código e trabalhadores de conhecimento gerar apresentações direto nos seus workspaces.
O timing conta a história real. Um dia antes, em 7 de abril, a Anthropic bateu $30 bilhões em receita anualizada — receita anual projetada a partir dos ganhos mensais atuais — contra $9B no final de 2025. Isso é um salto de 3,3x em quatro meses, ultrapassando os ~$25B da OpenAI pela primeira vez. Clientes enterprise gastando mais de $1 milhão por ano dobraram para mais de 1.000 desde fevereiro. Oito das dez maiores da Fortune 10 são clientes da Anthropic. O Claude Code — a ferramenta de programação da Anthropic — sozinho puxa $2,5 bilhões em receita anualizada depois de nove meses no mercado. O MCP (Model Context Protocol — um padrão universal de conexão pra ferramentas de IA, tipo USB mas pra dados) atingiu 97 milhões de instalações até março de 2026.
Vê o padrão? A API te dá o modelo. O Claude Code te dá ferramentas de desenvolvedor. O MCP padroniza como as ferramentas se conectam. O Managed Agents hospeda toda a carga de trabalho. Cada camada faz a próxima parecer uma evolução natural, não uma decisão de trocar de fornecedor. É a AWS lá por 2008 — começa com compute, depois vai ficando progressivamente mais difícil sair. A receita da Anthropic não triplica em quatro meses porque o modelo ficou três vezes mais inteligente. Triplica porque cada camada de infraestrutura potencializa a debaixo dela.
Os tradeoffs são reais, e os novos são piores que os antigos. O Managed Agents introduz cobrança em duas camadas — tempo mais tokens — e ninguém sabe quanto um workflow complexo de agente realmente custa até a fatura chegar. Um agente de programação que roda por quatro horas, bate em três becos sem saída, volta atrás e finalmente entrega um fix? Você paga por cada minuto de enrolação mais cada token de raciocínio. Com uma chamada de API simples, o custo escala com o output. Com session-hours, o custo escala com quanto tempo seu agente pensa — inclusive quando pensa errado. Previsão de orçamento pra cargas de trabalho de agentes acabou de virar um jogo de adivinhação fantasiado de modelo de precificação.
Mas a cobrança nem é o gancho mais afiado. Quando seu agente roda no Managed Agents, o estado dele — checkpoints, histórico de execução, memória de runtime — vive nos servidores da Anthropic. Não é o seu código. Não são os seus prompts. É o contexto operacional real que seu agente acumula enquanto faz o trabalho dele. Um agente da Sentry que passou três meses aprendendo as manias do seu codebase, construindo contexto implícito sobre quais arquivos quebram juntos, quais padrões de PR causam regressões? Esse conhecimento de runtime existe dentro dos containers da Anthropic. Você pode exportar seu código quando quiser. Você não pode exportar o que seu agente se tornou. Isso não é o velho lock-in de trocar de API. Isso é dependência de fornecedor no nível de memória institucional.
E o modelo de session-hour cria um incentivo que a Anthropic nunca vai mencionar num blog de lançamento. Cada minuto que seu agente roda é receita. Agentes eficientes que resolvem problemas rápido rendem menos pra Anthropic do que agentes que deliberam, tentam de novo e exploram. A plataforma lucra com tempo de compute, não com resultados. Seu incentivo — resultados rápidos e baratos — vai diretamente contra a estrutura de preços. Essa tensão não vai importar a $0,08 por hora. Vai importar enormemente quando o Managed Agents processar milhares de sessões simultâneas e essa tarifa se ajustar às "condições de mercado".
A Anthropic vende quatro camadas de infraestrutura de IA agora. O modelo — aquela coisa que você achava que estava comprando — é só a camada um. As ferramentas, o protocolo, o stack de hospedagem acima dele: é aí que a margem mora. E com o Managed Agents, pela primeira vez, seus dados operacionais — não só suas chamadas de API, mas o comportamento aprendido e o estado de runtime dos seus agentes — ficam nos servidores deles. Você não está mais alugando compute. Você está depositando conhecimento institucional no cofre de outra pessoa e torcendo pra que as condições de saque continuem favoráveis.



