Você é tech lead olhando pra quatro faturas de ferramentas de IA pra código — aquele software que escreve junto com seus devs, tipo um júnior muito rápido mas absurdamente caro. Uma fatura diz "licenças". Outra diz "tokens". A terceira diz "horas de sessão". A quarta diz "créditos". Sua planilha não tem uma coluna em comum. Seu financeiro tá fazendo perguntas que você não consegue responder.
Isso não deveria ser difícil. Você só quer saber qual ferramenta custa menos por dev por mês. Mas nenhum fornecedor nesse planeta vai te dar esse número — porque a confusão É o produto.
Só nos últimos quatro dias, o caos de precificação entrou em estado terminal. Em 18 de abril, a Anysphere, dona do Cursor, fechou uma rodada de US$ 2B a um valuation de US$ 50B — o tipo de caixa que permite queimar dinheiro com experimentos de pricing indefinidamente. A empresa vende créditos de uso equivalentes a dólares por US$ 20–200/mês. Em 20 de abril, o GitHub simplesmente pausou novas assinaturas do Copilot no modelo de licença fixa, citando "sustentabilidade" — palavra que empresas usam quando a unit economics tá sangrando. Isso vem depois de semanas de dança das cadeiras nos modelos de cobrança: em 4 de abril, a OpenAI migrou o Codex pra créditos baseados em tokens, a Anthropic lançou Managed Agents em 8 de abril a US$ 0,08 por hora de sessão mais cobrança por token mais US$ 10 a cada mil buscas na web, e o Windsurf já tinha implementado cotas diárias lá em 12 de março. Seis fornecedores, seis modelos de cobrança, zero sobreposição.
Agora, a parte em que sua carteira pega fogo e ninguém manda notificação. Cada unidade de cobrança esconde uma armadilha diferente — e a mais traiçoeira mora dentro dos modelos de raciocínio. A série o da OpenAI e os modos de extended thinking da Anthropic geram reasoning tokens ocultos: cadeia de pensamento interna que o modelo produz antes de responder. Você não vê. Mas paga. Um estudo de Stanford e UC Berkeley publicado em 25 de março descobriu que a geração de reasoning tokens varia em até 9,7× entre execuções do mesmo prompt — e que o ranking de custo entre modelos pode inverter por um fator de 28 dependendo de qual execução você mede. (Cobri o estudo em detalhe na minha análise de 20 de abril — a versão curta é que sua estimativa de orçamento não está errada, é um gerador de números aleatórios.) Separadamente, o tokenizer do Opus 4.7 da Anthropic produz mais tokens pro mesmo texto que o antecessor — mesmo preço por token, mais tokens por request, como a análise de troca de modelo de ontem explorou. O sistema de créditos do Cursor estrangula power users no meio da sessão quando eles queimam os fast requests. E a tarifa fixa do Copilot? Subsidia o dev que usa duas vezes por dia às custas de quem vive dentro da ferramenta.
Quando você tenta normalizar tudo pra custo por output real — digamos, custo por pull request mergeado (uma alteração de código concluída que passou por review) — o cenário muda dramaticamente. Os benchmarks do Q1 2026 da GetDX, publicados em 15 de abril, com 64.680 desenvolvedores mostram usuários de Cursor em 4,1 PRs/dia versus 3,61 do Copilot. A diferença de 10× no preço de tabela comprime pra aproximadamente 2–4× por resultado entregue. Mas o fornecedor mais barato inverte dependendo de se seu time escreve 50 linhas por dia ou 500.
Cada modelo de precificação também muda como os devs realmente trabalham. Licença fixa incentiva experimentação — testa qualquer coisa, já tá pago. Cobrança por token pune exploração — cada keystroke tem preço. Horas de sessão recompensam agentes rápidos e penalizam debugging. Cotas diárias criam um paredão onde sua ferramenta simplesmente para no meio da tarde.
Então, o que você faz de verdade? Seu time de procurement precisa de uma métrica: custo mensal estimado por dev no seu padrão de uso. Nenhuma página de pricing vai te dar isso. O único caminho honesto é um trial paralelo de duas semanas com seu codebase real e seus humanos reais.
O mercado de IA pra código acabou de terceirizar a matemática pro comprador. O primeiro fornecedor que publicar uma calculadora transparente de custo por resultado ganha a próxima onda de contratos enterprise. O resto tá apostando que você não vai fazer o dever de casa. A maioria de vocês não vai.




