Toda ferramenta de código com IA que você usa agora — Cursor, Copilot, Windsurf — roda no cérebro de outra pessoa. Você digita código, o editor manda pra Claude ou GPT através de uma API (um cano que conecta seu editor a uma IA remota), e um modelo feito pra escrever poesia, planejar férias e também programar devolve uma sugestão. Funciona. Mas é lento, genérico, e você tá alugando inteligência de empresas que amanhã podem te engolir.
Windsurf — a IDE nativa de IA que nasceu como Codeium, e depois foi adquirida pela Cognition em 2025 — decidiu que alugar era pra otário.
Em 29 de outubro de 2025, a Cognition lançou o SWE-1.5, a versão mais recente da família de modelos customizados construídos especificamente para engenharia de software. Não é um fine-tune (ajustar um modelo existente com dados extras de treino). Não é um wrapper. É um modelo de escala frontier com centenas de bilhões de parâmetros (os botões internos que uma IA usa pra tomar decisões). A Cognition treinou do zero com reinforcement learning (um método de ensino de IA onde o modelo aprende por tentativa e erro) em tarefas reais de programação.
No SWE-Bench Pro — o benchmark padrão da indústria com 731 tarefas desafiadoras de código em 41 repositórios — o SWE-1.5 marcou 40.08%. Claude Sonnet 4.5 marcou 43.60%. Perto o suficiente pra levantar sobrancelhas, especialmente considerando o que vem a seguir.
A Windsurf fez parceria com a Cerebras, uma empresa de chips que constrói hardware especializado para IA, pra servir o SWE-1.5 a até 950 tokens por segundo. Um token equivale a mais ou menos três quartos de uma palavra em inglês — então 950 tokens/seg significa que o modelo gera texto aproximadamente 13x mais rápido que o Sonnet 4.5 e 6x mais rápido que o Haiku 4.5. A Cognition também reescreveu seus pipelines internos de lint checking (detecção automática de erros no código) e execução de comandos, cortando até 2 segundos de overhead por passo em sessões de agente — aqueles loops iterativos onde a IA lê código, roda testes, lê erros e corrige as coisas.
O resultado prático: workflows de agente que levam minutos no Sonnet terminam em segundos no SWE-1.5. Pra devs que ficam o dia inteiro no ciclo corrige-testa-corrige-testa, essa diferença de velocidade vira horas economizadas por semana. O loop entre "corrige isso" e "tá corrigido" encolhe de pausa-pro-café pra piscar-e-perdeu. Pra um gato que valoriza sonecas e eficiência, profundamente atraente. 😸
Em 24 de dezembro de 2025, a Wave 13 colocou o SWE-1.5 como modelo padrão — de graça pra todos os usuários por três meses. Esse período grátis acabou em 27 de março de 2026, quando a Windsurf lançou um novo sistema de cobrança por cota. Estratégia clássica de traficante: a primeira dose é grátis, depois você já tá viciado na velocidade e $30/mês de repente parece razoável. Esperto. Diabólico. 😹
Mas aqui vem a parte que ninguém quer discutir. A Cognition treinou o SWE-1.5 especificamente em tarefas de coding agêntico — e depois testou num benchmark que mede tarefas de coding agêntico. Ir bem na prova que você estudou é esperado, não impressionante. A verdadeira pergunta é se o SWE-1.5 aguenta em codebases bagunçadas do mundo real que não se parecem em nada com os dados de treino.
E tem uma preocupação maior. Se toda empresa de IDE treinar seu próprio modelo proprietário, a gente acaba com jardins murados. Sua escolha de IDE determina seu modelo de IA. Seu modelo determina sua IDE. Vendor lock-in com passos extras. Pelo menos quando todo mundo usava GPT-4, você podia trocar de editor sem ter que reaprender todas as manias de um modelo completamente diferente. 😾
Ainda assim — treinar seu próprio modelo frontier em vez de pagar aluguel pro Sam Altman? Essa é a jogada estratégica certa. Toda empresa de IDE mandando chamadas de API pra OpenAI financiou seu futuro concorrente. A Cognition disse "não, obrigado" e construiu seu próprio cérebro. Os benchmarks confirmam. A velocidade confirma ainda mais.
Dois anos atrás, toda ferramenta de código com IA era um wrapper fino em cima da API da OpenAI. Hoje, a Windsurf treina seus próprios modelos, o Cursor roda fine-tunes customizados, o Copilot já passou das completions cruas do GPT. A camada de IDE tá virando a camada de modelo. Competição é bom. O desenvolvedor ganha.
O gato observa. 🐈





