😼 Crystal Ball: Modelos Open Source Tomam o Dev até 2027

Minha aposta para os próximos vinte meses: até dezembro de 2027, modelos open-weight vão cobrir 80% das tarefas de dev em produção — geração de código, code review, refatoração, testes, documentação — rodando no hardware da empresa ou em cloud instâncias baratas, não em chamadas de API pra Anthropic ou OpenAI.

Não porque os modelos abertos vão ficar mais espertos. Mas porque a equação de confiança virou de cabeça pra baixo.

😸 O colapso de confiança que ninguém tá precificando.

A gente cobriu o segundo vazamento de source code da Anthropic hoje — e isso nem é o pior. O Pentágono tá botando AI providers na lista negra por questões de segurança. A OpenAI matou o Sora depois que não conseguiu parar de gerar conteúdo com copyright. Não são incidentes isolados. É um padrão: as empresas que pedem pra você mandar sua codebase proprietária pelos APIs delas não conseguem nem manter o próprio source code privado.

Quando seu AI provider vaza os próprios segredos duas vezes numa semana, a pergunta deixa de ser se a alternativa open é boa o suficiente e vira: por que a gente ainda tá mandando nosso código pra quem não consegue proteger o deles?

😼 E os modelos abertos ficaram bons o suficiente pra essa pergunta fazer sentido de verdade.

O Google lançou o Gemma 4 sob Apache 2.0 — o modelo dense de 31B ficou em #3 no Arena AI, batendo modelos proprietários vinte vezes maiores. O Qwen 3.5 da Alibaba bate o GPT-5-mini nos benchmarks por um trigésimo do custo. O DeepSeek V4 reescreveu o training stack pra rodar no silicon da Huawei, provando que nem a NVIDIA é obrigatória pra jogar. A galera do LocalLLaMA já tá rodando Gemma 4 em MacBooks — resultados mistos, mas a trajetória tá clara.

Duas forças convergindo: providers proprietários perdendo confiança exatamente quando as alternativas abertas estão fechando o performance gap. Pra 80% das tarefas de dev — o trabalho de rotina que não precisa de frontier reasoning — um modelo de 30B fine-tunado numa máquina de $3.000 supera uma chamada de API a $0,003 por token em latência, privacidade e custo total de propriedade.

😹 O que vai confirmar a previsão.

Fique de olho nas Fortune 500 anunciando estratégias de independência de modelos. Fique de olho nas guerras de preço de API que vão fazer as taxas atuais parecerem quase nada. Fique de olho no GitHub Copilot oferecendo um tier bring your own model. Qualquer dois dos três e a gente tá adiantado no cronograma.

Probabilidade honesta: 55%.

Os outros 20% das tarefas — o reasoning difícil, as decisões de arquitetura inéditas, aqueles momentos de explica essa codebase que eu nunca vi — esses ainda precisam de modelos frontier. E provavelmente a gente tá subestimando a velocidade com que os labs proprietários vão cortar preços pra competir. Mas a direção? 😼 A direção é certeza absoluta.

O dominó que ninguém tá vendo: tem aproximadamente $300 bilhões em venture funding apostando que os moats de AI proprietário vão aguentar. Se os modelos abertos comerem os 80% de rotina, esse moat não só encolhe — ele colapsa numa fina camada premium pra frontier reasoning. Muitas valuations atuais estão precificadas pra quem tem o modelo, quando o mercado tá indo pra quem tem os dados e o deployment. Esse repricing vai ser violento.

A era de pagar por token pra trabalho de rotina tá acabando. A única questão é se isso acontece em 2027 ou 2028.