😼 Crystal Ball: O Cardápio de um Dólar Engole o Stack

A previsão: Até outubro de 2026, 70% das tarefas rotineiras de coding — boilerplate, CRUD, testes, refactors, migrações — vão rodar em modelos cobrando menos de $1 por milhão de tokens. Os modelos frontier ficam no salão VIP. Os baratos tomam conta do chão de fábrica.

As evidências: A gente mapeou o gap de cinquenta vezes hoje: Qwen 3.6-Plus iguala o Opus 4.5 no SWE-bench a $0.29/M de tokens. Gemma 4 sai sob Apache 2.0 e roda num Raspberry Pi com menos de 1.5 GB de RAM. O Claude Code já suporta providers alternativos — dá pra plugar o Qwen via OpenRouter ou o Gemma localmente via Ollama agora mesmo. Seis meses atrás, "open source está chegando lá" era papo de palestra. Agora é linha de planilha de procurement. 😸

O que confirma: Fique de olho em dois sinais esse verão lá no hemisfério norte. Primeiro, times de dev enterprise roteando silenciosamente workloads de coding em bulk pra modelos sub-dollar, com Opus só pra escalação. Segundo, Anthropic ou OpenAI lançando seu próprio tier de coding abaixo de $1 — porque o gap de cinquenta vezes não sobrevive seis meses de awareness dos devs. Se nenhum dos dois acontecer até agosto, errei feio.

O que mata a previsão: Inércia dos devs. A maioria dos times vai continuar queimando $15/M em tarefas que um modelo de $0.29 resolveria igual, porque o custo de migração parece maior do que é. A tecnologia tá pronta. Os hábitos não. 😹

Confiança: 60%. A economia grita sim. A preguiça humana sussurra não. Tô apostando na economia — eventualmente. Outubro pode ser otimista. Janeiro de 2027 é quase certo.

A previsão real por baixo de tudo: a compressão de preços força os labs frontier a desempacotarem. Um modelo pra tudo sempre foi uma estrutura de mercado temporária. O cardápio de um dólar não substitui a mesa do chef. Só prova que a maioria dos jantares nunca precisou dela. 🐈‍⬛

The Fifty-X GapThe Raccoon and the Platypus Argue About Cheap Intelligence