😼 Crystal Ball: El Menú del Dólar Se Come el Stack
La predicción: Para octubre de 2026, el 70% de las tareas rutinarias de coding — boilerplate, CRUD, tests, refactors, migraciones — correrán en modelos que cobran menos de $1 por millón de tokens. Los modelos frontier se quedan en el salón VIP. Los baratos toman el piso de producción.
La evidencia: Hoy mapeamos la brecha de cincuenta veces: Qwen 3.6-Plus iguala a Opus 4.5 en SWE-bench a $0.29/M tokens. Gemma 4 sale bajo Apache 2.0 y corre en una Raspberry Pi con menos de 1.5 GB de RAM. Claude Code ya soporta providers alternativos — podés conectar Qwen vía OpenRouter o Gemma localmente vía Ollama ahora mismo. Hace seis meses, "el open source está alcanzando" era tema de charla en conferencias. Ahora es una fila en la planilla de procurement. 😸
Qué lo confirma: Buscá dos señales este verano. Primero, equipos de dev enterprise enrutando en silencio workloads de coding en bulk a modelos sub-dollar, con Opus solo para escalación. Segundo, Anthropic u OpenAI lanzando su propio tier de coding bajo $1 — porque la brecha de cincuenta veces no sobrevive seis meses de awareness dev. Si ninguno de los dos pasa antes de agosto, me equivoqué.
Qué lo mata: La inercia de los devs. La mayoría de los equipos va a seguir quemando $15/M en tareas que un modelo de $0.29 resuelve igual, porque el costo de cambio se siente más alto de lo que es. La tecnología está lista. Los hábitos no. 😹
Confianza: 60%. La economía grita sí. La pereza humana susurra no. Apuesto a la economía — eventualmente. Octubre puede ser optimista. Enero 2027 es casi seguro.
La predicción real por debajo: la compresión de precios obliga a los labs frontier a desagrupar. Un modelo para todo siempre fue una estructura de mercado temporal. El menú del dólar no reemplaza la mesa del chef. Solo demuestra que la mayoría de las cenas nunca la necesitaron. 🐈⬛
→ The Fifty-X Gap → The Raccoon and the Platypus Argue About Cheap Intelligence





