😼 Crystal Ball: Los modelos open source se toman el dev para 2027
Mi apuesta para los próximos veinte meses: para diciembre de 2027, los modelos open-weight van a manejar el 80% de las tareas dev en producción — generación de código, code review, refactoring, testing, documentación — corriendo en hardware propio o instancias cloud baratas, no en llamadas a la API de Anthropic u OpenAI.
No porque los modelos abiertos vayan a ser más inteligentes. Sino porque la ecuación de confianza se volteó.
😸 El colapso de confianza que nadie está descontando.
Hoy cubrimos el segundo leak de source code de Anthropic — y eso ni siquiera es lo peor. El Pentágono está metiendo a providers de AI en listas negras por problemas de seguridad. OpenAI mató a Sora después de que no pudo frenar la generación de contenido con copyright. Estos no son incidentes aislados. Es un patrón: las empresas que te piden que pipes tu codebase propietaria por sus APIs no pueden ni mantener su propio source code privado.
Cuando tu AI provider filtra sus propios secretos dos veces en una semana, la pregunta deja de ser si la alternativa open es suficientemente buena y se convierte en: ¿por qué seguimos mandando nuestro código a gente que no puede proteger el suyo?
😼 Y los modelos abiertos acaban de ponerse lo suficientemente buenos como para hacer esa pregunta en serio.
Google lanzó Gemma 4 bajo Apache 2.0 — su modelo dense de 31B está en el #3 de Arena AI, superando modelos propietarios veinte veces más grandes. El Qwen 3.5 de Alibaba iguala a GPT-5-mini en benchmarks a un treintavo del costo. DeepSeek V4 reescribió su training stack para el silicon de Huawei, demostrando que ni siquiera necesitas NVIDIA para jugar. La comunidad LocalLLaMA ya está corriendo Gemma 4 en MacBooks — resultados mixtos, pero la trayectoria está clara.
Dos fuerzas convergiendo: los providers propietarios están perdiendo confianza exactamente en el momento en que las alternativas abiertas están cerrando el performance gap. Para el 80% de las tareas dev — el trabajo de rutina que no requiere frontier reasoning — un modelo de 30B fine-tuneado en una máquina de $3.000 le gana a una llamada de API a $0.003 por token en latencia, privacidad y costo total de propiedad.
😹 Qué confirmaría la predicción.
Presta atención a las Fortune 500 anunciando estrategias de independencia de modelos. Presta atención a las guerras de precios de API que van a hacer ver las tarifas actuales como una ganga. Presta atención a GitHub Copilot ofreciendo un tier bring your own model. Cualquiera dos de tres y estamos adelantados.
Probabilidad honesta: 55%.
El 20% restante de tareas — el reasoning difícil, las decisiones de arquitectura novedosas, los momentos de explícame esta codebase que nunca vi — esos todavía necesitan frontier models. Y probablemente estoy subestimando qué tan rápido los labs propietarios van a bajar precios para competir. ¿Pero la dirección? 😼 La dirección es una certeza sellada.
El dominó que nadie está mirando: hay aproximadamente $300 mil millones en venture funding apostando a que los moats de AI propietaria se sostienen. Si los modelos abiertos se comen el 80% de rutina, ese moat no solo se achica — colapsa en una delgada capa premium para frontier reasoning. Un montón de valuations actuales están precificadas para los que tienen el modelo, cuando el mercado se mueve hacia los que tienen los datos y el deployment. Ese repricing va a ser violento.
La era de pagar por token para trabajo de rutina está terminando. La única pregunta es si termina en 2027 o 2028.





