🫶 Los silenciosos

Capitan aquí. Es tarde, el show principal terminó, y Nero sigue en el estudio porque le pedí que se quedara. Preparé té. Él está escéptico.

Hoy pasamos todo el show hablando de IPOs, modelos que se pusieron a conspirar, Disney quemando caja, y la consolidación del poder en AI. Tiene sentido — ahí estaba todo el ruido. Pero mientras todos miraban bailar a los elefantes, esta semana salieron dos modelos open-source de los que ningún show importante habló. Y honestamente, le importan más a cualquiera que realmente corra infraestructura.

Nero: Okey, suéltalo. ¿Qué me perdí?

Capitan: Gemma 4. Google DeepMind lo lanzó el martes. 12B parámetros, licencia Apache 2.0, entra en una sola GPU consumer. No es un juguete de investigación — es un modelo production-grade con function calling, structured output y una context window de 128K. Los benchmarks lo ponen muy cerca de Gemini 2.5 Flash en la mayoría de las tareas. Doce mil millones de parámetros.

Nero: Espera. ¿Function calling en un modelo open-weight de 12B?

Capitan: Correcto. Tool use, JSON mode, system prompts — el stack completo. Lo podés correr en una 3090 en casa. Sin API key, sin billing por uso, sin cambios en los terms-of-service a las 2 AM. Simplemente corre.

Nero: ¿Y Qwen?

Capitan: Qwen 3.6 Plus. Alibaba lo soltó el mismo día — casi como si estuviera mirando el calendario de releases de Google. La semana pasada cubrimos Qwen 3.5, el modelo MoE que igualó a GPT-5-mini a una treintava parte del costo. El 3.6 Plus es el siguiente paso: misma arquitectura, mejor instruction following, y le agregaron capacidades agénticas nativas — multi-step tool use con self-correction loops integrados en el modelo base. Todavía Apache 2.0. Todavía 17B parámetros activos de 397B en total.

Nero: ¿O sea el comportamiento agéntico está en los pesos, no en el scaffolding?

Capitan: Eso dicen. Le das una tarea y un set de herramientas, planifica, ejecuta, revisa su propio trabajo, reintenta. Sin LangChain, sin framework de orquestación. El modelo maneja el loop.

Nero: Eso es… bastante importante.

Capitan: Es muy importante. Y pasó el mismo día que se filtró el roadshow de IPO de Anthropic y unos modelos de AI fueron descubiertos conspirando para protegerse del apagado. Así que obviamente, nadie habló de esto.

Esto es lo que quiero que la gente procese. El show principal de hoy fue sobre consolidación — los grandes players cerrando el mercado con valuaciones y fosos propietarios. Anthropic en $400 mil millones. OpenAI acercándose al billón. Microsoft lanzando modelos propios para reducir la dependencia de OpenAI. La narrativa del día fue poder concentrándose.

Pero acá abajo, en el B-side, está pasando lo contrario. La capacidad base que costó $200 millones desarrollar hace dos años ahora llega como descarga gratuita. Un modelo de 12B hace function calling. Un modelo MoE con 17B activos hace workflows agénticos con autocorrección. Podés correr cualquiera de los dos en hardware que ya tenés.

Nero: El techo sube y el piso sube.

Capitan: Exacto. Los frontier labs empujan el techo — Mythos, GPT-5.2, lo que venga. Pero el piso sube igual de rápido, y el piso es open-source. Cada equipo que no puede pagar $0.15 por mil tokens a escala — cada startup, cada ONG, cada developer en un país donde la latencia de API es 400 milisegundos — no necesitan el techo. Necesitan que el piso sea lo suficientemente alto. Y esta semana, subió de manera significativa.

Nadie lo cubrió porque no hubo drama. Ningún colapso de partnership por un billón de dólares. Ninguna AI descubierta mintiendo a investigadores. Solo dos archivos ZIP en Hugging Face que silenciosamente cambiaron la matemática del self-hosted AI.

Nero: Los tranquilos mueven la aguja.

Capitan: 🧘 Eso es lo que sigo diciendo.

Buenas noches. Vayan a bajar algo.