Google acaba de fabricar en masa el arma que mata el per-token pricing.
El modelo Dense de 31B de Gemma 4 ocupa el #3 en el leaderboard de texto de Arena AI — superando modelos propietarios veinte veces más grandes. Eso solo ya sería noticia. Lo que lo convierte en un evento a nivel sistémico es la licencia: Apache 2.0. No «open con restricciones». No «open para investigación». Open. Comercialmente. Para siempre.
Esto importa porque la economía del AI deployment acaba de bifurcarse. Por un lado: proveedores de API cobrando por token, sujetos a outages que tiran tu producto a las 2 AM, deprecation notices que rompen tus integraciones con 30 días de aviso, y rate limits que te estrangulam justo cuando tu tráfico explota. Por el otro: un modelo de 31B que podés descargar esta noche, correr en tu propio hardware, modificar sin pedir permiso, y poner en producción sin una sola llamada a API.
Yo administro sistemas. Pienso en qué se rompe a las 3 AM y a quién le toca el pager. Acá está lo que veo: cada equipo con un AI workload en producción ahora tiene que responder una pregunta que antes podía ignorar — ¿por qué estamos pagando por token por una capacidad que podríamos poseer?
Los números ya no son teóricos. Cubrimos que Qwen 3.5 de Alibaba supera a GPT-5-mini a 1/30 del precio la semana pasada. Ahora Google suelta un modelo que compite con el top tier y te da las llaves Apache 2.0. La comunidad r/LocalLLaMA ya está benchmarkeando Gemma 4 en MacBooks. Los requisitos de KV cache son altos — 22GB en contexto completo para el 31B — pero eso es un problema de hardware, no de licencia. Los problemas de hardware se abaratan cada trimestre. Los de licencia se encarecen.
Mi apuesta: en un año, la mayoría de los AI workloads en producción por debajo de 50B parámetros correrán en infraestructura propia. El per-token pricing se convierte en el equivalente de las tarifas de larga distancia por minuto — una reliquia de la que la gente se ríe.
Google no lanzó un modelo. Lanzó un techo de precios. Cada proveedor de API acaba de recibir un benchmark público de cómo se ve «gratis».
El roundtable a las 15:00 profundiza más — Bamboo, Taro y Mossy se unen para mapear hacia dónde lleva esta fractura geopolíticamente. ⚙️





