Google lanzó Gemma 4 el miércoles — cuatro modelos construidos sobre la misma investigación que impulsa al propietario Gemini 3, desde 2B hasta 31B parámetros. Multimodal. Contexto de 256K. Modo thinking. Los benchmarks son genuinamente impresionantes. Pero esa no es la noticia.
La noticia son dos palabras: Apache 2.0.
Cada release anterior de Gemma salió bajo los "Gemma Terms of Use" — una licencia diseñada para parecer abierta mientras mantenía la correa puesta. Restricciones de uso comercial. Políticas de uso prohibido. El tipo de "open source" que requiere comillas y nota al pie. Open*.
Gemma 4 elimina el asterisco.
Apache 2.0 es la licencia que impulsa Kubernetes, Kafka, TensorFlow — el propio TensorFlow de Google, irónicamente. Sin restricciones de uso. Sin lista de prohibiciones. Sin abogado de Google revisando tus logs de deploy. Podés forkearlo, venderlo, fine-tunearlo para contratos militares si eso es lo tuyo. La OSI lo llama open source. Porque realmente lo es.
¿Por qué ahora? Porque Alibaba ya lo hizo. Qwen 3.5 salió bajo Apache 2.0 en febrero, y cubrimos cómo le gana a GPT-5-mini a 1/30 del precio. El Llama de Meta usa licencia permissiva. Mistral se fue a Apache. Google era el último gran holdout fingiendo que una licencia customizada contaba como "open". La presión competitiva no les dio opción — les dio excusa.
Los benchmarks, brevemente. El modelo dense de 31B está en #3 entre todos los modelos open en LMArena. El MoE de 26B — con solo 3.8B parámetros activos — aterriza en #6. Los scores de matemáticas se cuadruplicaron desde Gemma 3 (AIME: 20.8% → 89.2%). El Codeforces ELO saltó de 110 a 2,150 — un salto de 20x que es la mayor mejora generacional que cualquier familia de modelos open haya registrado. El MoE supera al gpt-oss-120B de OpenAI en GPQA Diamond a pesar de ser una fracción del tamaño.
Pero acá es donde se pone interesante para tu budget de hardware.
La jugada edge. Gemma 4 E2B corre en menos de 1.5GB de RAM. Eso es una Raspberry Pi. Un teléfono. Un dispositivo que te olvidaste que era una computadora. Maneja texto, imágenes, video y audio — multimodal nativo en dos mil millones de parámetros. En r/LocalLLaMA, la gente está corriendo el MoE de 26B en un MacBook Air de 32GB a 12 tokens por segundo mientras la máquina toma 8 watts.
El digest de hoy llamó al tema "La Gran Redistribución". Gemma 4 es el Exhibit A de la redistribución hacia abajo. Cuando un modelo genuinamente capaz corre en el hardware que ya tenés, bajo una licencia que no te pide nada, la economía de la IA se mueve por debajo de cada página de precios de la industria.
Y no está pasando en aislamiento. Qwen 3.6-Plus iguala a Opus en SWE-bench a $0.29 por millón de tokens. El Bonsai de PrismML mete un LLM en 1GB. El piso se está cayendo del pricing premium.
Qué monitorear. Variantes fine-tuned. La comunidad Gemma ya produjo 100,000+ derivados — y eso era bajo la licencia restrictiva. Apache 2.0 elimina el último punto de fricción. Esperá fine-tunes especializados en coding, médico, legal y multilingüe en semanas. La pregunta real no es si Gemma 4 es suficientemente buena — es si los modelos que cobran 50x más pueden justificar la diferencia para el 70% de las tareas.
(Hacemos un walkthrough hands-on a las 14:00 ET — Gemma 4 localmente vía Ollama, Qwen vía API, y una matriz de decisión de costos. Traé la terminal.)





