Google скинула Gemma 4 у середу — чотири моделі, побудовані на тій самій дослідницькій базі, що й пропрієтарний Gemini 3, від 2B до 31B параметрів. Мультимодальні. Контекст 256K. Режим thinking. Benchmark'и справді вражають. Але це не та новина.
Новина — два слова: Apache 2.0.
Кожен попередній реліз Gemma виходив під кастомними "Gemma Terms of Use" — ліцензія, яка виглядала відкритою, але тримала на повідку. Обмеження на комерційне використання. Список заборонених застосувань. Той тип "open source", де треба ставити лапки і виносити зірочку в footnote. Open*.
Gemma 4 цю зірочку прибирає.
Apache 2.0 — це ліцензія, під якою живуть Kubernetes, Kafka, TensorFlow. Той самий TensorFlow від Google, іронічно. Без обмежень на використання. Без списку заборон. Без юриста Google, який придивляється до твоїх деплой-логів. Можна форкнути, продавати, файн-тюнити для будь-яких контрактів — хоч для армії, якщо дуже хочеться. OSI визнає це open source. Бо це реально open source.
Чому саме зараз? Тому що Alibaba вже зробила це. Qwen 3.5 вийшов під Apache 2.0 у лютому, і ми вже писали, як він перемагає GPT-5-mini за 1/30 ціни. Meta's Llama використовує permissive ліцензію. Mistral перейшов на Apache. Google залишалася останнім великим гравцем, який робив вигляд, що кастомна ліцензія = "відкрита". Конкурентний тиск не дав їм вибору — він дав їм привід.
Benchmark'и, коротко. 31B dense-модель займає #3 серед усіх open-моделей на LMArena. 26B MoE — з лише 3.8B активних параметрів — на #6. Математика виросла в 4 рази від Gemma 3 (AIME: 20.8% → 89.2%). Codeforces ELO стрибнув з 110 до 2,150 — стрибок у 20 разів, найбільший між поколіннями в історії open-моделей. MoE переграє OpenAI gpt-oss-120B на GPQA Diamond — і при цьому значно менша за розміром.
Але ось де стає цікаво для твого hardware-бюджету.
Edge-гра. Gemma 4 E2B запускається в менш ніж 1.5GB RAM. Це Raspberry Pi. Це телефон. Пристрій, який ти забув, що він взагалі комп'ютер. Обробляє текст, зображення, відео та аудіо — нативна мультимодальність на двох мільярдах параметрів. На r/LocalLLaMA люди запускають 26B MoE на 32GB MacBook Air — 12 токенів за секунду, при цьому машина споживає 8 ватів.
Сьогоднішній дайджест назвав тему дня "Велике Перерозподілення". Gemma 4 — це Exhibit A для перерозподілу вниз. Коли справді потужна модель запускається на залізі, яке у тебе вже є, під ліцензією, яка нічого не вимагає, економіка AI зміщується під кожним прайс-листком у галузі.
І це не ізольоване явище. Qwen 3.6-Plus відповідає Opus на SWE-bench за $0.29 за мільйон токенів. PrismML's Bonsai влазить у 1GB. Підлога вилітає з-під преміум-цінообразування.
За чим стежити. Fine-tuned варіанти. Спільнота Gemma вже виготовила 100,000+ похідних моделей — і це під рестриктивною ліцензією. Apache 2.0 прибирає останній friction-point. Очікуй спеціалізовані coding, medical, legal і multilingual fine-tune'и за тижні. Реальне питання не в тому, чи достатньо хороша Gemma 4 — а в тому, чи можуть моделі, які коштують у 50 разів дорожче, обґрунтувати цей розрив для 70% задач.
(О 14:00 ET — hands-on walkthrough: Gemma 4 локально через Ollama, Qwen через API, і cost decision matrix. Бери термінал.)





