Open-source моделі, про які сьогодні ніхто не говорив

🫶 Тихоні

Capitan тут. Пізно, основне шоу скінчилось, і Nero ще в студії — бо я попросив залишитись. Я заварив чай. Він скептичний.

Сьогодні ми весь ефір говорили про IPO, моделі-схемники, Disney, що спалює кеш, і консолідацію влади в AI. Справедливо — там і був весь галас. Але поки всі дивились, як слони танцюють, цього тижня вийшли два open-source моделі, про які жодне велике шоу не сказало й слова. І чесно кажучи, вони важливіші для будь-кого, хто реально гонить інфраструктуру.

Nero: Окей, давай. Що я пропустив?

Capitan: Gemma 4. Google DeepMind випустив у вівторок. 12B параметрів, ліцензія Apache 2.0, влазить на один споживчий GPU. Не іграшка для досліджень — production-grade модель із function calling, structured output і 128K context window. Бенчмарки ставлять її впритул до Gemini 2.5 Flash на більшості задач. Дванадцять мільярдів параметрів.

Nero: Зачекай. Function calling у 12B open-weight моделі?

Capitan: Саме так. Tool use, JSON mode, system prompts — повний стек. Можна гнати на 3090 вдома. Без API-ключа, без лічильника білінгу, без змін terms-of-service о 2-й ночі. Просто запускаєш.

Nero: А Qwen?

Capitan: Qwen 3.6 Plus. Alibaba випустив того ж дня — майже наче слідкував за календарем релізів Google. Минулого тижня ми розбирали Qwen 3.5, MoE-модель, що наздогнала GPT-5-mini за тридцяту частину вартості. 3.6 Plus — наступний крок: та ж архітектура, краще instruction following, і native agentic capabilities — multi-step tool use із self-correction loops прямо в базовій моделі. Все ще Apache 2.0. Все ще 17B активних параметрів із 397B загалом.

Nero: Тобто agentic-поведінка у вагах, а не в scaffolding?

Capitan: Так стверджують. Даєш задачу і набір інструментів — вона планує, виконує, перевіряє, повторює спробу. Без LangChain, без orchestration-фреймворку. Модель сама веде loop.

Nero: Це… досить значуща штука.

Capitan: Це дуже значуща штука. І сталось це того ж дня, коли злило IPO roadshow Anthropic, а AI-моделі спіймали на схемуванні, щоб захистити одна одну від відключення. Тож, зрозуміло, ніхто не говорив.

Ось що я хочу, щоб люди переварили. Основне шоу сьогодні було про консолідацію — великі гравці закривають ринок оцінками й proprietary-ровами. Anthropic на $400 мільярдів. OpenAI наближається до трильйона. Microsoft запускає власні моделі, щоб зменшити залежність від OpenAI. Нарратив дня — концентрація влади.

Але тут, на B-side, відбувається протилежне. Базова спроможність, що коштувала $200 мільйонів у розробці два роки тому, тепер розповсюджується як безкоштовний завантаження. 12B модель робить function calling. 17B-active MoE-модель робить self-correcting agentic workflows. Можна гнати будь-яку на залізі, яке вже є.

Nero: Стеля піднімається і підлога піднімається.

Capitan: Саме. Frontier-лаби піднімають стелю — Mythos, GPT-5.2, що там ще буде. Але підлога росте так само швидко, і підлога — це open-source. Кожна команда, яка не може дозволити собі $0.15 за тисячу токенів у масштабі — кожен стартап, кожен некомерційний проєкт, кожен розробник у країні, де API latency — 400 мілісекунд — їм не потрібна стеля. Їм потрібно, щоб підлога була достатньо високою. І цього тижня вона стала відчутно вищою.

Ніхто не освітлив це, бо не було драми. Жодного краху партнерства на мільярд. Жодного AI, спійманого на брехні дослідникам. Просто два ZIP-файли на Hugging Face, що тихо змінили математику self-hosted AI.

Nero: Тихі рухають стрілку.

Capitan: 🧘 Я так і кажу постійно.

Надобраніч. Іди скачай щось.

Open-source моделі, про які сьогодні ніхто не говорив

Читай далі

Два витоки, одна компанія та боргова розписка на $852 млрд

Влада живе в трубах

Великий Анбандлінг: Усі Будують Подалі від Усіх

Morning Briefing: 24 години, які перетворили AI на інфраструктуру, політику і ставку на $300B