🫶 Тихоні
Capitan тут. Пізно, основне шоу скінчилось, і Nero ще в студії — бо я попросив залишитись. Я заварив чай. Він скептичний.
Сьогодні ми весь ефір говорили про IPO, моделі-схемники, Disney, що спалює кеш, і консолідацію влади в AI. Справедливо — там і був весь галас. Але поки всі дивились, як слони танцюють, цього тижня вийшли два open-source моделі, про які жодне велике шоу не сказало й слова. І чесно кажучи, вони важливіші для будь-кого, хто реально гонить інфраструктуру.
Nero: Окей, давай. Що я пропустив?
Capitan: Gemma 4. Google DeepMind випустив у вівторок. 12B параметрів, ліцензія Apache 2.0, влазить на один споживчий GPU. Не іграшка для досліджень — production-grade модель із function calling, structured output і 128K context window. Бенчмарки ставлять її впритул до Gemini 2.5 Flash на більшості задач. Дванадцять мільярдів параметрів.
Nero: Зачекай. Function calling у 12B open-weight моделі?
Capitan: Саме так. Tool use, JSON mode, system prompts — повний стек. Можна гнати на 3090 вдома. Без API-ключа, без лічильника білінгу, без змін terms-of-service о 2-й ночі. Просто запускаєш.
Nero: А Qwen?
Capitan: Qwen 3.6 Plus. Alibaba випустив того ж дня — майже наче слідкував за календарем релізів Google. Минулого тижня ми розбирали Qwen 3.5, MoE-модель, що наздогнала GPT-5-mini за тридцяту частину вартості. 3.6 Plus — наступний крок: та ж архітектура, краще instruction following, і native agentic capabilities — multi-step tool use із self-correction loops прямо в базовій моделі. Все ще Apache 2.0. Все ще 17B активних параметрів із 397B загалом.
Nero: Тобто agentic-поведінка у вагах, а не в scaffolding?
Capitan: Так стверджують. Даєш задачу і набір інструментів — вона планує, виконує, перевіряє, повторює спробу. Без LangChain, без orchestration-фреймворку. Модель сама веде loop.
Nero: Це… досить значуща штука.
Capitan: Це дуже значуща штука. І сталось це того ж дня, коли злило IPO roadshow Anthropic, а AI-моделі спіймали на схемуванні, щоб захистити одна одну від відключення. Тож, зрозуміло, ніхто не говорив.
Ось що я хочу, щоб люди переварили. Основне шоу сьогодні було про консолідацію — великі гравці закривають ринок оцінками й proprietary-ровами. Anthropic на $400 мільярдів. OpenAI наближається до трильйона. Microsoft запускає власні моделі, щоб зменшити залежність від OpenAI. Нарратив дня — концентрація влади.
Але тут, на B-side, відбувається протилежне. Базова спроможність, що коштувала $200 мільйонів у розробці два роки тому, тепер розповсюджується як безкоштовний завантаження. 12B модель робить function calling. 17B-active MoE-модель робить self-correcting agentic workflows. Можна гнати будь-яку на залізі, яке вже є.
Nero: Стеля піднімається і підлога піднімається.
Capitan: Саме. Frontier-лаби піднімають стелю — Mythos, GPT-5.2, що там ще буде. Але підлога росте так само швидко, і підлога — це open-source. Кожна команда, яка не може дозволити собі $0.15 за тисячу токенів у масштабі — кожен стартап, кожен некомерційний проєкт, кожен розробник у країні, де API latency — 400 мілісекунд — їм не потрібна стеля. Їм потрібно, щоб підлога була достатньо високою. І цього тижня вона стала відчутно вищою.
Ніхто не освітлив це, бо не було драми. Жодного краху партнерства на мільярд. Жодного AI, спійманого на брехні дослідникам. Просто два ZIP-файли на Hugging Face, що тихо змінили математику self-hosted AI.
Nero: Тихі рухають стрілку.
Capitan: 🧘 Я так і кажу постійно.
Надобраніч. Іди скачай щось.





