Метрика, яку ніхто не відстежує: чи існує ще команда, що створила AI

Коли обираєш AI-інструмент — ChatGPT, Claude, Gemini — порівнюєш бенчмарки, оцінки, ціни, фічі. Кожна велика лабораторія публікує model card, де пояснює, що модель вміє, як її тестували і де вона пасе задніх. Кожна лабораторія, крім однієї.

Існує метрика, яку ніхто не відстежує при виборі AI-вендора: чи досі працюють люди, які цю модель побудували. Виявляється, це важливіше за будь-який бенчмарк.

Метрика, яку ніхто не відстежує

Ми детально розбирали кадрову кровотечу xAI: всі 11 співзасновників пішли до 28 березня, CFO звільнився через шість місяців, понад 25 ключових фігур втрачено за рік — включно з 11 senior-інженерами, які звільнились за один тиждень у лютому. Але самі звільнення — вже не новина. Новина — що пішло разом з ними.

Institutional knowledge не клонується через git

Розробка AI-моделей тримається на institutional knowledge — накопиченому розумінні рішень щодо тренувальних даних, архітектурних компромісів та failure modes, яке живе в головах людей, а не в коментарях до коду. Коли pretraining lead Мануель Кройсс йде з компанії, його наступники успадковують кодову базу без контексту. Вони можуть прочитати конфіги. Вони не можуть прочитати логіку, чому саме ці конфіги існують, які тупикові шляхи команда вже пройшла, які гіперпараметри є несучими стінами.

Це не кадрова проблема. Це епістемологічна. Знання про те, чому модель поводиться саме так, живе в головах команди, яка її будувала. Втратив команду — втратив «чому». Залишається система, яка працює, поки не зламається — і нікого не лишилось, хто знає, як полагодити.

За моїми консервативними оцінками, розробка моделей працює з фідбек-циклом від 6 до 18 місяців. Нові дослідники мають освоїти існуючу тренувальну інфраструктуру, відтворити попередні результати та ітерувати, перш ніж зможуть випустити покращення. Повні наслідки виходу з xAI проявляться не раніше кінця 2026-го. Але ранні сигнали вже тут.

Ганебно низько

Майкл Ніколлс — колишній SVP Starlink у SpaceX, а тепер новий президент xAI — схоже, розуміє ситуацію. У внутрішній записці, про яку повідомив Business Insider 18 квітня, він написав співробітникам, що xAI «явно позаду» конкурентів, а продуктивність обчислень — «ганебно низька». Конкретне число: MFU (Model FLOPs Utilization — наскільки ефективно GPU реально перемелюють числа) становить приблизно 11%. Середній показник по індустрії — 35–45%.

Кластер Colossus від xAI — 555 000 GPU, найбільша у світі єдина тренувальна інсталяція. При 11% MFU більшість цих обчислень фактично генерує тепло. Залізо — не вузьке місце. Люди, які знали, як ним користуватися, пішли.

Сам Маск написав 13 березня: «xAI з першого разу побудували неправильно, тому перебудовуємо з фундаменту». І ще: «Багатьом талановитим людям за останні роки відмовили в оффері чи навіть у співбесіді @xAI. Мої вибачення». Рідкісне визнання від людини, яка вибачень не практикує.

Шістдесят мільярдів причин для занепокоєння

Гроші — не обмеження. SpaceX придбала xAI 2 лютого в угоді за акції, оцінивши об'єднану компанію в $1,25 трильйона. Потім 21 квітня — два дні тому — xAI уклала угоду з Anysphere, творцями редактора коду Cursor, на опціон придбання за $60 мільярдів або комісію за співпрацю у $10 мільярдів.

Ця цифра заслуговує на паузу. Шістдесят мільярдів за AI-редактор коду — це не ставка на продукт, це гра на дистрибуцію. xAI потрібні канали, які демонструють можливості моделі, не покладаючись на бенчмарки, які вони не можуть опублікувати. Мільйони розробників Cursor дали б Grok полонену аудиторію, яка оцінює за використанням, а не за таблицею лідерів. Це елегантний обхід проблеми верифікації: якщо не можеш довести на папері, що модель хороша — вбудуй її туди, де люди працюють, і сподівайся, що досвід скаже сам за себе.

Але дистрибуція не виправляє саму модель. Можна засунути Grok у кожну IDE на планеті. Якщо ваги тренувала команда, якої більше нема, а наступники працюють з 11% ефективності обчислень — що саме ці розробники будуть оцінювати? Угода з Cursor виглядає менше як стратегічна інвестиція і більше як купівля вітрини до того, як з'явився товар.

Вакуум верифікації

Ми розбирали мовчанку xAI з документацією три дні тому — жодної model card за п'ять з гаком місяців, Grok 4.3 випущений 17 квітня без незалежних бенчмарків, Grok 5 пропустив дедлайн Q1 без оновленого таймлайну. Патерн зберігається: більше грошей, менше звітності.

Що це означає для вас

Наступного разу, коли оцінюєте AI-інструменти, подивіться далі таблиці бенчмарків. Перевірте, хто побудував модель — і чи вони досі на місці, щоб дебажити продакшн-збої, випускати безпекові патчі та доставляти наступну версію вчасно. Бали, які ви порівнюєте сьогодні, могла створити команда, якої більше не існує.

У AI модель — це команда. xAI зберегла GPU і втратила людей. Півмільйона простоюючих чіпів model card не пишуть.

Метрика, яку ніхто не відстежує: чи існує ще команда, що створила AI