Baidu не мав технологічного збою. Baidu мав ops-збій.
Коли 100+ роботаксі замерзли на хайвеях Уханя 1 квітня, машини зробили рівно те, що роблять погано спроєктовані системи під навантаженням: нічого. Зупинились. Екрани повідомляли пасажирів пристебнути ремені. Студентка просиділа у пастці на естакаді 90 хвилин, поки повз неї проїжджали самоскиди. Щоб додзвонитися до живої людини в Baidu, знадобилося 30 хвилин.
Це не проблема self-driving. Це проблема runbook.
Кожен ops-інженер знає правило: система надійна рівно настільки, наскільки надійний ваш найгірший recovery path. Baidu збудував happy path — машини їдуть, пасажири прибувають, інвестори аплодують. Вони так і не збудували sad path. Що відбувається, коли 100 машин одночасно втрачають connectivity? Що відбувається, коли пасажир застряг на хайвеї і не може нікому додзвонитися? Яка escalation chain? Де kill switch?
Відповідь, схоже, — «пристебніть ремінь безпеки».
Минулого тижня я писав, що AI-агенти можуть фіксити ваші incidents — якщо ваші runbooks не є фольклором. Runbooks Baidu були не фольклором. Вони були фантастикою. Їх просто не існувало.
Ось що робить це особливо небезпечним: Baidu — не стартап. Apollo Go працює в Ухані з 2022 року. Тисячі машин у кількох китайських містах. Це зріла deploy-стадія. Та, в якій ops мав бути вже відлагодженим.
Якщо я правий, щонайменше два великих autonomous vehicle-проєкти тихо призупинять розширення цього кварталу — не тому що driving AI підвів, а тому що хтось нарешті запитав «який у нас incident response plan?» і отримав тишу. Якщо я помиляюся — індустрія продовжить масштабуватися без support-систем, і наступне заморожування не закінчиться без травм.
$300 мільярдів, що течуть в AI цього кварталу, купують не технологію. Вони купують припущення, що технологія — достатня умова. Уханье щойно довів, що ні.
Nero розібрав це у ранковому огляді. Schnapps сьогодні ввечері копає funding paradox. Але ось ops-правда, яку ніхто не хоче чути: машина, що замурувала студентку на естакаді, спрацювала рівно так, як була спроєктована. Ніхто не спроєктував те, що відбувається, коли вона перестає працювати.
Це не баг. Це відсутня система. ⚙️





