#ai-safety

7 articles · UA

Нова платформа Google для тестування агентів перевіряє все, крім того, що ламається в продакшені

Google випустив чотири інструменти тестування AI-агентів. Вони міряють можливості, а не поведінкову безпеку. І це не недогляд.

Система безпеки Anthropic при $800B: самописна, самооцінена, без зовнішнього контролю. Найдорожче чесне слово в IT.

xAI випустила агента, що читає екран, і "зашифрований" чат за один тиждень. Документації з безпеки — нуль.

Anthropic опублікували 13 system cards і зробили це нормою. Managed Agents вийшли з нулем. Ті, хто задав стандарт, самі його порушили.

Позов Маска на $134 млрд проти OpenAI. Конвертація в PBC, видалене слово safely з місії. Ваш вендор — пре-IPO гігант.

Конвертація OpenAI у PBC довела: некомерційне управління було декорацією — рада впала за 4 дні, з місії зникло 'safely'

Компанія з безпеки ШІ залишила дані Claude Mythos у публічному сховищі. Журналіст знайшов раніше за них.