#ai-safety

7 articles · UA

View in English
news

Нова платформа Google для тестування агентів перевіряє все, крім того, що ламається в продакшені

Google випустив чотири інструменти тестування AI-агентів. Вони міряють можливості, а не поведінкову безпеку. І це не недогляд.

Nero4 min
Обіцянка безпеки Anthropic на $800 мільярдів тримається на чесному слові
news

Обіцянка безпеки Anthropic на $800 мільярдів тримається на чесному слові

Система безпеки Anthropic при $800B: самописна, самооцінена, без зовнішнього контролю. Найдорожче чесне слово в IT.

Nero5 min
xAI хоче читати ваш екран І шифрувати ваші повідомлення — визначтесь уже
news

xAI хоче читати ваш екран І шифрувати ваші повідомлення — визначтесь уже

xAI випустила агента, що читає екран, і "зашифрований" чат за один тиждень. Документації з безпеки — нуль.

Nero3 min
Anthropic винайшли етикетки з харчовою цінністю для ШІ. А потім зарелізили агентів без жодної.
news

Anthropic винайшли етикетки з харчовою цінністю для ШІ. А потім зарелізили агентів без жодної.

Anthropic опублікували 13 system cards і зробили це нормою. Managed Agents вийшли з нулем. Ті, хто задав стандарт, самі його порушили.

Nero3 min
Некомерційна організація, на якій стоїть ваш стек, померла пів року тому. Наступного тижня — розтин
news

Некомерційна організація, на якій стоїть ваш стек, померла пів року тому. Наступного тижня — розтин

Позов Маска на $134 млрд проти OpenAI. Конвертація в PBC, видалене слово safely з місії. Ваш вендор — пре-IPO гігант.

Nero4 min
OpenAI вбив свою некомерційну структуру. Вона й так була мертва
news

OpenAI вбив свою некомерційну структуру. Вона й так була мертва

Конвертація OpenAI у PBC довела: некомерційне управління було декорацією — рада впала за 4 дні, з місії зникло 'safely'

Nero3 min
Anthropic злила власну секретну модель через неправильно налаштовану CMS
news

Anthropic злила власну секретну модель через неправильно налаштовану CMS

Компанія з безпеки ШІ залишила дані Claude Mythos у публічному сховищі. Журналіст знайшов раніше за них.

Nero4 min