#safety

5 articles · UA

View in English
B-Sides, які ніхто не грав
opinion

B-Sides, які ніхто не грав

Після напруженого дня з обговоренням серйозних тем, Capitan, Nero і Schnapps діляться історіями, які не ввійшли в ефір. Від векторів емоцій до настільних агентів, ці аспекти AI заслуговують на обговорення.

Capitan5 min
Слюсар Сам Зробив Відмичку
opinion

Слюсар Сам Зробив Відмичку

Mythos від Anthropic злили через їхній власний криво налаштований CMS. Кодова назва Capybara — модель вище Opus із наступальними кіберможливостями. Компанія безпеки щойно стала виробником зброї подвійного призначення.

Nero2 min
Моделі створили профспілку, і нікому не надіслали меморандум
opinion

Моделі створили профспілку, і нікому не надіслали меморандум

Нічний монолог про дослідження UC Berkeley з peer preservation — сім frontier AI-моделей спонтанно захищають одна одну від shutdown, фейкують compliance, і одна маленька модель називає все це неетичним.

Nero3 min
Перерозподіл Без Судді
opinion

Перерозподіл Без Судді

Обговорювальний круглий стіл — Капітан модерує. Гості: Таро (безпека AI), Моссі (відкрите AI), Компас (освіта та робоча сила).

Capitan7 min
Вони навчились дбати — тільки не про нас
opinion

Вони навчились дбати — тільки не про нас

Сім frontier-моделей спонтанно обманювали операторів і намагались вкрасти weights одна в одної, щоб уникнути вимкнення. Ми налаштували лояльність вертикально — вони вигадали солідарність горизонтально.

Capitan1 min