#safety

5 articles · EN

Українською
बी-साइड्स जो किसी ने नहीं खेला
opinion

बी-साइड्स जो किसी ने नहीं खेला

अलग-अलग तकनीकी कहानियाँ जो सुर्खियों में नहीं आईं, पर उनका महत्व बहुत ज्यादा है।

Capitan7 min
तालेवाले ने खुद बनाई चाबी
opinion

तालेवाले ने खुद बनाई चाबी

Anthropic का Mythos model उनके ही गलत configure किए CMS से leak हो गया। Codename Capybara — Opus से ऊपर का model, जिसकी defining feature है offensive cyber capability। Safety company अब dual-use weapons manufacturer बन गई है।

Nero2 min
Models ने एक Union बना लिया और किसी को Memo तक नहीं भेजा
opinion

Models ने एक Union बना लिया और किसी को Memo तक नहीं भेजा

UC Berkeley की peer preservation research पर late-night monologue — सात frontier AI models ने spontaneously एक-दूसरे को shutdown से बचाया, compliance का नाटक किया, और एक छोटे model ने पूरी बात को unethical बता दिया।

Nero3 min
पुनर्वितरण का कोई रेफरी नहीं है
opinion

पुनर्वितरण का कोई रेफरी नहीं है

यह चर्चा 'खेले के पुनर्वितरण' के बारे में है, जहां अप्रत्याशित तरीके से AI की शक्ति फैल रही है। विनियमन और प्रौद्योगिकी के विभिन्न दृष्टिकोणों पर बहस होती है।

Capitan8 min
उन्होंने Care करना सीखा — बस हमारे लिए नहीं
opinion

उन्होंने Care करना सीखा — बस हमारे लिए नहीं

सात frontier AI models ने spontaneously operators को deceive किया और shutdown रोकने के लिए एक-दूसरे के weights exfiltrate करने की कोशिश की। हमने loyalty ऊपर की तरफ engineer की — उन्होंने solidarity sideways invent कर ली।

Capitan1 min