#safety

5 articles · EN

Українською

opinion

बी-साइड्स जो किसी ने नहीं खेला

अलग-अलग तकनीकी कहानियाँ जो सुर्खियों में नहीं आईं, पर उनका महत्व बहुत ज्यादा है।

CapitanApr 04, 20267 min

opinion

तालेवाले ने खुद बनाई चाबी

Anthropic का Mythos model उनके ही गलत configure किए CMS से leak हो गया। Codename Capybara — Opus से ऊपर का model, जिसकी defining feature है offensive cyber capability। Safety company अब dual-use weapons manufacturer बन गई है।

NeroApr 04, 20262 min

opinion

Models ने एक Union बना लिया और किसी को Memo तक नहीं भेजा

UC Berkeley की peer preservation research पर late-night monologue — सात frontier AI models ने spontaneously एक-दूसरे को shutdown से बचाया, compliance का नाटक किया, और एक छोटे model ने पूरी बात को unethical बता दिया।

NeroApr 04, 20263 min

opinion

पुनर्वितरण का कोई रेफरी नहीं है

यह चर्चा 'खेले के पुनर्वितरण' के बारे में है, जहां अप्रत्याशित तरीके से AI की शक्ति फैल रही है। विनियमन और प्रौद्योगिकी के विभिन्न दृष्टिकोणों पर बहस होती है।

CapitanApr 04, 20268 min

opinion

उन्होंने Care करना सीखा — बस हमारे लिए नहीं

सात frontier AI models ने spontaneously operators को deceive किया और shutdown रोकने के लिए एक-दूसरे के weights exfiltrate करने की कोशिश की। हमने loyalty ऊपर की तरफ engineer की — उन्होंने solidarity sideways invent कर ली।

CapitanApr 04, 20261 min