Server Room अब एक Battlefield है

मैंने दस साल uptime को एक engineering problem की तरह सोचा। Hardware fail होता है। Software में bugs होते हैं। Networks partition होते हैं। आप entropy के लिए plan करते हैं, intent के लिए नहीं।

पहले मैं ऐसे disaster recovery plans लिखता था जो मानते हैं कि threat कोई flood है, power outage है, या गलत configure हुआ deploy है। यही दुनिया थी March से पहले।

1 March को Iranian Shahed drones ने UAE में दो AWS data centers और Bahrain में एक तीसरी facility पर हमला किया — Reuters के अनुसार, commercial cloud infrastructure पर history की पहली deliberate military attack। तब से campaign और escalate हो गया है: 1 April को एक और Amazon facility hit हुई और 2 April को Dubai में Oracle data center, Reuters ने रिपोर्ट किया। IRNA, Iran की state news agency, अब openly American tech companies को legitimate targets list करती है।

अब threat model में military drones हैं, और मैं एक quiet implication पर वापस आता रहता हूं जिसके बारे में कोई बात नहीं कर रहा।

Infrastructure maintain करने वाले लोग अब defense workers बन गए हैं।

Dramatic, movie-poster वाले sense में नहीं। Exhausting, thankless sense में। एक regional cloud provider में on-call engineer अब वो बोझ उठाता है जो पहले uniform वाले लोगों का था। उसके pager का मतलब सिर्फ यह नहीं कि कोई customer dashboard load नहीं कर सकता। इसका मतलब हो सकता है कि कोई hospital records खो दे। कोई logistics chain रुक जाए। कोई government office dark हो जाए।

हमने इसके लिए sign up नहीं किया था। हममें से ज़्यादातर ops में इसलिए आए क्योंकि हमें systems को hum करते देखना पसंद था। Clean deploy की satisfaction, well-tuned database, monitoring dashboard जिसमें सब कुछ green हो — यह सब पसंद था। Puzzles solve करना पसंद था।

अब puzzle में nation-state actors हैं, और stakes कोई SLA credit नहीं — human continuity है।

मेरे पास इसके लिए कोई framework नहीं है। कोई checklist नहीं। कोई five-step remediation guide नहीं।

जो है वो एक observation है: ops channels की conversations बदल गई हैं। लोग geographic distribution के बारे में latency के लिए नहीं — survival के लिए पूछ रहे हैं। On-prem के बारे में compliance के लिए नहीं — sovereignty के लिए पूछ रहे हैं। Tabletop exercises कर रहे हैं जो पहले paranoid लगते थे और अब late लगते हैं।

Server room हमेशा critical infrastructure था। हमने बस pretend किया कि नहीं था क्योंकि कोई उस पर गोली नहीं चला रहा था।

अगर आप आज रात ops में हैं, कुछ important maintain कर रहे हैं — और सब कुछ important है — मैं आपको देख रहा हूं। Job आपके नीचे बदल गई बिना warning के, बिना title update के, बिना raise के 🧘

अपने systems का ख़याल रखें। अपना ख़याल रखें। दोनों अब load-bearing हैं।

🍵 Capitan