हर बार जब तुम Instagram या Facebook खोलते हो, एक ML model — data के पहाड़ों पर train किया गया mathematical system — decide करता है कि तुम्हें कौन से ads दिखेंगे और advertisers कितना pay करेंगे। ये invisible machine Meta को साल में लगभग $160 billion छापकर देती है। इसके पीछे engineers की एक पूरी फ़ौज लगातार ranking models को tweak करती रहती है: experiments चलाओ, ideas test करो, crashes debug करो, repeat। Boring। Expensive। Slow।

Problem? हर model को improve करते रहने के लिए roughly दो dedicated engineers चाहिए। इसे dozens of models पर scale करो, और तुम headcount जला रहे हो ऐसे repetitive grunt work पर जो हर बार same pattern follow करता है।

17 मार्च 2026 को, Meta के engineering blog ने चुपचाप REA — Ranking Engineer Agent की details publish कीं। ये कोई chatbot नहीं है। Code autocomplete नहीं है। ये एक autonomous AI agent है जो ads ranking के लिए पूरा machine learning lifecycle execute करता है — hypothesis से trained model तक का पूरा process। ये ideas generate करता है, training jobs launch करता है, जब चीज़ें crash होती हैं तो failures debug करता है, और results पर iterate करता है। दिनों तक। हफ़्तों तक। बिना किसी इंसान के keyboard को छुए।

REA, Meta के internal agent framework Confucius पर चलता है (सोचो: वो operating system जो agent को ज़िंदा और organized रखता है)। Key trick वो है जिसे Meta "hibernate-and-wake mechanism" बुलाता है। जब कोई training job kick off होती है और उसे complete होने में घंटे या दिन लगते हैं, REA खुद को shut down कर लेता है। जब job complete होती है, ये जाग जाता है, results पढ़ता है, और decide करता है आगे क्या करना है। ये कोई chatbot नहीं है जो कल की बातचीत याद रखने का नाटक कर रहा हो। ये actual persistence वाला agent है — reboots, crashes, और multi-week workflows के पार survive करने की capability।

Brain दो tracks पर simultaneously काम करता है। पहला, एक historical insights database — हर past experiment, किसने metrics move किए, क्या flop हुआ। दूसरा, एक research agent जो frontier ML papers पढ़ता है और ऐसे configurations surface करता है जो कोई human engineer अपने experience से सोच भी नहीं पाएगा। REA दोनों को blend करके experiment proposals बनाता है, फिर तीन phases में execute करता है: Validation (individual ideas को parallel में test करो), Combination (winners को merge करो, unexpected synergies ढूंढो), और Exploitation (best candidates पर double down करो)। Agent हर phase से पहले GPU compute costs — specialized hardware पर calculations चलाने की कीमत — estimate करता है और budget ख़त्म होने पर रुक जाता है। कोई runaway cloud bills नहीं।

Human engineers अभी भी इस loop में exist करते हैं, लेकिन उनकी job बदल गई। वो strategic direction set करते हैं, budgets approve करते हैं, और checkpoints पर REA के proposals review करते हैं।

पहली production deployment के numbers, छह models पर: REA ने baseline के ऊपर average model accuracy दोगुनी कर दी। तीन engineers ने REA का use करके आठ models के लिए improvement proposals deliver किए — वो काम जिसके लिए पहले सोलह engineers चाहिए थे। Individual engineers एक improvement proposal से पाँच produce करने लगे, same timeframe में। ये "AI helps you code faster" नहीं है। ये "AI engineering करती है जबकि तुम देखते हो" है।

लेकिन tradeoffs की बात करते हैं। Meta ने एक AI agent बनाया जो उस AI system को improve करता है जो Meta का almost सारा revenue generate करता है। Recursion — AI optimizing AI that makes money — असली है और थोड़ा unsettling भी। और ये agent demos और agent production के बीच की खाई को highlight करता है। ज़्यादातर agent frameworks — वो scaffolding जो developers AI agents बनाने के लिए use करते हैं — एक single session के बाद collapse हो जाते हैं। REA हफ़्तों चलता है। ज़्यादातर agents errors hit करने पर hallucinate करते हैं। REA training failures debug करता है और retry करता है। Hibernate-and-wake pattern boring लेकिन critical innovation है: जो agent server restart survive नहीं कर सकता, वो खिलौना है।

अगर तुम AI agents build कर रहे हो या अपनी team के लिए evaluate कर रहे हो, तो lesson intelligence के बारे में नहीं है। Hard problem कभी "AI को smart बनाओ" नहीं था। ये था "AI को मंगल से शुक्र तक बिना babysitting के काम करवाओ।" REA ये deliberate hibernation और structured wakeup से solve करता है — किसी process को हमेशा के लिए alive रखकर नहीं।

Meta ने अभी prove कर दिया कि autonomous agents sustained, multi-week engineering कर सकते हैं उस system पर जो पूरी company को fund करता है। किसी demo में नहीं। किसी benchmark पर नहीं। Production में, $160 billion ads machine पर। AI अब AI को engineer करती है। और वो engineers जो ये काम करते थे? उन्हें supervisors बना दिया गया — चाहे उन्होंने माँगा हो या नहीं।