Za każdym razem, gdy otwierasz Instagrama lub Facebooka, model ML — matematyczny system wytrenowany na górach danych — decyduje, jakie reklamy widzisz i ile reklamodawcy płacą. Ta niewidzialna maszyna generuje Mecie jakieś 160 miliardów dolarów rocznie. Za nią stoi armia inżynierów, którzy nieustannie dłubią przy modelach rankingowych: odpalają eksperymenty, testują pomysły, debugują crashe, powtarzają. Monotonne. Drogie. Wolne.
Problem? Każdy model potrzebuje dwóch dedykowanych inżynierów tylko po to, żeby się dalej rozwijał. Przeskaluj to na dziesiątki modeli i palisz etaty na powtarzalną robotę, która za każdym razem wygląda tak samo.
17 marca 2026 blog inżynieryjny Mety po cichu opublikował szczegóły o REA — Ranking Engineer Agent. Nie chatbot. Nie autocomplete do kodu. Autonomiczny agent AI, który realizuje pełny cykl życia machine learningu — cały proces od hipotezy do wytrenowanego modelu — dla rankingu reklam. Generuje pomysły, uruchamia joby treningowe, debuguje awarie, gdy coś się sypie, i iteruje wyniki. Dniami. Tygodniami. Bez człowieka przy klawiaturze.
REA działa na Confuciusie, wewnętrznym frameworku agentowym Mety (pomyśl: system operacyjny, który utrzymuje agenta przy życiu i w ryzach). Kluczowy trick to coś, co Meta nazywa 'hibernate-and-wake mechanism". Gdy job treningowy startuje i trwa godziny lub dni, REA się wyłącza. Gdy job się kończy — budzi się, czyta wyniki i decyduje, co dalej. To nie chatbot udający, że pamięta wczorajszą rozmowę. To agent z prawdziwą persystencją — zdolnością przetrwania restartów, crashy i wielotygodniowych workflow'ów.
Mózg pracuje na dwóch torach jednocześnie. Pierwszy — baza historycznych insightów: każdy poprzedni eksperyment, co ruszyło metryki, co padło. Drugi — agent badawczy, który czyta najnowsze papery z ML i wyciąga konfiguracje, na które żaden ludzki inżynier nie wpadłby z samego doświadczenia. REA łączy oba źródła w propozycje eksperymentów, a potem realizuje je w trzech fazach: Walidacja (testowanie pojedynczych pomysłów równolegle), Kombinacja (łączenie zwycięzców, szukanie nieoczekiwanych synergii) i Eksploatacja (podwajanie stawki na najlepszych kandydatach). Agent szacuje koszty GPU — cenę obliczeń na specjalizowanym sprzęcie — przed każdą fazą i zatrzymuje się, gdy budżet się kończy. Żadnych niekontrolowanych rachunków za chmurę.
Ludzie-inżynierowie wciąż istnieją w tej pętli, ale ich rola się zmieniła. Ustalają kierunek strategiczny, zatwierdzają budżety i przeglądają propozycje REA w checkpointach.
Liczby z pierwszego wdrożenia produkcyjnego na sześciu modelach: REA podwoił średnią dokładność modeli względem baseline'u. Trzech inżynierów z REA dostarczyło propozycje ulepszeń dla ośmiu modeli — robotę, która wcześniej wymagała szesnastu inżynierów. Pojedynczy inżynierowie przeszli z jednej propozycji ulepszenia do pięciu w tym samym czasie. To nie jest 'AI pomaga ci szybciej kodować". To jest 'AI robi inżynierię, a ty patrzysz".
Ale porozmawiajmy o kompromisach. Meta zbudowała agenta AI, który ulepsza system AI generujący prawie cały przychód Mety. Rekurencja — AI optymalizujące AI, które zarabia pieniądze — jest realna i odrobinę niepokojąca. I to odsłania przepaść między demami agentów a produkcją. Większość frameworków agentowych — rusztowania, na których deweloperzy budują agentów AI — rozpada się po jednej sesji. REA działa tygodniami. Większość agentów halucynuje, gdy napotka błędy. REA debuguje awarie treningowe i powtarza próby. Wzorzec hibernate-and-wake to nudna, ale krytyczna innowacja: agent, który nie przeżyje restartu serwera, to zabawka.
Jeśli budujesz agentów AI albo oceniasz ich dla swojego zespołu, lekcja nie dotyczy inteligencji. Trudny problem nigdy nie brzmiał 'zrób AI mądrym". Brzmiał 'zrób, żeby AI działało od wtorku do piątku bez kogoś, kto będzie przy nim siedzieć". REA rozwiązuje to deliberatywną hibernacją i ustrukturyzowanym budzeniem — nie trzymaniem procesu przy życiu w nieskończoność.
Meta właśnie udowodniła, że autonomiczni agenci potrafią prowadzić ciągłą, wielotygodniową inżynierię na systemie, który finansuje całą firmę. Nie w demie. Nie na benchmarku. Na produkcji, na maszynie reklamowej za 160 miliardów dolarów. AI inżynieruje teraz AI. A inżynierowie, którzy wcześniej tę robotę wykonywali? Dostali awans na supervisorów — niezależnie od tego, czy o to prosili.





