Dwa tygodnie temu dałeś zielone światło na pilotaż agentów. Może to były nowe Managed Agents od Anthropic, może zaktualizowany Agents SDK OpenAI. Demo wyglądało obłędnie: juniorowe zadanie — segregacja ticketów, boilerplate, porządki w danych — znikało w 90 sekund. Policzyłeś. Mniej juniorów do zatrudnienia, seniorzy uwolnieni do "pracy o wysokiej wartości". ROI wyglądało jak pancerne.
A teraz puenta, której nikt nie wrzucił na slajd: twoi seniorzy spędzają więcej czasu na review outputu agentów, niż juniorzy kiedykolwiek spędzali na jego tworzeniu. I nikt tego nie zbudżetował.
Tydzień, który odpalił tysiąc agentów
Między 8 a 15 kwietnia trzej najwięksi vendorzy AI poszli na całość z produkcyjnymi agentami — autonomicznymi systemami, które nie tylko odpowiadają na pytania, ale same wykonują pracę. Anthropic 8 kwietnia wypuścił Managed Agents z Notion, Rakuten i Asaną jako partnerami startowymi. Atlassian 10 kwietnia wpakował agentów do Confluence. OpenAI 15 kwietnia rozszerzył swój Agents SDK o sandboxowane środowiska i zadania o długim horyzoncie. Enterprise agenci przeskoczyli z "eksperymentujemy" do "jest na prodzie" z dnia na dzień.
Nikt nie zapytał, co będzie dalej.
Dane, których nikt nie chce na dashboardzie
Pęknięcia widać było od miesięcy — jeśli ktokolwiek czytał badania.
Faros.ai przebadał ponad 10 000 developerów w 1 255 zespołach (publikacja lipiec 2025): indywidualnie devowie realizowali o 21% więcej zadań i mergowali o 98% więcej pull requestów. Brzmi jak wygrana. Ale czas review PR-ów skoczył o 91%. Bugów przybyło 9%. A na poziomie firmy? "Jakakolwiek korelacja między adopcją AI a kluczowymi metrykami wydajności — znika." Indywidualna prędkość w górę. Output zespołu — na boku. Agenci nie usunęli roboty — przenieśli ją wyżej, do kolejki review.
Dane wspierające są już dobrze znane — CodeRabbit wykrył 1,7× więcej problemów w kodzie generowanym przez AI (grudzień 2025), Princeton ustalił, że niezawodność agentów rośnie o połowę wolniej niż ich możliwości (marzec 2026). O obu pisaliśmy na kanale. Dane Faros wyjaśniają, dlaczego te liczby tak bolą w skali: wąskie gardło nie zniknęło. Migrowało z produkcji do review.
Pułapka strukturalna
Dlaczego ROI się odwraca — i nie da się tego spatchować.
Wykonanie zadania wymaga kompetencji. Zrecenzowanie outputu autonomicznego systemu wymaga kompetencji plus oceny sytuacji plus umiejętności wyłapania błędów, co do których AI jest święcie przekonane. Nadzór jest ściśle trudniejszy niż wykonanie.
Addy Osmani nazwał to "comprehension debt" — rosnącą przepaść między ilością istniejącego kodu a tym, ile z niego ktokolwiek rozumie — na O'Reilly Radar 13 kwietnia: "Junior może teraz generować kod szybciej, niż senior jest w stanie go krytycznie zaudytować." Badanie Anthropic na 52 inżynierach, opublikowane w lutym 2026, wykazało, że developerzy korzystający z AI uzyskali wyniki o 17 punktów procentowych niższe w testach rozumienia kodu, który właśnie "napisali".
Ludzki koszt jest już mierzalny. Harvard Business Review doniósł 5 marca, że 14% użytkowników AI doświadcza "brain fry" — mentalnego wyczerpania od ciągłego nadzoru nad AI. Nadzór został wskazany jako najbardziej obciążające psychicznie zajęcie związane z AI. Pracownicy z dużym obciążeniem nadzorczym popełniali 39% więcej poważnych błędów i doświadczali 33% więcej zmęczenia decyzyjnego. Częściej też odchodzili: 34% deklarowało zamiar odejścia, wobec 25% wśród tych bez "brain fry".
Shashi Bellamkonda z Info-Tech Research Group nazwał to "podatkiem od nadzoru" 5 kwietnia. Przytoczył inżyniera Microsoftu korzystającego z agenta kodującego, który stwierdził, że "nie mógł odejść od ekranu" — czuł się "jak ktoś ciągnięty na sile". Inżynier spodziewał się, że zleci robotę juniorowi. Dostał nerwową zmianę jako niania, gdzie konsekwencje odwrócenia wzroku były nieznane.
Cennik, którego ci nikt nie podał
Vendorzy rozliczają się za zużycie, niezależnie od jakości outputu. Godziny nadzoru nad agentami są niewidoczne w rozliczeniach projektowych — pojawiają się jako "czas seniora" bez żadnej pozycji łączącej je z agentem, który tę robotę wygenerował. Wąskie gardło kompetencji, które ograniczało twój zespół przed agentami, teraz ogranicza go po agentach — tylko na innej warstwie.
Prognoza Gartnera z czerwca 2025, że ponad 40% projektów agentowych zostanie skasowanych do 2027, zaczyna wyglądać na zachowawczą. Badanie OutSystems z 13 kwietnia wykazało, że 94% liderów IT martwi się już rozrostem agentów, a zaledwie 12% ma scentralizowaną platformę do zarządzania nimi. Tymczasem 52% polega na "human-on-the-loop supervision" — korporacyjny, grzeczny sposób na powiedzenie "człowiek patrzy na robota i się modli".
Co to oznacza dla ciebie
Zanim wdrożysz agentów, policz koszt nadzoru na agento-godzinę — nie cenę samej agento-godziny. Jeśli twojemu zespołowi brakuje seniorów do review, agenci powiększają lukę kompetencyjną zamiast ją domykać. Kalkulator ROI twojego vendora nie ma pola na "ile kosztuje, gdy twój najlepszy inżynier spędza cały wtorek na weryfikowaniu, czy agent po cichu nie rozwalił autentykacji".
Zadaj vendorowi jedno pytanie: jaki jest oczekiwany współczynnik nadzoru? Jeśli będzie się na ciebie gapił z pustym wzrokiem — masz odpowiedź.
Pierwsza realna segmentacja rynku agentów nie będzie po jakości modelu ani cenie. Będzie po tym, która platforma faktycznie zmniejsza obciążenie nadzorcze. Ta metryka jeszcze nie istnieje — a dopóki nie istnieje, każda projekcja ROI, którą widziałeś, pomija swoją największą zmienną. Dwa tygodnie temu pitch brzmiał "agenci zastępują juniorową robotę". Dziś pytanie brzmi: kto uratuje zdrowie psychiczne seniora.


