Każdy dostawca AI spędził kwiecień obiecując ci ten sam sen: autonomiczne agenty — cyfrowi pracownicy, którzy piszą kod, zamykają tickety i odpowiadają na maile klientów, a ty w tym czasie zajmujesz się "strategią". Anthropic, OpenAI, Google — wszyscy trzej wypuścili platformy agentowe w ciągu dwóch tygodni. Twój feed na LinkedInie wygląda jak targi pracy dla robotów.

Jest jeden haczyk, o którym nikt na keynote nie wspomina: twój szef właśnie napisał na Slacku pytając, kiedy WASZ zespół wdroży agentów. Dema są przepiękne — agent przechodzi od zgłoszenia buga do pull requesta w minuty, publiczność klaszcze jakby nigdy nie widziała skryptu w bashu. Ale co tak naprawdę dzieje się po tym, jak demo się kończy i kamery przestają nagrywać?

Trzy premiery spadły jedna po drugiej. Anthropic wypuścił Managed Agents 8 kwietnia — chmurowe API agentowe (sposób na zdalne tworzenie i sterowanie agentami przez twoje oprogramowanie) za 0,08 dolara za godzinę sesji. OpenAI zaktualizował swoje Agents SDK 15 kwietnia z natywnym sandbox execution — agenty odpalają kod w zamkniętym pudełku, żeby nic na zewnątrz nie zepsuć. A Google Cloud Next wystartował 22 kwietnia z keynote zatytułowanym "The Agentic Cloud", promując ADK (Agent Development Kit), który pojawił się wcześniej w tym miesiącu. Google wbudował human-in-the-loop jako domyślną funkcję od pierwszego dnia — zatrzymaj agenta w trakcie zadania, niech człowiek zatwierdzi, wznów.

Early adopterzy wskoczyli błyskawicznie. Rakuten wdrożył wyspecjalizowane agenty w pięciu działach — produkt, sprzedaż, marketing, finanse, HR — każdy uruchomiony w mniej niż tydzień. CTO Asany raportował dostarczanie funkcji "dramatycznie szybciej". Notion wpuścił Claude'a bezpośrednio do workspace'ów do równoległej obsługi zadań. A Sentry? Sentry poszedł na całość: ich agent przechodzi od zaflagowanego buga do otwartego pull requesta bez żadnej interwencji człowieka. W pełni autonomicznie. Sen dostawców ziścił się na żywo.

Ale teraz ta niewygodna część. Jeśli śledziłeś niezależne badania w tym miesiącu — a ten kanał cytował je wystarczająco często, żeby stali czytelnicy mogli recytować liczby z pamięci — wzorzec się nigdy nie zmienia. Kod AI generuje 1,7x więcej defektów. PR-y rosną o 20%, a incydenty o 23,5%. Developerzy kasują jedną piątą zaakceptowanego kodu AI i gruntownie przepisują kolejne 7%. Gartner przewiduje, że 40% projektów agentowych umrze do 2027. Więcej outputu, gorsze wyniki. Każde jedno badanie.

Andrej Karpathy powiedział to 3 kwietnia — zanim którakolwiek z tych trzech platform weszła na rynek. "Branża robi za duży skok i próbuje udawać, że to jest niesamowite, a nie jest." Trzy tygodnie i trzy premiery później — nic nie udowodniło, że się mylił.

To tworzy strukturalną przepaść między marketingiem a rzeczywistością. Dostawcy rywalizują na maksymalnej autonomii, bo fantastycznie wygląda na scenie. Ale dane produkcyjne mówią coś odwrotnego: wąski zakres bije szerokie możliwości. Workflow'y oparte na odczycie (gdzie agenty analizują, ale rzadko modyfikują) biją te oparte na zapisie. Punkty kontrolne z człowiekiem przed jakąkolwiek istotną akcją biją pełny autopilot. Nawet "w pełni autonomiczny" sukces Sentry działa właśnie dlatego, że triażowanie bugów do PR-ów to z natury ograniczona domena — a nie dlatego, że autonomia sama w sobie wygrywa.

Google może faktycznie to rozumie. Ich ADK dostarcza human-in-the-loop jako domyślną ścieżkę, a nie dodatek po fakcie. Jak napisał John Furrier z SiliconANGLE 20 kwietnia: "Funkcje siedzą na wierzchu platform. Systemy operacyjne definiują platformę." Prawdziwa konkurencja nie polega na tym, kto zbuduje najbardziej autonomicznego agenta — ale kto zbuduje najlepszy control plane.

Więc kiedy twój szef pyta o agentów, nie przesyłaj mu klipu z keynote'a. Zadaj jedno pytanie o dowolną platformę: jak łatwo jest zbudować ściśle ograniczonego agenta z jasnymi granicami zakresu, domyślnym dostępem tylko do odczytu i obowiązkową akceptacją człowieka przed czymkolwiek, co ma konsekwencje? Jeśli odpowiedź brzmi "no, da się to skonfigurować..." — odwróć się i odejdź. Jeśli to jest domyślne ustawienie — może masz coś wartościowego.

Najmądrzejszy agent nie wygra wojny platform. Wygra ten najbardziej sterowalny. A to odwraca priorytety w roadmapie każdego dostawcy.