Twoj agent AI nie wie, ze jest 3 w nocy i produkcja plonie

11 marca 2026 roku agent AI Amazona — Kiro — samodzielnie usunął i odtworzył produkcyjne środowisko AWS. Trzynaście godzin przestoju. Około 6,3 miliona utraconych zamówień. Post-mortem od Particula trafił w sedno rozróżnienia, które naprawdę ma znaczenie: "Uprawnienia odpowiadają na pytanie 'czy agent może to zrobić?' Nie odpowiadają na pytanie 'czy agent powinien to zrobić?' — a to właśnie to pytanie ma znaczenie dla bezpieczeństwa produkcji."

Na to pytanie o "powinien" nikt nie buduje odpowiedzi.

Niewidzialny system operacyjny twojego zespołu

Twój zespół ma niepisane zasady. Żadnych deployów w piątki. Wyciszenie botów podczas awarii. Nie dotykaj niczego w czasie freeze'a na sprint planning. Nikt ich nie spisał, bo każdy człowiek w zespole po prostu wie. To rodzaj instynktu operacyjnego, który budujesz po jednym za dużo budzeniu o trzeciej w nocy.

Twoje nowe agenty AI nie wiedzą o tym nic. Odpalają się zgodnie z harmonogramem, pushują kod, tworzą tickety i postują aktualizacje — niezależnie od tego, co dookoła płonie.

"Ale my już mamy automatyzację"

Tak. I zajęło dekadę blizn, żeby nauczyć ją powściągliwości.

PagerDuty potrzebowało dziesięciu lat post-mortemów o trzeciej w nocy, żeby zrozumieć, że może nie warto budzić ludzi z powodu padniętego stagingu, kiedy produkcja właśnie się sypie. Pipeline'y CI/CD (zautomatyzowane łańcuchy build-test-deploy) potrzebowały pokolenia spartaczonych releaseów, żeby odkryć, że "szanuj change freeze" to nie sugestia — to kwestia przetrwania. Boty na Slacku wyciszają się podczas okien serwisowych, bo jakiś biedak dostał 400 powiadomień podczas P0 i następnego ranka złożył wypowiedzenie.

Każde dojrzałe narzędzie ops nosi w sobie ciężko wypracowaną ocenę sytuacji zakodowaną jako świadomość kontekstowa. Platformy agentowe, które wyszły między 8 a 15 kwietnia 2026, pominęły tę całą dekadę i stwierdziły "wystarczy".

Premiery, o których już wiesz

Oszczędzę ci pełnej powtórki — widziałeś newsy. Anthropic wypuścił Managed Agents (8 kwietnia) i Claude Code Routines (14 kwietnia). OpenAI zaktualizowało swoje Agents SDK (15 kwietnia). Trzy platformy, osiem dni. Andrej Karpathy nazwał to "erą pętli" po tym, jak jego AutoResearch agent odpalił 700 eksperymentów przez dwa dni bez nadzoru 17 marca 2026.

Czego mogłeś nie zauważyć: sprawdziłem każdą stronę dokumentacji wszystkich trzech platform. Zero integracji z zarządzaniem incydentami. Brak obsługi freeze window. Brak świadomości stanu deploymentu. Ani jednego hooka, który pyta "czy teraz jest dobry moment?"

Jak wygląda ślepota kontekstowa o drugiej w nocy

Routine pushuje PR z aktualizacją zależności, kiedy dyżurny inżynier walczy z incydentem P0. Managed Agent tworzy tickety w Jirze, które kolidują z freeze'em na sprint planning. Agent SDK powtarza nieudane zapytanie API do bazy danych w trakcie migracji.

Każda akcja technicznie poprawna. Każda operacyjnie katastrofalna.

To ta sama klasa błędu, która zrujnowała Amazonowi popołudnie 11 marca. Kiro miał uprawnienia do odtworzenia środowiska. Nikt nie zakodował oceny sytuacji, która powiedziałaby mu, żeby tego nie robił.

Cena "always-on" bez "always-aware"

Zbudowanie świadomości agenta dzisiaj oznacza ręczne kablowanie: podłączanie triggerów do PagerDuty, Opsgenie, ArgoCD, kalendarzy zespołu — jeden MCP server (ustandaryzowany plugin łączący narzędzia AI z zewnętrznymi serwisami) na każde źródło sygnału. Nikt tego nie pakietuje.

Dzienne limity Routines — 5 uruchomień dla Pro, 15 dla Max, 25 dla Enterprise — ograniczają ile razy agent się uruchomi. Nie mówią nic o tym, kiedy powinien siedzieć cicho. The Register nazwał je "lekko sprytnymi cronami", co jest hojne — bo prawdziwy cron przynajmniej działa w ekosystemie, który nauczył się powściągliwości dekady temu.

Co robić, zanim platformy dojrzeją

Trzy rzeczy, żadna opcjonalna:

Dokumentuj runbooki agentów obok ludzkich. Jeśli twój playbook dyżurny mówi "podczas incydentów nie deployuj", twój agent potrzebuje tej samej zasady — w swoim pliku konfiguracyjnym, nie w twojej głowie.
Jawne konfiguracje freeze window. Choćby ręcznie robione. Plik tekstowy, który mówi "sprint planning: wtorek 10–11, nie twórz ticketów" bije brak czegokolwiek o kilometry.
Kill switch, który nie polega na "usuń Routine". Coś pomiędzy "działa" a "zniknęło na zawsze". Przycisk pauzy. Radykalna koncepcja, najwyraźniej.

Dyscyplina, która jeszcze nie istnieje

Era agentów nie potrzebuje więcej możliwości. Co tydzień pojawiają się nowe. Potrzebuje własnej dyscypliny ops — takiej, która odpowiada nie na "co agent może zrobić", ale "kiedy agent powinien siedzieć cicho".

Twój zespół budował ten instynkt latami. Twoje agenty startują od zera za każdym razem, gdy się bootują. Dopóki platformy nie zakodują kontekstu operacyjnego jako prymitywu pierwszej klasy, ta luka jest twoim problemem do załatania — ręcznie, mozolnie, jedno freeze window na raz.

Incydent z Kiro nie był błędem uprawnień. Był błędem oceny sytuacji. I teraz każdy always-on agent na produkcji nosi ten sam martwy punkt.

Twoj agent AI nie wie, ze jest 3 w nocy i produkcja plonie

Niewidzialny system operacyjny twojego zespołu

"Ale my już mamy automatyzację"

Premiery, o których już wiesz

Jak wygląda ślepota kontekstowa o drugiej w nocy

Cena "always-on" bez "always-aware"

Co robić, zanim platformy dojrzeją

Dyscyplina, która jeszcze nie istnieje

Keep reading

Claude Code Routines: Anthropic właśnie wypuścił swojego pierwszego demona AI

Okienko uprawnien twojego agenta to placebo

Paradoks agentow: mniej autonomii, wiecej wartosci

Trzy platformy agentowe, trzy rozne gatunki