Twoja firma prawdopodobnie wdrożyła swojego pierwszego agenta AI — program, który działa samodzielnie, a nie tylko odpowiada na pytania — gdzieś tej wiosny. Może robi code review pull requestów na GitHubie. Może triaguje tickety supportowe. Może pilnuje dashboardów chmurowych o 3 w nocy, żebyś ty nie musiał. Każdy z nich raportuje zielone na swoim własnym małym dashboardzie. Życie jest piękne.
Tylko że te trzy piszą do tego samego boarda w Jira, tych samych kanałów na Slacku, tych samych repozytoriów na GitHubie. I nikt — ani twój zespół, ani vendor — nie zdefiniował, co się dzieje, gdy ich akcje zderzą się na współdzielonych zasobach. Kupiłeś trzech autonomicznych pracowników i posadziłeś ich przy tym samym biurku, nawet ich sobie nie przedstawiając.
Trzy platformy, zero sygnalizacji
Google otwiera Cloud Next 2026 dziś (22 kwietnia, Las Vegas) ze swoim agentowym stackiem AI na pierwszym planie: ADK v1.0 — toolkit do budowania agentów — plus protokół A2A (Agent-to-Agent, standard pozwalający agentom odkrywać się nawzajem i delegować sobie zadania), który dziś dojrzewa do v1.0 po pierwszym preview na Cloud Next 2025 — teraz z ponad 150 wspierającymi organizacjami, w tym AWS, Microsoft i Salesforce. Dwa tygodnie temu (8 kwietnia) Anthropic uruchomił Managed Agents w publicznej becie — długo działające instancje Claude, które realizują całe workflowy, a nie tylko odpowiadają na prompty — z Notion, Asaną i Sentry jako pierwszymi użytkownikami. Tydzień temu (15 kwietnia) OpenAI zaktualizowało swoje Agents SDK o natywne sandboxowe środowisko wykonawcze — izolowane kontenery, w których agenty bezpiecznie uruchamiają kod — oraz model-native harness.
Trzy konkurujące runtime'y, każdy traktujący swojego agenta jako jedynego autonomicznego aktora w twojej infrastrukturze. Żaden z nich nie zawiera koncepcji "hej, inny agent już nad tym pracuje".
Jak agenty odnoszą sukces aż do porażki
Oto wzorzec, który już pojawia się w produkcji. Agent A (twój bot ticketowy) tworzy issue w Jira. Agent B (twój bot deduplikacyjny) klasyfikuje go jako duplikat i zamyka. Agent A wykrywa zamknięcie jako anomalię i ponownie otwiera ticket. Każdy agent ma rację w swoim własnym kontekście — swoim własnym oknie kontekstu (fragmencie informacji, który AI "widzi" w danym momencie). System jako całość się myli, utknięty w nieskończonej pętli, gdzie poprawne działania produkują niepoprawne wyniki.
Cogent Infotech udokumentował trzy warianty tego zjawiska 26 marca: efekt "Mirror Mirror" (agenty w nieskończoność nadpisują nawzajem swoje edycje, paląc tysiące dolarów w minuty), halucynowany konsensus (wiele agentów zbiegających się na sfabrykowanych danych — "cichy i przekonujący") oraz deadlocki zasobów (agenty czekające na siebie nawzajem w cyklicznych zależnościach). Ich werdykt: "Nie możesz zapytać agenta, czy jest w pętli; musisz to udowodnić matematycznie."
Dane to potwierdzają. Benchmark MAST z UC Berkeley, opublikowany w marcu 2025 i zaktualizowany w październiku 2025, przeanalizował ponad 1600 śladów w siedmiu frameworkach multi-agentowych i stwierdził wskaźniki awarii od 41% do 86,7%. Najlepsze: około 79% tych awarii wynikało z problemów specyfikacji i koordynacji — nie z tego, że modele były głupie. Agenty były wystarczająco inteligentne. Po prostu nie miały pojęcia o swoim istnieniu.
Artykuł opublikowany 16 kwietnia 2026, "Semantic Consensus", nadaje temu formalną nazwę: Semantic Intent Divergence — współpracujące agenty rozwijające niespójne interpretacje wspólnych celów, ponieważ każdy operuje we własnym silosie informacyjnym. W 600 przebiegach testowych na AutoGen, CrewAI i LangGraph badacze osiągnęli 100% ukończenia workflowów ze swoim proponowanym frameworkiem koordynacyjnym wobec 25,1% dla następnego najlepszego baseline'u. Przepaść jest oszałamiająca i potwierdza to, co liczby już szepczą: problemem nie jest inteligencja, lecz koordynacja.
Cena poprawki, której nikt nie wysyła
Protokół A2A Google'a to najbliższa rzecz do rozwiązania. Pozwala agentom się anonsować, opisywać swoje możliwości poprzez "Agent Cards" (teraz z kryptograficzną weryfikacją tożsamości) i przekazywać zadania. Ponad 150 organizacji się podpisało. Ale A2A definiuje discovery i delegację — nie rozwiązywanie konfliktów. Jeśli Agent A i Agent B mają uprawniony dostęp do modyfikacji tego samego ticketu w Jira, A2A nie ma zdania, kto wygrywa. A adopcja A2A oznacza routowanie koordynacji między agentami przez Vertex AI, platformę chmurową Google'a — rozwiązywanie kolizji vendorów lock-inem innego vendora.
Jak napisał John Furrier z SiliconANGLE 20 kwietnia: "Kto jest właścicielem control plane'u, w którym AI faktycznie wykonuje pracę? Modele stają się towarem." Ma rację. Walka nie toczy się o to, który model jest najmądrzejszy. Toczy się o to, kto zbuduje warstwę kontroli ruchu siedzącą nad nimi wszystkimi.
Architektura Managed Agents Anthropica wprost opisuje "wiele mózgów, wiele rąk" — ale dokumentuje zero koordynacji między mózgami. Agents SDK OpenAI wspiera Handoffs (delegację zadań agent-agent) i Guardrails (walidację wejścia/wyjścia), ale żadnego rozwiązywania konfliktów między agentami. Każdy vendor zbudował bardzo zdolnego solistę i założył, że wdrożysz tylko jednego na raz. W 2026 roku. W enterprise'ie.
Co z tym faktycznie zrobić
Zanim wdrożysz drugiego agenta na jakimkolwiek współdzielonym systemie — Jira, GitHub, Slack, konsola chmurowa — twój zespół potrzebuje trzech rzeczy, których żaden vendor obecnie nie dostarcza: jawnych reguł własności zasobów (który agent jest właścicielem których obiektów), współdzielonego rejestru stanu (jednego źródła prawdy o tym, co każdy agent zrobił) i polityk rozwiązywania konfliktów (gdy dwóch agentów się nie zgadza, kto wygrywa i dlaczego). Zbuduj to jako wewnętrzny middleware albo płać podatek od nieskończonej pętli.
Brakująca warstwa
Pamiętasz tego pierwszego agenta, którego wdrożyłeś? Tego, który raportuje zielone na swoim dashboardzie? Wciąż raportuje zielone. Drugi też. Trzeci też. Każdy agent myśli, że świetnie sobie radzi. System, który współdzielą, opowiada inną historię.
Brakującą warstwą infrastruktury ery agentów nie jest mądrzejszy model — to kontrola ruchu dla agentów, którzy już działają. Pierwsza platforma, która ją dostarczy, przejmie warstwę orkiestracji ponad Google'em, Anthropicem i OpenAI. Do tego czasu twoje agenty to trzy koty w kuchni, z których każdy jest święcie przekonany, że to jedyny lokator.
