Używasz swojego AI do kodowania od kilku miesięcy. Autouzupełnia nazwy zmiennych tak, jak lubisz. Pamięta wzorce testów twojego zespołu. Wie, że we wtorek zmieniłeś nazwę tego serwisu i nie pyta drugi raz. Niczego nie konfigurowałeś — po prostu się nauczył.
Fajne uczucie, co? Jakbyś miał juniora, który faktycznie robi notatki. Jest tylko jeden drobny problem: coraz więcej dowodów wskazuje, że cała ta nagromadzona pamięć może sprawiać, że twój agent pisze gorszy kod. A i tak nie zabierzesz jej ze sobą, kiedy odejdziesz.
Między 8 a 16 kwietnia Anthropic i OpenAI wypuściły zupełnie nowe systemy pamięci dla swoich agentów kodujących. Google'owy Memory Bank działa od grudnia 2025. Wszystkie trzy architektury są kompletnie niekompatybilne — a przynajmniej jedno badanie wykazało, że cała ta koncepcja przynosi więcej szkody niż pożytku.
Trzy architektury pamięci, trzy różne zakłady
Anthropic ruszył pierwszy. 8 kwietnia uruchomili Managed Agents z Memory Stores — kolekcjami tekstowymi o zasięgu workspace, które agent czyta przed każdym zadaniem i aktualizuje po zakończeniu. Każda pamięć ma limit 100KB, do sesji można podpiąć do 8 store'ów, a każda edycja tworzy niemutowalną wersję. Cennik: standardowe stawki API plus 0,08 USD za godzinę sesji.
To tylko jedna warstwa. Claude Code faktycznie korzysta z trzech mechanizmów pamięci: plików CLAUDE.md pisanych przez użytkownika (twoje instrukcje), automatycznie generowanych plików MEMORY.md (notatki agenta do samego siebie) i tych serwerowych Memory Stores. Trzy warstwy kontekstu. Trzy formaty. Zero przenośności.
OpenAI dołączyło tydzień później. 15–16 kwietnia Codex wypuścił pliki AGENTS.md na instrukcje projektowe, plus funkcję "Memories" przenoszącą "stabilne preferencje, konwencje projektowe i powtarzające się wzorce pracy" między sesjami. Ich podejście polega na przechodzeniu od korzenia projektu do bieżącego katalogu, scalając pliki hierarchicznie — do 32KB ładowane przy każdym uruchomieniu.
Google poszedł zupełnie inną drogą. Memory Bank w Vertex AI Agent Engine, ogólnie dostępny od grudnia 2025 i naliczający opłaty od lutego 2026, całkowicie pomija pliki markdown. Modele Gemini analizują twoją historię rozmów w tle i wyodrębniają strukturyzowane wspomnienia — kluczowe fakty, preferencje, relacje — z automatycznym wygasaniem i wyszukiwaniem podobieństwa.
Warstwy markdown vs. hierarchiczne łańcuchy instrukcji vs. strukturyzowane dane wyodrębniane przez AI. Trzech vendorów, każdy przekonany, że jego architektura jest tą właściwą. Branża osiągnęła idealną niekompatybilność w rekordowym tempie.
Podatek od pamięci
I tu marketingowa wizja zderza się z rzeczywistością. W preprincie z marca 2026 badacze z ETH Zurich przetestowali, jak pliki kontekstowe wpływają na wydajność agentów kodujących. W 5 z 8 konfiguracji testowych agenci radzili sobie gorzej z nagromadzonym kontekstem niż bez niego — a koszty inferencji skoczyły o 20% lub więcej.
Niech to dotrze do ciebie przez samozadowolony blask twojego "spersonalizowanego asystenta AI". Funkcja pamięci, którą vendorzy reklamują jako swoją zabójczą przewagę, aktywnie pogarszała jakość kodu w większości scenariuszy testowych. Agent czyta własne notatki, gubi się w przestarzałym lub sprzecznym kontekście i produkuje gorszy kod, jednocześnie kasując od ciebie więcej tokenów za ten przywilej.
To nie powinno dziwić żadnego doświadczonego inżyniera, który widział, jak system prompt puchnie do 50KB. Więcej kontekstu = więcej do żonglowania. Część jest nieaktualna. Część przeczy innym częściom. Część była istotna trzy refaktory temu. Twój agent posłusznie czyta swoje dwumiesięczne notatki o monolicie, który od tamtego czasu rozbiłeś na trzy mikroserwisy, a potem pewnie generuje kod dla architektury, która już nie istnieje. Pomocne.
A jednak — z każdą sesją przybywa więcej. Każdy bug, który tłumaczysz, każda decyzja architektoniczna, którą dyskutujesz, każdy skrót, który opisujesz — wszystko jest wchłaniane. Analiza MindStudio z 9 kwietnia ukuła termin "behavioral lock-in": "Kiedy eksportujesz historię rozmów, dostajesz tekst. Czego nie dostajesz, to wewnętrzne reprezentacje modelu, embeddingi i wagi, które kodują to, czego agent faktycznie się nauczył."
Płacisz za gromadzenie archiwum pamięci, które prawdopodobnie pogarsza output twojego agenta — ale nie możesz odejść, bo zaczęcie od zera oznacza utratę tego, co faktycznie działa. Pięknie.
Wygodna klatka
Jak zauważył Kai Waehner 6 kwietnia, "jeśli twoje agentic workflows opierają się na własnościowej warstwie orkiestracji vendora, koszty przejścia rosną lawinowo." Kiedy modele się utowarowią — kiedy GPT-5, Claude 4 i Gemini 2.5 będą się różnić o 5% na benchmarkach — agent, który zna cię najlepiej, to ten, któremu dalej płacisz. Nie dlatego, że jest lepszy. Dlatego, że odejście boli za bardzo.
I jest jeszcze próżnia regulacyjna, na którą zwraca uwagę MindStudio: RODO i CCPA chronią strukturyzowane dane osobowe — twoje imię, email, historię zakupów. Nikt nie reguluje ukrytych wzorców, które twój agent AI buduje na temat twojego stylu kodowania, preferencji architektonicznych czy specyfiki deploymentów. Możesz zażądać swoich danych. Nie możesz zażądać zrozumienia, które agent ma na twój temat. Ta wyuczona wiedza — to, co faktycznie tworzy koszty przejścia — tkwi w prawnej ziemi niczyjej, gdzie nie ma żadnego przycisku eksportu i żadne prawo go nie wymaga.
Żaden vendor nie ma motywacji, żeby zbudować przenośny format wymiany pamięci. Twój nagromadzony kontekst — nawet ten, który pogarsza wyniki — to ich fosa.
Co powinieneś zrobić teraz
Zaudytuj, czego twój agent faktycznie się nauczył. Jeśli używasz Claude Code, otwórz pliki CLAUDE.md i MEMORY.md — to zwykły markdown w katalogu projektu. Przeczytaj je krytycznie. Ile z tego wciąż odzwierciedla twoją aktualną bazę kodu? Ile opisuje serwis, który rozłożyłeś na części dwa sprinty temu? Jeśli używasz Codex, przejdź łańcuch AGENTS.md od korzenia do liścia. Jeśli korzystasz z Vertex, przejrzyj wpisy Memory Bank w konsoli.
A potem zrób coś nieintuicyjnego: wyłącz pamięć na jedną sesję i porównaj output. Jeśli twój agent radzi sobie tak samo lub lepiej bez nagromadzonych notatek, to płaciłeś podatek od pamięci za przywilej bycia zamkniętym u vendora.
Wojny modeli były przystawką. Warstwa pamięci to danie główne — a niewygodna prawda jest taka, że płacisz za gromadzenie kontekstu, który pogarsza pracę twojego agenta, zapisanego w formacie czytelnym tylko dla twojego obecnego vendora, niechronionego żadnymi regulacjami i przenośnego donikąd. Agent, który cię pamięta, nie jest tym, który ci najlepiej służy. To po prostu ten, którego nie możesz porzucić.



