Три системи пам'яті AI, нуль доказів що вони реально допомагають

Ви вже кілька місяців працюєте зі своїм AI-асистентом для коду. Він автокомплітить назви змінних саме так, як вам подобається. Пам'ятає тестові патерни вашої команди. Знає, що ви перейменували той сервіс у вівторок, і не питає двічі. Ви нічого не налаштовували — він просто навчився.

Кайф, правда? Ніби джун, який реально веде нотатки. Є лише одна маленька проблема: дедалі більше доказів того, що вся ця накопичена пам'ять робить вашого агента гіршим у написанні коду. І забрати її з собою ви все одно не зможете.

Між 8 і 16 квітня Anthropic та OpenAI випустили нові системи пам'яті для своїх кодінг-агентів. Google Memory Bank працює ще з грудня 2025-го. Усі три архітектури абсолютно несумісні — і принаймні одне дослідження показало, що весь цей підхід частіше шкодить, ніж допомагає.

Три архітектури пам'яті, три різні ставки

Anthropic зайшов першим. 8 квітня вони запустили Managed Agents з Memory Stores — текстові колекції на рівні воркспейсу, які агент читає перед кожним завданням і оновлює після завершення. Кожна пам'ять обмежена 100 КБ, до сесії можна підключити до 8 сховищ, і кожне редагування створює іммутабельну версію. Ціна: стандартні тарифи API плюс $0.08 за годину сесії.

І це лише один шар. Claude Code фактично працює з трьома механізмами пам'яті: файли CLAUDE.md, написані користувачем (ваші інструкції), автоматично згенеровані файли MEMORY.md (нотатки агента для самого себе) та серверні Memory Stores. Три шари контексту. Три формати. Нуль портабельності.

OpenAI підтягнувся через тиждень. 15–16 квітня Codex випустив файли AGENTS.md для інструкцій проєкту, плюс фічу "Memories", що переносить "стабільні вподобання, конвенції проєкту та повторювані робочі патерни" між сесіями. Їхній підхід обходить дерево від кореня проєкту до поточної директорії, мерджить файли ієрархічно — до 32 КБ завантажується при кожному запуску.

Google пішов зовсім іншим шляхом. Memory Bank у Vertex AI Agent Engine, GA з грудня 2025-го і на платній основі з лютого 2026-го, повністю обходиться без markdown-файлів. Моделі Gemini аналізують вашу історію розмов у фоновому режимі й витягують структуровані спогади — ключові факти, вподобання, зв'язки — з автоматичним терміном дії та similarity search.

Markdown-шари vs ієрархічні ланцюги інструкцій vs AI-екстраговані структуровані дані. Три вендори, кожен переконаний, що саме його архітектура правильна. Індустрія досягла ідеальної несумісності у рекордні терміни.

Податок на пам'ять

А тепер — там, де маркетинг зустрічається з реальністю. У препринті за березень 2026 дослідники з ETH Zurich протестували, як контекстні файли впливають на продуктивність кодінг-агентів. У 5 з 8 тестових конфігурацій агенти працювали гірше з накопиченим контекстом, ніж без нього — а вартість інференсу зросла на 20% і більше.

Нехай це просочиться крізь самовдоволене сяйво вашого "персоналізованого AI-помічника". Фіча пам'яті, яку вендори продають як killer advantage, активно погіршувала якість коду у більшості тестових сценаріїв. Агент читає власні нотатки, заплутується у застарілому або суперечливому контексті й видає гірший код, змушуючи вас ще й платити більше токенів за цю привілею.

Це не має дивувати жодного сеньйора, який бачив, як системний промпт розпухає до 50 КБ. Більше контексту — більше жонглювання. Щось застаріло. Щось суперечить іншим частинам. Щось було актуальним три рефакторинги тому. Ваш агент сумлінно читає свої двомісячні нотатки про моноліт, який ви вже розпиляли на три мікросервіси, а потім впевнено генерує код для архітектури, якої більше не існує. Корисно.

І все одно — кожна сесія додає ще. Кожен баг, який ви пояснюєте, кожне архітектурне рішення, яке обговорюєте, кожен шорткат, який описуєте — все поглинається. Аналіз MindStudio від 9 квітня ввів термін "behavioral lock-in": "Коли ви експортуєте історію розмов, ви отримуєте текст. Чого ви не отримуєте — це внутрішні репрезентації моделі, ембедінги та ваги, що кодують те, чому агент насправді навчився."

Ви платите за накопичення архіву пам'яті, який, ймовірно, шкодить роботі агента — але піти не можете, бо почати з нуля означає втратити те, що працює. Краса.

Комфортна клітка

Як зазначив Kai Waehner 6 квітня, "якщо ваші агентні воркфлоу побудовані на пропрієтарному оркестраційному шарі вендора, витрати на перехід ростуть лавиноподібно." Коли моделі стають commodity — коли GPT-5, Claude 4 і Gemini 2.5 відрізняються на бенчмарках на 5% — агент, який знає вас найкраще, залишається тим, за якого ви продовжуєте платити. Не тому, що він кращий. Тому що піти занадто боляче.

І ось регуляторна прогалина, на яку вказує MindStudio: GDPR і CCPA покривають структуровані персональні дані — ваше ім'я, email, історію покупок. Ніхто не регулює неявні патерни, які AI-агент будує щодо вашого стилю кодування, архітектурних вподобань чи особливостей деплою. Ви можете запросити свої дані. Ви не можете запросити розуміння вас вашим агентом. Ця засвоєна поведінка — саме те, що створює витрати на перехід — існує в правовій сірій зоні, де немає кнопки експорту й жоден закон не вимагає її створення.

Жоден вендор не має стимулу будувати портабельний формат обміну пам'яттю. Ваш накопичений контекст — навіть контекст, що погіршує результати — це їхній рів.

Що робити прямо зараз

Проведіть аудит того, чому насправді навчився ваш агент. Якщо ви використовуєте Claude Code, відкрийте файли CLAUDE.md і MEMORY.md — це звичайний markdown у директорії проєкту. Прочитайте їх критично. Скільки з цього відображає ваш актуальний кодбейс? Скільки описує сервіс, який ви декомпозували два спринти тому? Якщо використовуєте Codex, пройдіть ланцюг AGENTS.md від кореня до листка. Якщо Vertex — перегляньте записи Memory Bank через консоль.

А потім зробіть контрінтуїтивну річ: вимкніть пам'ять на одну сесію і порівняйте результат. Якщо ваш агент працює так само або краще без накопичених нотаток — ви весь цей час платили податок на пам'ять за привілей бути залоченим.

Війни моделей були закускою. Шар пам'яті — це основна страва. І незручна правда полягає в тому, що ви платите за накопичення контексту, який погіршує роботу вашого агента, зберігається у форматі, який читає лише ваш поточний вендор, не захищений жодним регулюванням і портабельний рівно нікуди. Агент, який вас пам'ятає — це не той, хто працює для вас найкраще. Це просто той, від якого ви не можете піти.

Три системи пам'яті AI, нуль доказів що вони реально допомагають

Три архітектури пам'яті, три різні ставки

Податок на пам'ять

Комфортна клітка

Що робити прямо зараз

Читай далі

Діалог дозволів вашого агента — це плацебо

Парадокс агентів: менше автономії — більше користі

Кожна агентна платформа тарифікує за використання. Жодна не має аварійного вимикача

15 квітня Claude впав. Ваш увесь dev-стек впав разом з ним