Tres sistemas de memoria para IA, cero pruebas de que realmente sirvan

Llevas meses usando tu herramienta de código con IA. Autocompleta tus variables como te gustan. Recuerda los patrones de testing de tu equipo. Sabe que renombraste ese servicio el martes pasado y no pregunta dos veces. No configuraste nada de esto — simplemente aprendió.

¿Se siente genial, no? Como tener un junior que de verdad toma notas. Solo hay un pequeño problema: la evidencia creciente sugiere que toda esa memoria acumulada podría estar haciendo que tu agente sea peor escribiendo código. Y todavía no te la puedes llevar cuando te vas.

Entre el 8 y el 16 de abril, Anthropic y OpenAI lanzaron sistemas de memoria completamente nuevos para sus agentes de código. Memory Bank de Google lleva funcionando desde diciembre de 2025. Las tres arquitecturas son completamente incompatibles — y al menos un estudio encontró que todo el enfoque falla más de lo que funciona.

Tres arquitecturas de memoria, tres apuestas distintas

Anthropic fue primero. El 8 de abril, lanzaron Managed Agents con Memory Stores — colecciones de texto con alcance de workspace que el agente lee antes de cada tarea y actualiza cuando termina. Cada memoria tiene un tope de 100KB, puedes adjuntar hasta 8 stores por sesión, y cada edición crea una versión inmutable. Precio: tarifas estándar de API más $0.08 por hora de sesión.

Eso es solo una capa. Claude Code en realidad ejecuta tres mecanismos de memoria: archivos CLAUDE.md escritos por el usuario (tus instrucciones), archivos MEMORY.md autogenerados (las notas del agente para sí mismo), y esos Memory Stores del servidor. Tres capas de contexto. Tres formatos. Cero portabilidad.

OpenAI siguió una semana después. El 15-16 de abril, Codex lanzó archivos AGENTS.md para instrucciones de proyecto, más una función de "Memories" que carga "preferencias estables, convenciones de proyecto y patrones de trabajo recurrentes" entre sesiones. Su enfoque recorre desde la raíz de tu proyecto hasta el directorio actual, fusionando archivos jerárquicamente — hasta 32KB cargados en cada ejecución.

Google tomó un camino completamente diferente. Memory Bank en Vertex AI Agent Engine, disponible de manera general desde diciembre de 2025 y facturando desde febrero de 2026, se salta los archivos markdown por completo. Los modelos Gemini analizan tu historial de conversación en segundo plano y extraen memorias estructuradas — datos clave, preferencias, relaciones — con expiración automática y búsqueda por similitud.

Capas de markdown vs. cadenas jerárquicas de instrucciones vs. datos estructurados extraídos por IA. Tres proveedores, cada uno convencido de que su arquitectura es la correcta. La industria logró incompatibilidad perfecta en tiempo récord.

El impuesto de la memoria

Aquí es donde el discurso de ventas se estrella contra la realidad. En un preprint de marzo de 2026, investigadores de ETH Zurich probaron cómo los archivos de contexto afectan el rendimiento de los agentes de código. En 5 de 8 configuraciones de prueba, los agentes rindieron peor con contexto acumulado que sin él — mientras los costos de inferencia subieron 20% o más.

Deja que eso penetre a través del brillo autocomplaciente de tu "asistente de IA personalizado". La función de memoria que los proveedores venden como su ventaja asesina degradó activamente la calidad del output en la mayoría de los escenarios de prueba. El agente lee sus propias notas, se enreda en contexto obsoleto o contradictorio, y produce peor código mientras te cobra más tokens por el privilegio.

Esto no debería sorprender a ningún ingeniero senior que haya visto un system prompt inflarse a 50KB. Más contexto significa más que malabarear. Parte está desactualizado. Parte contradice otras partes. Parte era relevante hace tres refactorizaciones. Tu agente lee obedientemente sus notas de hace dos meses sobre un monolito que ya dividiste en tres microservicios, y luego genera código con toda confianza para una arquitectura que ya no existe. Muy útil.

Y aun así — cada sesión agrega más. Cada bug que explicas, cada decisión de arquitectura que debaten, cada atajo que describes se absorbe. El análisis de MindStudio del 9 de abril acuñó el término "behavioral lock-in" (bloqueo conductual): "Cuando exportas tu historial de conversación, obtienes texto. Lo que no obtienes son las representaciones internas del modelo, embeddings y pesos que codifican lo que el agente realmente aprendió."

Estás pagando por acumular un archivo de memoria que probablemente empeora el output de tu agente — pero no te puedes ir porque empezar de cero significa perder lo que sí funciona. Hermoso.

La jaula cómoda

Como señaló Kai Waehner el 6 de abril, "si tus flujos de trabajo agénticos están construidos sobre la capa de orquestación propietaria de un proveedor, los costos de cambio se multiplican rápidamente." Cuando los modelos se comoditizan — cuando GPT-5, Claude 4 y Gemini 2.5 rinden dentro del 5% uno del otro en benchmarks — el agente que mejor te conoce es el que sigues pagando. No porque sea mejor. Porque irte duele demasiado.

Y aquí está el vacío regulatorio que señala MindStudio: GDPR y CCPA cubren datos personales estructurados — tu nombre, email, historial de compras. Nadie regula los patrones implícitos que tu agente de IA construye sobre tu estilo de código, preferencias de arquitectura o particularidades de despliegue. Puedes solicitar tus datos. No puedes solicitar la comprensión que tu agente tiene de ti. Ese comportamiento aprendido — lo que realmente genera costos de cambio — existe en una tierra de nadie legal donde no hay botón de exportar y ninguna ley exige uno.

Ningún proveedor tiene incentivos para construir un formato de intercambio de memoria portable. Tu contexto acumulado — incluso el contexto que está empeorando las cosas — es su foso defensivo.

Qué deberías hacer ahora

Audita lo que tu agente actual realmente ha aprendido. Si usas Claude Code, abre tus archivos CLAUDE.md y MEMORY.md — son markdown plano en el directorio de tu proyecto. Léelos críticamente. ¿Cuánto todavía refleja tu codebase real? ¿Cuánto describe un servicio que descompusiste hace dos sprints? Si usas Codex, recorre tu cadena de AGENTS.md de raíz a hoja. Si usas Vertex, revisa las entradas de tu Memory Bank en la consola.

Después haz algo contraintuitivo: desactiva la memoria por una sesión y compara los resultados. Si tu agente rinde igual o mejor sin sus notas acumuladas, has estado pagando un impuesto de memoria por el privilegio de estar encadenado.

Las guerras de modelos fueron la entrada. La capa de memoria es el plato fuerte — y la verdad incómoda es que estás pagando por acumular contexto que degrada el trabajo de tu agente, almacenado en un formato que solo tu proveedor actual puede leer, protegido por ninguna regulación, y portable a exactamente ningún lado. El agente que te recuerda no es el que mejor te sirve. Es simplemente el que no puedes dejar.

Tres sistemas de memoria para IA, cero pruebas de que realmente sirvan

Tres arquitecturas de memoria, tres apuestas distintas

El impuesto de la memoria

La jaula cómoda

Qué deberías hacer ahora

Keep reading

El dialogo de permisos de tu agente es un placebo

La paradoja de los agentes: menos autonomia, mas valor

Todas las plataformas de agentes cobran por uso. Ninguna trae un kill switch.

Claude se cayó el 15 de abril. Tu stack de desarrollo entero se fue con el.