Agent记忆框架怎么选?5大Agent Memory项目工程级横向对比,哪一种才是未来Agent记忆的标准答案
通用视频内容提取提示词
以下是根据视频内容提取的核心信息,按照视频呈现的顺序,区分通识内容与特色要点进行精准提炼:
核心背景引入
- 痛点:当前多数LLM Agent默认“无状态”(没有长期记忆)。
- 主题:横向对比当前记忆框架主流范式的5大工程级项目,探讨Agent记忆的设计框架。
模块一:Text to mem (定义记忆的基础操作语言)
- 定位:并非单纯的记忆系统,而是给所有记忆系统定义一套通用的操作语言(类似于CPU指令集架构),作为LLM与存储之间的中间表示层。
-
特色要点:
-
12个原子操作:分为ENC(编码诞生)、RET(检索提取)、STO(生命周期管理)三个阶段。
- 操作分离设计:将
retrieve(纯数据毫秒级取回)与summarize(高延迟的LLM完整推理)分开,允许执行引擎采用不同的超时、缓存与降级策略。 - 五元结构JSON标准:将所有操作收敛为包含“阶段、操作名、目标、参数、元数据”的标准格式。
- 强制安全验证:元数据中内置两个安全字段,必须满足
dry run(模拟执行)或confirmation: true(显式确认)其一,外加两层验证(外层JSON schema查格式,内层Pydantic查业务逻辑拦截),兜底LLM幻觉。 - Lock操作:支持只读、禁删、仅追加、完全可编程四种模式与审核机制。
- 局限性:目前存储仅有SQLite参考实现,缺乏HTTP API和向量支持。
模块二:Mem0 / Mem Zero (最流行的记忆中间件全家桶)
- 定位:当前热度极高的开源记忆中间件,解决长上下文偏好遗失和会话不连贯问题。
-
特色要点:
-
动态加载工厂模式:中间层内置5大工厂模式(LLM、Embedding、向量库、图存储等),使用
importlib动态加载,未安装相关依赖包也不会导致系统崩溃。 - UUID幻觉处理:将长UUID临时映射为“0, 1, 2”等简单整数供LLM处理,系统再映射回真实UUID,避免大模型对长字符串处理产生幻觉。
- 双存储并行检索:向量存储(负责语义相似度)与图存储(负责关系推理)双路径并行运行并合并结果。
- 双Prompt防污染策略:区分“用户记忆抽取”与“Agent记忆抽取”Prompt,防止AI的自我表达污染用户客观记忆,同时支持AI自我认知积累。
- 多层级隔离:支持用户隔离、Agent隔离、运行时隔离,适配复杂多用户场景。
- 通识要点:分为语义、情景、程序三种记忆类型;提升准确率、响应速度并节省Token。
- 局限性及场景:完整模式每次调用需2-5次LLM交互,Token消耗随记忆规模线性增长;不适合高频实时写入,适合客服、AI助手等中低频写入场景。
模块三:LETTA / 原MemGPT (操作系统级虚拟内存架构)
- 定位:将操作系统的“虚拟内存”思想完整搬进Agent架构,实现极强的记忆自治。
-
特色要点:
-
三层无损分层记忆:
-
Core memory(核心内存):嵌在系统Prompt中,强制字符上限约束(如10万字),逼迫信息蒸馏。 -
Archival memory(归档内存):容量无限,走向量检索(类似磁盘)。 -
Recall memory(召回内存):存放历史对话消息。Core内存满时触发驱逐机制,旧消息移入Recall内存,仍可检索。 - Git赋能的记忆管理:真实来源为Git,PG数据库作读缓存。每次记忆变更产生Git commit(含ID、时间戳、原因),实现不可变性、内容寻址、防篡改、历史回溯、并发安全及可审计目录树。
- Sleep Time Agent (休眠期Agent) :双线运作。主Agent负责低延迟推理交互;利用用户无交互的空闲时间,触发后台Sleep Agent使用更大Token预算进行深度反思与自我改进。
- 局限性:认知门槛高,强依赖外部环境(超80个依赖包)。
-
模块四:REMI (高透明度的“文件即记忆”)
- 定位:将记忆的控制权和透明度还给用户,人机友好的本地文件系统。
-
特色要点:
-
Markdown直接可视:摒弃传统数据库黑盒,记忆直接保存为Markdown文件,用户可直接打开查看、编辑并进行版本控制。
- 双频系统错位:REMI light管理短期文件记忆,REMI本体管理长期向量记忆,时间维度错开。
- 增量监控 (Delta File Watcher) :精准识别文件纯追加模式,只处理新增内容的Embedding,节省约92%的API调用浪费。
- 条件与内容分离嵌入:将向量嵌入建立在
when to use(使用场景/条件)上而不是具体内容上,天然贴合用户查询语义,大幅提升召回率。 - 通识要点:支持AI自主使用工具管理文件组织记忆;小模型加载此系统可超越无记忆大模型的表现。
模块五:MEMU (主动出击的24小时常驻记忆系统)
- 定位:将“记忆系统”本身变成一个独立的主动型Agent,从被动记录转向主动预测。
-
特色要点:
-
主动式双Agent架构:Main Agent负责常规对话交互;后台单独起一个异步任务作为
MEMU Bot专职处理记忆,实时监听交互、预测用户下文并提前预加载相关上下文。 - 概念领域目录树:与REMI的人类可视文本不同,它是Bot自我维护的结构化体系(文件夹对应类目,文件对应条目,符号链接对应交叉引用)。
- 显著性感知记忆 (Salience-aware memory) :引入强化计数器机制。记忆每被检索一次计数+1,后续排序按强化次数加权。模拟人类“肌肉记忆”,越常用的内容越容易被召回。
- 场景:极适合需要长期陪伴和学习的场景(如DevOps Agent、研究助手)。
核心总结观点提取:
框架发展趋势正经历从“给Agent外挂记忆(被动对象)”到“记忆本身就是一个主动的Agent(主动自治)”的范式跃迁。