ZENTHOS Workspace
RAW · · 2026-04-25 · 6 min · #F26PPPP

Agent记忆系统深度拆解(下)|MemOS _ OpenViking _ Hindsight _ Second Me _ MetaMem 五大开源架构全景对比

MemOS系统级治理记忆,OpenViking映射为文件系统降低92%-96%Token成本,Hindsight巩固引擎实现反思,Second Me训练本地数字孪生,MetaMem提供可插拔元记忆策略增强。

Agent记忆系统深度拆解(下)|MemOS / OpenViking / Hindsight / Second Me / MetaMem 五大开源架构全景对比

通用视频内容提取提示词

以下是基于视频内容的精准核心信息提取,严格按照视频展现顺序,采用“通识略写、特色详写”原则:

1. MemOS(将记忆作为操作系统资源治理)

  • 通识概述:由MemTensor团队联合多所高校开发(V2.0.8 星辰),学术背景深厚,定位为“记忆操作系统”。
  • 核心特色与突破

  • 系统级治理架构:不只是被动数据库,而是主动治理的系统。采用六层架构,将记忆管理映射为操作系统机制(核心引擎对应OS内核、异步调度器对应进程调度、记忆容器对应容器)。

  • 三类记忆体系(核心创新)

    1. 文本记忆:包含简单文本、向量库通用文本、基于Neo4j图数据库的树形结构记忆(分Working/Long-term/User三层,Working层仅为临时镜像供快速可见,由大模型驱动的Memory Leader而非Manager决定层级归属)。
    2. 激活记忆(KV Cache) :将高频上下文预编码为KV Cache,跳过重复Prefill计算,复用注意力缓存(支持Dynamic Cache和Page Attention)。
    3. 参数记忆:蓝图规划将高频知识蒸馏为LoRA权重以实现0 Token消耗(目前代码中仅为占位符)。
    4. 局限性:完整部署依赖Neo4j、Redis、RabbitMQ等五套基础设施,运维成本较高。

2. OpenViking(将记忆映射为文件系统)

  • 通识概述:字节跳动火山引擎团队开源,定位为“上下文数据库(Context Database)”。
  • 核心特色与突破

  • 虚拟文件系统范式:将引入的外部知识、用户偏好、Agent自身技能统一映射到虚拟文件系统(分resources、user、agent三个目录)。大模型可通过标准化Shell命令(如ls​, tree​, grep)直接操作上下文,目录层级具备显式可解释性,比向量余弦距离更直观。

  • L0/L1/L2 分层上下文加载

    • 每个节点自动生成三层:L0(100 Token摘要)、L1(2000 Token核心概览)、L2(完整原始数据)。
    • 采用L0-First策略,检索时先看候选节点摘要,仅对高相关节点追加展开。相比传统RAG,可降低92%-96%的Token成本。
    • 检索算法创新:采用优先级队列驱动的最佳优先搜索(Best-First Search,类似A*),将预算优先分配给最高分节点;并具备最大熵的“父子节点分数传播机制”(权重各占一半)。
    • 底层工程优化:混合四种语言(Python做逻辑,C++做向量引擎提速10-50倍,Go做文件服务,Rust做CLI工具)。

3. Hindsight(让AI像人一样反思与学习)

  • 通识概述:来自Vectorize,在LongMemEval基准上取得SOTA,强调“让Agent学习而不仅是记住”。
  • 核心特色与突破

  • 认知科学映射架构:将记忆分为世界事实(语义记忆)、经验事实(情景记忆,包含5W维度)、心智模型(程序性/专家知识),以及由事实提炼出的“观察层(Observations)”。支持从概念到细节的按层次检索。

  • Consolidation(巩固)引擎:后台异步任务(类比人类睡眠期间的记忆巩固),将新写入的经验事实自动提炼为语义记忆,实现信息的有损重构(故意丢失细节换取高质量支撑)。
  • MPFP图检索与四路并行:采用语义、全文、时间、图结构四路并行检索。独创MPFP(MetaPath Forward Push)算法,利用实体、因果、时间等关联,零LLM调用且具备次线性时间复杂度,能召回语义相似度极低但存在强隐性关联的记忆碎片。
  • Disposition(性格维度)配置:为同一记忆库配置怀疑度、字面主义、共情力三个维度,同一套数据在不同配置下可产生批判分析或支持陪伴等截然不同的反思结论。

4. Second Me(训练100%本地的数字孪生)

  • 通识概述:Mandiverse团队开源,路线是放大个人特质,在本地训练一个真实反映用户身份与偏好的个性化模型。
  • 核心特色与突破

  • 全新的L0/L1/L2信息提炼

    • L0层(情景记忆):将长文档转化为结构化洞察。关键在Prompt中注入用户画像(Bio),生成带有“用户视角”的个性化洞察。
    • L1层(语义记忆):画像建模。识别兴趣生成多面体标签(Facets/Shades),相似内容自动合并。
    • L2层(程序记忆):基于L0和L1进行数据合成,生成LoRA微调训练数据,产出个性化权重,完成信息从字面到参数化的内化压缩。
    • Me-Alignment数据合成:包含Self-QA(了解自己的程度)、Preference(预测偏好能力)、Diversity(防过拟合)三种策略,对抗消除差异的传统RLHF原则。
    • 事实纠偏:虽标榜100%本地,但目前受端侧小模型能力限制,训练数据准备阶段(如画像生成、偏好合成)仍必须一次性调用外部API进行知识蒸馏,仅推理阶段为纯本地。

5. MetaMem(专注于记忆的策略增强层)

  • 通识概述:清华、北邮等联合开源项目。不负责存储和检索,定位为可插拔的“记忆使用策略增强层”。
  • 核心特色与突破

  • 元记忆学习(Learning to Learn) :针对长对话碎片化导致的逻辑冲突问题,不学习领域知识,而是学习“如何有效利用检索到的记忆片段”,产出自然语言表述的“元记忆原则”。

  • Partial Correctness Filter(部分正确性过滤) :最高效的学习设计。剔除全对(太简单)或全错(结构性失败)的样本,只处理有时对有时错(奖励在0-1之间)的样本,利用其巨大的梯度信号介入优化推理路径选择。
  • 符号化优化(Training-free) :不微调模型参数,而是通过“增加、更新、删除”三种符号化操作修改自然语言规则库。完全可解释,且学成的元记忆可零成本跨模型、跨领域迁移。

原视频链接:https://www.bilibili.com/video/BV1orQJB2Edt

子笔记 · 源自 20260423思路整理