AI 快讯 编译自 marktechpost #开源项目#记忆系统#AI代理

Memory OS:为Hermes Agent打造6层开源记忆栈,本地持久化存储

Memory OS是一个MIT许可的开源项目,在Hermes Agent基础上构建了6层记忆架构,包括结构化事实、向量数据库和自动知识维基。它完全本地运行,支持多种LLM提供商,通过门控检索和去重机制实现token高效。本文解析其架构、检索流程及对中文开发者的意义。

编译发布 2026/06/01 原文发布 2026/06/01

一句话看懂

Memory OS是一个6层开源记忆栈,为Hermes Agent添加本地持久化记忆,通过结构化事实、向量搜索和自动维基实现跨会话高效召回。

详细发生了什么

Hermes Agent本身已具备跨会话记忆能力,包括工作区文件和全文搜索。但社区认为内置记忆对于严肃工作仍显浅薄。开发者ClaudioDrews发布了Memory OS,一个MIT许可的开源库,在Hermes之上堆叠了6层记忆架构。

这6层从底层到顶层依次是:

  1. Workspace:注入系统提示的MEMORY.md、USER.md、CREATIVE.md文件。
  2. Sessions:基于SQLite和FTS5全文搜索的会话数据库。
  3. Structured Facts:带信任评分和反馈循环的持久化事实存储。
  4. Fabric:基于Icarus Plugin的修改版,提供16个工具用于跨会话召回。
  5. Vector Database:基于Qdrant,使用4096维余弦向量和BM25稀疏搜索。
  6. LLM Wiki:自动策划的概念、实体和比较知识库,持续回灌到Qdrant。

检索流程在pre_llm_call阶段执行“外科手术式召回”,同时从Fabric、Qdrant、Sessions和Facts四个来源拉取信息,每个来源都有相关性阈值门控,并执行去重和过滤。在post_llm_call和on_session_end阶段,系统自动提取新知识。

Memory OS定位为本地优先方案,与mem0、Zep、Letta等云记忆服务形成对比。它需要Docker、Qdrant、Redis和Python 3.11+环境,但LLM调用仍可自由选择OpenRouter、OpenAI、Anthropic或Ollama等提供商。

中文圈视角

对于中文开发者,Memory OS的开源和本地优先特性意味着数据隐私可控,尤其适合有数据驻留要求的团队。国内类似项目如ModelScope上的Agent框架通常记忆功能较弱,Memory OS的6层架构提供了更系统的参考。

不过,部署门槛较高:需要Docker、Qdrant、Redis等组件,对国内用户可能增加学习成本。此外,Hermes Agent本身在国内知名度不高,中文社区更熟悉LangChain、AutoGPT等。Memory OS的Fabric层基于Icarus Plugin且不兼容上游,长期维护需关注。

一个潜在盲点:中文场景下,记忆系统对中文语义的理解能力至关重要。Memory OS的向量模型和BM25搜索对中文支持如何?目前未见相关评测。若想用于中文写作或编程辅助,可能需要额外配置中文embedding模型。

几条值得记住的细节

  • 6层记忆架构:Workspace、Sessions、Structured Facts、Fabric、Vector DB、LLM Wiki。
  • 检索使用四源门控召回,并带有会话内去重和社交过滤。
  • 向量数据库使用Qdrant,支持4096维余弦向量和BM25稀疏搜索。
  • 每周运行衰减扫描,语义相似度超过0.92的记忆会被合并。
  • 完全本地运行,无云记忆订阅费用,但LLM调用仍需第三方API。

一句话总结

Memory OS为Hermes Agent提供了可落地的分层记忆方案,本地优先的设计适合注重数据隐私的开发者,但部署复杂度和中文支持仍需验证。