问题——“会思考”之后,如何“记得住” 近两年,大模型规模、多模态、推理与算力效率各上快速迭代,推动智能问答、办公协同、代码生成等场景加速普及。但真实应用中,一个长期困扰开发者的瓶颈愈发明显:模型高度依赖上下文,一旦会话结束或超出窗口长度,前序信息很难持续生效。对企业而言,这意味着客户偏好、业务规则、历史决策与跨周期任务往往需要反复输入与核对;对智能体而言,则容易出现目标漂移、执行中断、解释不可追溯等情况,难以形成稳定的“连续自我”。 原因——行业长期聚焦“更强的脑”,忽视“更好的记忆” 业内普遍认为,此瓶颈主要来自三上:其一,长期以来技术竞争更集中模型能力上,因为投入产出更容易量化对比;而记忆更偏系统工程,评估体系与工程落地门槛更高。其二,检索增强生成等方案虽能在一定程度上“查资料”,但更像外部检索与临时拼接,缺少对经验的结构化沉淀和持续演化机制。其三,超长上下文通常带来更高推理成本与延迟,在端侧或企业私有化部署等场景很难同时兼顾效果与成本。 鉴于此,盛大集团全资孵化的EverMind团队近日对外系统性展示人工智能记忆操作系统EverMemOS。团队联合创始人邓亚峰表示,如果每次会话结束后理解都被“清零”,智能体就难以承担跨时间跨度的复杂任务;长期记忆能力将直接影响智能体能否从“工具”走向“长期协作伙伴”。这一方向也被外界视为企业对底层技术长期投入的一次集中体现。 影响——从“单次对话”走向“长期任务”的产业拐点正在形成 随着智能体在客服、营销、运维、研发管理等领域加速落地,行业对“可持续记忆”的需求正从加分项变为刚需。一上,长期记忆有助于将用户偏好、业务流程、合规边界等沉淀为可追溯结构,减少重复沟通与人工校验;另一方面,它能支撑跨周、跨月的长链路任务,让智能体对阶段性目标、关键决策和异常处理形成连续记录,从而提升可靠性与可控性。 同时,记忆系统的成熟也可能带来新的产业分工:模型负责通用推理能力,记忆与工具调用等基础设施承接行业知识与个体经验,形成“通用能力+行业沉淀”的组合式创新,降低应用开发门槛,加快规模化复制。 对策——以“记忆生命周期”替代静态存储,兼顾准确率与成本 据EverMind发布的论文介绍,EverMemOS尝试以“自组织记忆”将对话与任务经验转化为可演化结构,构建类似生物认知过程的记忆生命周期机制:一是形成情景痕迹,将对话流拆解为可管理的记忆单元,记录事实、时间边界与前瞻信息;二是进行语义巩固,把记忆单元动态组织为主题化结构,提炼更稳定的语义,并持续更新用户画像;三是通过重建式回忆,在需要推理时检索并组合“必要且充分”的上下文,以较低令牌消耗获得较高准确率。 团队称,该机制意在避免两类常见代价:一类是完全依赖超长上下文带来的算力与时延压力;另一类是单纯依靠外部检索造成的语义断裂与“只检索、不记忆”。在评测层面,EverMind表示其系统在LoCoMo基准上取得93.05%的准确率,并在多跳推理与时序任务等细分项上提升明显;对应的结果也被团队用于回应“记忆基础设施是否成立”的核心质疑。 前景——记忆底座或成智能体竞争新赛点,仍需跨越工程与治理门槛 业界人士指出,长期记忆正在从产品功能上升为基础设施能力,未来竞争焦点不止于“能答对多少题”,还包括“能否长期一致、可解释、可审计”。从应用侧看,记忆系统有望在企业知识管理、个性化服务、长期项目协作等场景释放价值;从技术侧看,如何进行记忆压缩与遗忘策略设计、降低噪声与幻觉传播、实现跨模型与跨应用迁移,将决定其可扩展性。 此外,长期记忆也对数据安全与合规提出更高要求:哪些信息应当被记住、保存多久、如何可控删除、如何防止敏感信息被不当调用,都需要在产品设计阶段划清边界,并与行业规范衔接。