上下文管理 - 语义记忆

基于向量的记忆模式，其中文本被分块、嵌入并存储在向量数据库中。查询时，问题被嵌入，运行向量搜索，重新排序候选，并将顶部结果注入提示。智能体感觉像记住一切而不会产生幻觉的地方。

完整 FlowZap 代码

将以下 FlowZap 代码复制并粘贴到您的 FlowZap 账户的项目中，即可查看此模板图。

User {
  n1: circle label="Ask question"
  n2: rectangle label="See answer with references"
  n1.handle(right) -> Agent.n3.handle(left)
  Agent.n12.handle(right) -> n2.handle(left)
}

Agent {
  n3: rectangle label="Receive query"
  n4: rectangle label="Build memory search query"
  n5: rectangle label="Send to retriever"
  n6: rectangle label="Inject recalled memories"
  n7: rectangle label="Assemble final prompt"
  n8: rectangle label="Call LLM"
  n12: rectangle label="Return answer"
  n3.handle(right) -> n4.handle(left)
  n4.handle(right) -> n5.handle(left)
  n5.handle(bottom) -> Retriever.n9.handle(top) [label="Semantic query"]
  n6.handle(right) -> n7.handle(left)
  n7.handle(right) -> n8.handle(left)
  n8.handle(right) -> LLM.n13.handle(left)
}

Retriever {
  n9: rectangle label="Embed query"
  n10: rectangle label="Search vector store"
  n11: rectangle label="Rerank top memories"
  n9.handle(right) -> n10.handle(left)
  n10.handle(right) -> n11.handle(left)
  n11.handle(top) -> Agent.n6.handle(bottom) [label="Top memories"]
}

VectorDB {
  n13: rectangle label="Vector index"
  Retriever.n10.handle(bottom) -> n13.handle(top) [label="Similarity search"]
}

LLM {
  n14: rectangle label="Answer using recalled facts"
  n14.handle(right) -> Agent.n12.handle(left)
}

相关模板

上下文管理 - 会话记忆

短期上下文模式，其中通道发送新消息加近期历史。智能体运行时将其与本地会话状态合并，组装提示，并将响应持久化回历史。简单，但成本和延迟随历史长度增长。

查看模板

上下文管理 - 滚动摘要记忆

压缩历史模式，先保留完整历史一段时间，当达到阈值时，总结最后一块并用较短的摘要消息替换详细回合。在长期对话中显著减少提示大小，同时保持要点连续性。

查看模板

上下文管理 - 档案记忆

身份风格记忆模式，其中档案数据在会话开始时加载。每个提示结合系统角色、用户档案和当前消息。新事实可以写回档案记忆。开销小且可预测，但UX提升大——智能体记住你的名字、技术栈、语气和约束。

查看模板

上下文管理 - 情景记忆

从经验中学习模式，其中每次任务运行成为一个情景，包含输入、动作和结果。在处理新任务之前，智能体获取类似情景并将其用作提示。随着时间的推移，智能体感觉像在学习和成长，而不是重复相同的失败计划。

查看模板

上下文管理 - 混合检索记忆

多模态检索模式，结合语义搜索、精确/关键词搜索和近期搜索并行运行。结果合并并重新排序为单一上下文集。召回率高得多，因为智能体可以找到模糊引用和精确实体。对于全面的知识检索至关重要。

查看模板

上下文管理 - 共享记忆

多智能体协调模式，其中编排器将工作分解为子任务，专业智能体从共享状态存储中拉取和推送，编排器从该共享状态组合最终答案。多智能体设置感觉连贯，而不是每个助手都有自己的不一致记忆。

查看模板

返回所有模板