上下文管理 - 语义记忆
Architecture
基于向量的记忆模式,其中文本被分块、嵌入并存储在向量数据库中。查询时,问题被嵌入,运行向量搜索,重新排序候选,并将顶部结果注入提示。智能体感觉像记住一切而不会产生幻觉的地方。
完整 FlowZap 代码
User {
n1: circle label="Ask question"
n2: rectangle label="See answer with references"
n1.handle(right) -> Agent.n3.handle(left)
Agent.n12.handle(right) -> n2.handle(left)
}
Agent {
n3: rectangle label="Receive query"
n4: rectangle label="Build memory search query"
n5: rectangle label="Send to retriever"
n6: rectangle label="Inject recalled memories"
n7: rectangle label="Assemble final prompt"
n8: rectangle label="Call LLM"
n12: rectangle label="Return answer"
n3.handle(right) -> n4.handle(left)
n4.handle(right) -> n5.handle(left)
n5.handle(bottom) -> Retriever.n9.handle(top) [label="Semantic query"]
n6.handle(right) -> n7.handle(left)
n7.handle(right) -> n8.handle(left)
n8.handle(right) -> LLM.n13.handle(left)
}
Retriever {
n9: rectangle label="Embed query"
n10: rectangle label="Search vector store"
n11: rectangle label="Rerank top memories"
n9.handle(right) -> n10.handle(left)
n10.handle(right) -> n11.handle(left)
n11.handle(top) -> Agent.n6.handle(bottom) [label="Top memories"]
}
VectorDB {
n13: rectangle label="Vector index"
Retriever.n10.handle(bottom) -> n13.handle(top) [label="Similarity search"]
}
LLM {
n14: rectangle label="Answer using recalled facts"
n14.handle(right) -> Agent.n12.handle(left)
}
相关模板
上下文管理 - 档案记忆
Architecture
身份风格记忆模式,其中档案数据在会话开始时加载。每个提示结合系统角色、用户档案和当前消息。新事实可以写回档案记忆。开销小且可预测,但UX提升大——智能体记住你的名字、技术栈、语气和约束。
上下文管理 - 情景记忆
Architecture
从经验中学习模式,其中每次任务运行成为一个情景,包含输入、动作和结果。在处理新任务之前,智能体获取类似情景并将其用作提示。随着时间的推移,智能体感觉像在学习和成长,而不是重复相同的失败计划。
上下文管理 - 混合检索记忆
Architecture
多模态检索模式,结合语义搜索、精确/关键词搜索和近期搜索并行运行。结果合并并重新排序为单一上下文集。召回率高得多,因为智能体可以找到模糊引用和精确实体。对于全面的知识检索至关重要。
上下文管理 - 共享记忆
Architecture
多智能体协调模式,其中编排器将工作分解为子任务,专业智能体从共享状态存储中拉取和推送,编排器从该共享状态组合最终答案。多智能体设置感觉连贯,而不是每个助手都有自己的不一致记忆。