MCP上下文代理架构
DevOps
位于智能体和MCP服务器之间的缓存和压缩层,在冗余上下文请求到达网络之前拦截它们。使用基于TTL的缓存失效、Brotli压缩和语义缓存。可实现高达95%以上的token减少,并显著降低LLM账单。
完整 FlowZap 代码
Host { # Host Application
n1: circle label="User sends prompt"
n2: rectangle label="Agent requests context"
n3: rectangle label="Receive context"
n4: rectangle label="Agent responds to user"
n1.handle(right) -> n2.handle(left)
n2.handle(bottom) -> Proxy.n5.handle(top) [label="Context request"]
n3.handle(right) -> n4.handle(left)
}
Proxy { # Context Proxy
n5: rectangle label="Receive context request"
n6: rectangle label="Check cache with TTL"
n7: diamond label="Cache hit?"
n8: rectangle label="Return cached context"
n9: rectangle label="Fetch fresh from MCP server"
n10: rectangle label="Compress and cache response"
n5.handle(right) -> n6.handle(left)
n6.handle(right) -> n7.handle(left)
n7.handle(right) -> n8.handle(left) [label="Hit"]
n7.handle(bottom) -> n9.handle(top) [label="Miss"]
n8.handle(top) -> Host.n3.handle(bottom) [label="Cached context"]
n9.handle(bottom) -> MCPServer.n11.handle(top) [label="Fetch request"]
n10.handle(top) -> Host.n3.handle(left) [label="Fresh context"]
}
MCPServer { # MCP Server
n11: rectangle label="Fetch full context"
n12: rectangle label="Return fresh data"
n11.handle(right) -> n12.handle(left)
n12.handle(top) -> Proxy.n10.handle(bottom) [label="Fresh data"]
}
相关模板
MCP智能体网格架构
DevOps
多智能体网格模式,其中智能体通过MCP支持的共享上下文代理进行通信。实现多个专业智能体(规划者、编码者、审查者、操作者)之间的协调工具访问和状态同步。支持编排和编排的交互模式。
AI原生单智能体架构
Architecture
单智能体AI架构,其中一个智能体处理所有事务:解析请求、推理、通过MCP调用工具、生成响应。这是原型和简单自动化的默认架构——易于调试,但很快达到上下文窗口限制且难以并行化。适合快速交付的MVP和独立开发者。