欢迎使用 FlowZap,快速、清晰、掌控的绘图应用。

MCP上下文代理架构

DevOps

位于智能体和MCP服务器之间的缓存和压缩层,在冗余上下文请求到达网络之前拦截它们。使用基于TTL的缓存失效、Brotli压缩和语义缓存。可实现高达95%以上的token减少,并显著降低LLM账单。

完整 FlowZap 代码

Host { # Host Application
  n1: circle label="User sends prompt"
  n2: rectangle label="Agent requests context"
  n3: rectangle label="Receive context"
  n4: rectangle label="Agent responds to user"
  n1.handle(right) -> n2.handle(left)
  n2.handle(bottom) -> Proxy.n5.handle(top) [label="Context request"]
  n3.handle(right) -> n4.handle(left)
}

Proxy { # Context Proxy
  n5: rectangle label="Receive context request"
  n6: rectangle label="Check cache with TTL"
  n7: diamond label="Cache hit?"
  n8: rectangle label="Return cached context"
  n9: rectangle label="Fetch fresh from MCP server"
  n10: rectangle label="Compress and cache response"
  n5.handle(right) -> n6.handle(left)
  n6.handle(right) -> n7.handle(left)
  n7.handle(right) -> n8.handle(left) [label="Hit"]
  n7.handle(bottom) -> n9.handle(top) [label="Miss"]
  n8.handle(top) -> Host.n3.handle(bottom) [label="Cached context"]
  n9.handle(bottom) -> MCPServer.n11.handle(top) [label="Fetch request"]
  n10.handle(top) -> Host.n3.handle(left) [label="Fresh context"]
}

MCPServer { # MCP Server
  n11: rectangle label="Fetch full context"
  n12: rectangle label="Return fresh data"
  n11.handle(right) -> n12.handle(left)
  n12.handle(top) -> Proxy.n10.handle(bottom) [label="Fresh data"]
}

相关模板

MCP工具路由架构

DevOps

在MCP工具前放置语义路由器的路由模式,使LLM只看到你需要的子集。使用向量嵌入和余弦相似度动态匹配用户意图到工具。在处理大型工具目录时可减少高达96%的输入token。

MCP直连架构

DevOps

最简单的MCP模式——通过stdio或HTTP在主机应用程序和MCP服务器之间直接连接。没有额外跳转,延迟最低,调试最容易。非常适合MVP、黑客马拉松和单团队设置,其中安全治理还不是关注点。

MCP网关代理架构

DevOps

位于智能体和MCP服务器之间的API网关模式,用于处理认证、速率限制和审计。网关强制执行OAuth 2.0、SAML、SSO、工具级速率限制和基于团队的配额。对于多团队或多租户MCP部署至关重要。

MCP智能体网格架构

DevOps

多智能体网格模式,其中智能体通过MCP支持的共享上下文代理进行通信。实现多个专业智能体(规划者、编码者、审查者、操作者)之间的协调工具访问和状态同步。支持编排和编排的交互模式。

MCP断路器架构

DevOps

弹性模式,使用三种状态包装MCP调用:关闭(正常)、打开(检测到故障,快速失败)和半开(测试恢复)。防止工具无响应时的级联故障。对于生产级可靠性至关重要。

AI原生单智能体架构

Architecture

单智能体AI架构,其中一个智能体处理所有事务:解析请求、推理、通过MCP调用工具、生成响应。这是原型和简单自动化的默认架构——易于调试,但很快达到上下文窗口限制且难以并行化。适合快速交付的MVP和独立开发者。

返回所有模板