DevOps
Une couche de mise en cache et compression située entre les agents et les serveurs MCP, interceptant les requêtes de contexte redondantes avant qu'elles n'atteignent le réseau. Utilise l'invalidation de cache basée sur TTL, compression Brotli, et cache sémantique. Réduction jusqu'à 95%+ des tokens et factures LLM significativement réduites.
Code FlowZap complet
Host { # Host Application
n1: circle label="User sends prompt"
n2: rectangle label="Agent requests context"
n3: rectangle label="Receive context"
n4: rectangle label="Agent responds to user"
n1.handle(right) -> n2.handle(left)
n2.handle(bottom) -> Proxy.n5.handle(top) [label="Context request"]
n3.handle(right) -> n4.handle(left)
}
Proxy { # Context Proxy
n5: rectangle label="Receive context request"
n6: rectangle label="Check cache with TTL"
n7: diamond label="Cache hit?"
n8: rectangle label="Return cached context"
n9: rectangle label="Fetch fresh from MCP server"
n10: rectangle label="Compress and cache response"
n5.handle(right) -> n6.handle(left)
n6.handle(right) -> n7.handle(left)
n7.handle(right) -> n8.handle(left) [label="Hit"]
n7.handle(bottom) -> n9.handle(top) [label="Miss"]
n8.handle(top) -> Host.n3.handle(bottom) [label="Cached context"]
n9.handle(bottom) -> MCPServer.n11.handle(top) [label="Fetch request"]
n10.handle(top) -> Host.n3.handle(left) [label="Fresh context"]
}
MCPServer { # MCP Server
n11: rectangle label="Fetch full context"
n12: rectangle label="Return fresh data"
n11.handle(right) -> n12.handle(left)
n12.handle(top) -> Proxy.n10.handle(bottom) [label="Fresh data"]
}
Modèles associés
DevOps
Un pattern de routage qui place un routeur sémantique devant les outils MCP pour que le LLM ne voie que le sous-ensemble dont il a besoin. Utilise des embeddings vectoriels et la similarité cosinus pour matcher l'intention utilisateur aux outils dynamiquement. Réduction jusqu'à 96% des tokens d'entrée avec les grands catalogues d'outils.
DevOps
Le pattern MCP le plus simple — connexion directe entre application hôte et serveur MCP via stdio ou HTTP. Pas de sauts supplémentaires, latence minimale, débogage facile. Parfait pour les MVP, hackathons, et configurations mono-équipe où la gouvernance sécurité n'est pas encore une préoccupation.
DevOps
Un pattern de passerelle API situé entre les agents et les serveurs MCP pour gérer l'authentification, les limites de taux et l'audit. La passerelle applique OAuth 2.0, SAML, SSO, limitation de taux au niveau outil, et quotas par équipe. Essentiel pour les déploiements MCP multi-équipes ou multi-locataires.
DevOps
Un pattern maillage multi-agents où les agents communiquent via un broker de contexte partagé soutenu par MCP. Permet l'accès coordonné aux outils et la synchronisation d'état à travers plusieurs agents spécialisés (planificateur, codeur, réviseur, opérateur). Supporte les patterns d'interaction orchestrés et chorégraphiés.
DevOps
Un pattern de résilience qui enveloppe les appels MCP avec des barrières conscientes de la santé utilisant trois états : Fermé (normal), Ouvert (échecs détectés, échec rapide), et Semi-Ouvert (test de récupération). Prévient les échecs en cascade quand les outils deviennent non réactifs. Essentiel pour la fiabilité de niveau production.
Architecture
Une architecture IA agentique à agent unique où un seul agent gère tout : analyser les requêtes, raisonner, appeler les outils via MCP, et générer les réponses. C'est l'architecture par défaut pour les prototypes et automatisations simples—facile à déboguer mais atteint rapidement les limites de fenêtre de contexte et est difficile à paralléliser. Idéale pour les MVPs et les développeurs solo qui livrent vite.