DevOps
Un pattern de passerelle API situé entre les agents et les serveurs MCP pour gérer l'authentification, les limites de taux et l'audit. La passerelle applique OAuth 2.0, SAML, SSO, limitation de taux au niveau outil, et quotas par équipe. Essentiel pour les déploiements MCP multi-équipes ou multi-locataires.
Code FlowZap complet
Host { # Host Application
n1: circle label="User sends prompt"
n2: rectangle label="Agent builds tool call"
n3: rectangle label="Send request to gateway"
n4: rectangle label="Receive gateway response"
n5: rectangle label="Agent responds to user"
n1.handle(right) -> n2.handle(left)
n2.handle(right) -> n3.handle(left)
n3.handle(bottom) -> Gateway.n6.handle(top) [label="Tool request"]
n4.handle(right) -> n5.handle(left)
}
Gateway { # MCP Gateway
n6: rectangle label="Receive and log request"
n7: diamond label="Authorized?"
n8: rectangle label="Forward to MCP server"
n9: rectangle label="Receive MCP response"
n10: rectangle label="Log response and return"
n6.handle(right) -> n7.handle(left)
n7.handle(right) -> n8.handle(left) [label="Yes"]
n7.handle(top) -> Host.n4.handle(left) [label="401 Unauthorized"]
n8.handle(bottom) -> MCPServer.n11.handle(top) [label="Forwarded request"]
n9.handle(right) -> n10.handle(left)
n10.handle(top) -> Host.n4.handle(bottom) [label="Authorized response"]
}
MCPServer { # MCP Server
n11: rectangle label="Execute tool"
n12: rectangle label="Return result"
n11.handle(right) -> n12.handle(left)
n12.handle(top) -> Gateway.n9.handle(bottom) [label="Tool result"]
}
Modèles associés
DevOps
Le pattern MCP le plus simple — connexion directe entre application hôte et serveur MCP via stdio ou HTTP. Pas de sauts supplémentaires, latence minimale, débogage facile. Parfait pour les MVP, hackathons, et configurations mono-équipe où la gouvernance sécurité n'est pas encore une préoccupation.
DevOps
Un pattern de routage qui place un routeur sémantique devant les outils MCP pour que le LLM ne voie que le sous-ensemble dont il a besoin. Utilise des embeddings vectoriels et la similarité cosinus pour matcher l'intention utilisateur aux outils dynamiquement. Réduction jusqu'à 96% des tokens d'entrée avec les grands catalogues d'outils.
DevOps
Un pattern maillage multi-agents où les agents communiquent via un broker de contexte partagé soutenu par MCP. Permet l'accès coordonné aux outils et la synchronisation d'état à travers plusieurs agents spécialisés (planificateur, codeur, réviseur, opérateur). Supporte les patterns d'interaction orchestrés et chorégraphiés.
DevOps
Un pattern de résilience qui enveloppe les appels MCP avec des barrières conscientes de la santé utilisant trois états : Fermé (normal), Ouvert (échecs détectés, échec rapide), et Semi-Ouvert (test de récupération). Prévient les échecs en cascade quand les outils deviennent non réactifs. Essentiel pour la fiabilité de niveau production.
DevOps
Une couche de mise en cache et compression située entre les agents et les serveurs MCP, interceptant les requêtes de contexte redondantes avant qu'elles n'atteignent le réseau. Utilise l'invalidation de cache basée sur TTL, compression Brotli, et cache sémantique. Réduction jusqu'à 95%+ des tokens et factures LLM significativement réduites.
Architecture
Diagramme d'architecture de passerelle API pour microservices montrant le routage des requêtes, l'authentification JWT, la limitation de débit, la découverte de services et l'agrégation des réponses à travers des services backend distribués. Ce modèle représente le point d'entrée de tout le trafic client dans un écosystème de microservices, appliquant les politiques de sécurité avant que les requêtes n'atteignent les services internes. Idéal pour les ingénieurs plateforme concevant une infrastructure API évolutive avec des préoccupations transversales centralisées.