DevOps
Un pattern de routage qui place un routeur sémantique devant les outils MCP pour que le LLM ne voie que le sous-ensemble dont il a besoin. Utilise des embeddings vectoriels et la similarité cosinus pour matcher l'intention utilisateur aux outils dynamiquement. Réduction jusqu'à 96% des tokens d'entrée avec les grands catalogues d'outils.
Code FlowZap complet
Host {
n1: circle label="User sends prompt"
n2: rectangle label="Agent extracts intent"
n3: rectangle label="Send intent to router"
n4: rectangle label="Receive routed result"
n5: rectangle label="Agent responds to user"
n1.handle(right) -> n2.handle(left)
n2.handle(right) -> n3.handle(left)
n3.handle(bottom) -> Router.n6.handle(top) [label="Intent + tool request"]
n4.handle(right) -> n5.handle(left)
}
Router {
n6: rectangle label="Receive intent"
n7: rectangle label="Semantic match via embeddings"
n8: diamond label="Which MCP server?"
n9: rectangle label="Forward to Server A"
n10: rectangle label="Forward to Server B"
n11: rectangle label="Normalize and return result"
n6.handle(right) -> n7.handle(left)
n7.handle(right) -> n8.handle(left)
n8.handle(bottom) -> n9.handle(top) [label="Route A"]
n8.handle(right) -> n10.handle(left) [label="Route B"]
n9.handle(bottom) -> ServerA.n12.handle(top) [label="Call Server A"]
n10.handle(bottom) -> ServerB.n14.handle(top) [label="Call Server B"]
n11.handle(top) -> Host.n4.handle(bottom) [label="Final result"]
}
ServerA {
n12: rectangle label="Execute tool A"
n13: rectangle label="Return A result"
n12.handle(right) -> n13.handle(left)
n13.handle(top) -> Router.n11.handle(bottom) [label="Result A"]
}
ServerB {
n14: rectangle label="Execute tool B"
n15: rectangle label="Return B result"
n14.handle(right) -> n15.handle(left)
n15.handle(top) -> Router.n11.handle(left) [label="Result B"]
}
Modèles associés
DevOps
Une couche de mise en cache et compression située entre les agents et les serveurs MCP, interceptant les requêtes de contexte redondantes avant qu'elles n'atteignent le réseau. Utilise l'invalidation de cache basée sur TTL, compression Brotli, et cache sémantique. Réduction jusqu'à 95%+ des tokens et factures LLM significativement réduites.
DevOps
Le pattern MCP le plus simple — connexion directe entre application hôte et serveur MCP via stdio ou HTTP. Pas de sauts supplémentaires, latence minimale, débogage facile. Parfait pour les MVP, hackathons, et configurations mono-équipe où la gouvernance sécurité n'est pas encore une préoccupation.
DevOps
Un pattern de passerelle API situé entre les agents et les serveurs MCP pour gérer l'authentification, les limites de taux et l'audit. La passerelle applique OAuth 2.0, SAML, SSO, limitation de taux au niveau outil, et quotas par équipe. Essentiel pour les déploiements MCP multi-équipes ou multi-locataires.
DevOps
Un pattern maillage multi-agents où les agents communiquent via un broker de contexte partagé soutenu par MCP. Permet l'accès coordonné aux outils et la synchronisation d'état à travers plusieurs agents spécialisés (planificateur, codeur, réviseur, opérateur). Supporte les patterns d'interaction orchestrés et chorégraphiés.
DevOps
Un pattern de résilience qui enveloppe les appels MCP avec des barrières conscientes de la santé utilisant trois états : Fermé (normal), Ouvert (échecs détectés, échec rapide), et Semi-Ouvert (test de récupération). Prévient les échecs en cascade quand les outils deviennent non réactifs. Essentiel pour la fiabilité de niveau production.
Architecture
Une architecture IA agentique à agent unique où un seul agent gère tout : analyser les requêtes, raisonner, appeler les outils via MCP, et générer les réponses. C'est l'architecture par défaut pour les prototypes et automatisations simples—facile à déboguer mais atteint rapidement les limites de fenêtre de contexte et est difficile à paralléliser. Idéale pour les MVPs et les développeurs solo qui livrent vite.