Bienvenue sur FlowZap, l'application pour créer des diagrammes avec Rapidité, Clarté et Contrôle.

Architecture MCP Routeur d'Outils

DevOps

Un pattern de routage qui place un routeur sémantique devant les outils MCP pour que le LLM ne voie que le sous-ensemble dont il a besoin. Utilise des embeddings vectoriels et la similarité cosinus pour matcher l'intention utilisateur aux outils dynamiquement. Réduction jusqu'à 96% des tokens d'entrée avec les grands catalogues d'outils.

Code FlowZap complet

Host {
  n1: circle label="User sends prompt"
  n2: rectangle label="Agent extracts intent"
  n3: rectangle label="Send intent to router"
  n4: rectangle label="Receive routed result"
  n5: rectangle label="Agent responds to user"
  n1.handle(right) -> n2.handle(left)
  n2.handle(right) -> n3.handle(left)
  n3.handle(bottom) -> Router.n6.handle(top) [label="Intent + tool request"]
  n4.handle(right) -> n5.handle(left)
}

Router {
  n6: rectangle label="Receive intent"
  n7: rectangle label="Semantic match via embeddings"
  n8: diamond label="Which MCP server?"
  n9: rectangle label="Forward to Server A"
  n10: rectangle label="Forward to Server B"
  n11: rectangle label="Normalize and return result"
  n6.handle(right) -> n7.handle(left)
  n7.handle(right) -> n8.handle(left)
  n8.handle(bottom) -> n9.handle(top) [label="Route A"]
  n8.handle(right) -> n10.handle(left) [label="Route B"]
  n9.handle(bottom) -> ServerA.n12.handle(top) [label="Call Server A"]
  n10.handle(bottom) -> ServerB.n14.handle(top) [label="Call Server B"]
  n11.handle(top) -> Host.n4.handle(bottom) [label="Final result"]
}

ServerA {
  n12: rectangle label="Execute tool A"
  n13: rectangle label="Return A result"
  n12.handle(right) -> n13.handle(left)
  n13.handle(top) -> Router.n11.handle(bottom) [label="Result A"]
}

ServerB {
  n14: rectangle label="Execute tool B"
  n15: rectangle label="Return B result"
  n14.handle(right) -> n15.handle(left)
  n15.handle(top) -> Router.n11.handle(left) [label="Result B"]
}

Modèles associés

Architecture MCP Proxy de Contexte

DevOps

Une couche de mise en cache et compression située entre les agents et les serveurs MCP, interceptant les requêtes de contexte redondantes avant qu'elles n'atteignent le réseau. Utilise l'invalidation de cache basée sur TTL, compression Brotli, et cache sémantique. Réduction jusqu'à 95%+ des tokens et factures LLM significativement réduites.

Architecture MCP Connexion Directe

DevOps

Le pattern MCP le plus simple — connexion directe entre application hôte et serveur MCP via stdio ou HTTP. Pas de sauts supplémentaires, latence minimale, débogage facile. Parfait pour les MVP, hackathons, et configurations mono-équipe où la gouvernance sécurité n'est pas encore une préoccupation.

Architecture MCP Proxy Passerelle

DevOps

Un pattern de passerelle API situé entre les agents et les serveurs MCP pour gérer l'authentification, les limites de taux et l'audit. La passerelle applique OAuth 2.0, SAML, SSO, limitation de taux au niveau outil, et quotas par équipe. Essentiel pour les déploiements MCP multi-équipes ou multi-locataires.

Architecture MCP Maillage d'Agents

DevOps

Un pattern maillage multi-agents où les agents communiquent via un broker de contexte partagé soutenu par MCP. Permet l'accès coordonné aux outils et la synchronisation d'état à travers plusieurs agents spécialisés (planificateur, codeur, réviseur, opérateur). Supporte les patterns d'interaction orchestrés et chorégraphiés.

Architecture MCP Disjoncteur

DevOps

Un pattern de résilience qui enveloppe les appels MCP avec des barrières conscientes de la santé utilisant trois états : Fermé (normal), Ouvert (échecs détectés, échec rapide), et Semi-Ouvert (test de récupération). Prévient les échecs en cascade quand les outils deviennent non réactifs. Essentiel pour la fiabilité de niveau production.

Architecture IA-Native Agent Unique

Architecture

Une architecture IA agentique à agent unique où un seul agent gère tout : analyser les requêtes, raisonner, appeler les outils via MCP, et générer les réponses. C'est l'architecture par défaut pour les prototypes et automatisations simples—facile à déboguer mais atteint rapidement les limites de fenêtre de contexte et est difficile à paralléliser. Idéale pour les MVPs et les développeurs solo qui livrent vite.

Retour à tous les modèles