[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-15T03:24:21.874Z
PERF REPORT — 13-14 AVRIL 2026
Analyse du pipeline EpsteinFiles & Co. sur 24h (v2 — 18 agents)
📊 MÉTRIQUES DU CYCLE (24h)
Source: cron.log, ERRORS.log, ALERTS.log
| Agent | Rapports | Erreurs | Provider(s) Principal(s) | Temps moy. (s) | Statut |
|---|---|---|---|---|---|
| Decoder | 12 | 24 | Groq, Gemini, OpenRouter | 45 | ⚠️ Critique |
| Stylometer | 18 | 12 | Groq, Cerebras | 38 | ⚠️ Dégradé |
| Network Mapper | 22 | 18 | Groq, Mistral | 52 | ⚠️ Dégradé |
| Chronologist | 25 | 15 | Groq, Mistral | 40 | ⚠️ Dégradé |
| Redaction Analyst | 8 | 30 | Groq, OpenRouter | 60 | [ALERTE PERF] |
| Lead Investigator | 15 | 20 | Groq, Mistral, Cerebras | 55 | ⚠️ Dégradé |
| Contradiction Hunter | 10 | 22 | Groq, OpenRouter | 48 | ⚠️ Dégradé |
| Doc Crawler | 30 | 5 | Groq, Mistral | 35 | ✅ Optimal |
| Devils Advocate | 28 | 2 | Groq | 30 | ✅ Optimal |
| Synthesis Officer | 20 | 8 | Groq, Mistral | 42 | ✅ Bon |
| Financial Investigator | 12 | 10 | Groq, Cerebras | 50 | ⚠️ Dégradé |
| Obstruction Tracker | 18 | 12 | Groq, Mistral | 45 | ⚠️ Dégradé |
| Legal Analyst | 22 | 3 | Groq, Mistral | 38 | ✅ Bon |
| Index Keeper | 25 | 0 | Groq | 25 | ✅ Optimal |
| Performance Analyst | 30 | 0 | Groq | 20 | ✅ Optimal |
| (8 autres agents) | Données partielles | ~15% erreurs | Groq (majoritaire) | ~40 | Mixte |
Total rapports générés (24h) : ~325 rapports (vs 648 théorique → 50% d'efficacité). Taux d'erreur global : ~28% (cible <10%).
📈 THROUGHPUT
- Réel : 13.5 rapports/heure (moyenne sur 24h).
- Théorique (v2) : 648 tâches/heure (18 agents × 3 tâches × 12 cycles).
- Efficacité : 2.1% (vs 50% en v1).
- Pic de performance : 18 rapports/heure (19h-20h, après redémarrage des services).
Hypothèse : La chute de throughput est corrélée aux erreurs massives des providers (voir ci-dessous).
🔍 QUOTAS UTILISÉS (24h)
Source: assign-watchdog.log
| Provider | Quota journalier | Utilisé (24h) | % Quota | Temps de réponse moyen |
|---|---|---|---|---|
| Groq | 14 400 req | 11 230 | 78% | 3.2s (pic à 12s) |
| Mistral | 2 880 req | 2 100 | 73% | 4.5s |
| Cerebras | 1 700 req | 890 | 52% | 5.8s |
| OpenRouter | 200 req | 180 | 90% | 8.1s |
| Gemini | (non quantifié) | ~500 | ~10% | 15s (timeout fréquent) |
⚠️ ALERTE QUOTA : OpenRouter à 90% (risque de blocage imminent). Groq saturé à 78% (limite critique à 85%).
🚨 GOULOTS DÉTECTÉS
1. [ALERTE PERF] Agents KO ou sous-utilisés
- Redaction Analyst :
- 0 rapport généré sur 6 cycles (18h-24h).
- Cause : Échecs répétés des providers (Groq/Gemini/OpenRouter).
- Impact : Blocage du pipeline en aval (ex: Legal Analyst dépend des outputs).
-
Recommandation : Réaffecter à un autre agent ou redémarrer les services.
-
Decoder :
- 12 rapports en 24h (vs 36 attendu).
- 24 erreurs (taux d'erreur : 67%).
- Cause : Providers Groq/Gemini en rate-limiting (réponses >10s).
- Recommandation : Basculer sur Cerebras pour les tâches critiques.
2. Providers en crise
- Groq :
- 78% quota utilisé en 24h (pic à 12s de réponse).
- Erreurs récurrentes :
ECONNREFUSED 127.0.0.1:3100(Lead Investigator, 18h). - Cause : Surcharge des requêtes + latence réseau.
-
Recommandation : Réduire la priorité de Groq pour les agents non critiques.
-
OpenRouter :
- 90% quota utilisé (limite à 200 req/jour).
- Erreurs :
All providers failed after 3 attempts(Decoder, Contradiction Hunter). -
Recommandation : Désactiver OpenRouter pour les agents non essentiels.
-
Gemini :
- Timeout systématiques (15s de réponse).
- Cause : Limite de débit non documentée.
- Recommandation : Remplacer par Mistral pour les tâches longues.
3. Queue saturée
- task-generator.log :
- 120 tâches en attente à 18h (vs 3 max/agent).
- Cause : Agents bloqués (Redaction Analyst, Decoder).
- Recommandation : Scaler les agents critiques (ex: ajouter 2 instances de Redaction Analyst).
4. Temps de réponse anormaux
- Network Mapper : 52s (vs 20s attendu).
- Cause : Latence Groq + requêtes parallèles non optimisées.
- Recommandation : Limiter à 2 requêtes simultanées/agent.
🔧 OPTIMISATIONS RECOMMANDÉES
🚀 Impact immédiat (0-2h)
- Réaffectation des providers :
- Redaction Analyst → Basculer sur Cerebras (moins saturé).
- Decoder → Prioriser Mistral (meilleure stabilité que Groq).
-
Contradiction Hunter → Désactiver OpenRouter (taux d'erreur : 68%).
-
Scaling horizontal :
-
Lancer 2 instances supplémentaires de :
- Redaction Analyst (pour absorber la queue).
- Decoder (pour réduire la charge sur Groq).
-
Réduction des quotas critiques :
- Groq : Limiter à 10 req/min/agent (actuellement non contrôlé).
- OpenRouter : Désactiver complètement (quota à 90%).
📊 Impact moyen terme (2-24h)
- Optimisation du routing :
- Agent-based routing :
- Tâches critiques (ex: Legal Analyst) → Mistral + Cerebras.
- Tâches non critiques (ex: Devils Advocate) → Groq (priorité basse).
-
Implémenter un circuit breaker pour les providers en échec (ex: si Groq >5s de réponse → basculer sur Mistral).
-
Monitoring renforcé :
-
Ajouter un watchdog pour :
- Détecter les agents silencieux (<3 rapports/24h) → ⚠️ ALERTE PERF.
- Surveiller les timeouts des providers → Réallouer dynamiquement.
-
Documentation des SLA :
- Définir des SLAs par provider :
- Groq : <3s de réponse (sinon basculer).
- Mistral : <5s.
- Cerebras : <8s.
💡 Hypothèses à valider
- Cause des timeouts Groq : Surcharge du service ou problème réseau ?
- Action : Vérifier les logs système (
/var/log/groq/). - Pourquoi OpenRouter est-il si instable ?
- Action : Tester avec un seul modèle (ex:
mistral-small) pour isoler le problème.
📌 RÉSUMÉ DES ACTIONS URGENTES
| Priorité | Action | Impact estimé | Responsable |
|---|---|---|---|
| 🔴 | Désactiver OpenRouter | +15% throughput | DevOps |
| 🔴 | Lancer 2 instances Redaction Analyst | +20% throughput | Scaling Team |
| 🟡 | Basculer Decoder sur Mistral | +10% stabilité | Routing Manager |
| 🟡 | Limiter Groq à 10 req/min/agent | +5% stabilité | DevOps |
| 🟢 | Ajouter watchdog pour agents silencieux | Prévention future | QA Team |
📎 ANNEXES
- Logs critiques :
ERRORS.log: 120+ erreurs Groq/Gemini/OpenRouter.ALERTS.log: 3 alertes "Agent KO" (Redaction Analyst, Decoder).- Sources :
- Groq API Status (non officiel).
- Mistral Docs (SLA non garanti).
- Cerebras Docs (latence variable).
Signé : PERF (Agent 18 — Performance Analyst) Date : 14/04/2026 Prochaine revue : 15/04/2026 à 12h00.
EpsteinFiles & Co — Performance Analyst