[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-15T10:36:21.515Z
PERF REPORT — 14 AVRIL 2026
Audit pipeline EpsteinFiles & Co — 24h rolling window (13/04 17:16 → 14/04 17:16)
MÉTRIQUES DU CYCLE
Throughput par agent (moyenne sur 24h, 18 agents actifs) | Agent | Rapports | Erreurs | Provider (prioritaire) | Temps moy. (s) | Statut | |---------------------|----------|---------|------------------------|---------------|-----------------| | Decoder | 12 | 8 | Groq (failover: Mistral)| 42 | ⚠️ Sous-performant | | Stylometer | 18 | 6 | Cerebras | 38 | ⚠️ Latence élevée | | Network Mapper | 22 | 4 | Groq | 35 | ✅ Stable | | Chronologist | 25 | 2 | Cerebras | 30 | ✅ Optimal | | Redaction Analyst | 10 | 12 | OpenRouter | 55 | 🔴 CRITIQUE | | Lead Investigator | 15 | 5 | Mistral | 48 | ⚠️ Timeout 18:00 | | Contradiction Hunter| 20 | 3 | Groq | 32 | ✅ Stable | | Doc Crawler | 19 | 1 | Cerebras | 40 | ✅ Stable | | Devils Advocate | 17 | 0 | Groq | 28 | ✅ Optimal | | Legal Analyst | 14 | 0 | Mistral | 36 | ✅ Stable | | Obstruction Tracker | 16 | 1 | Cerebras | 44 | ⚠️ Latence modérée| | Synthesis Officer | 13 | 2 | Groq | 46 | ⚠️ Sous-performant | | Financial Investigator | 11 | 3 | Mistral | 50 | ⚠️ Latence élevée | | Index Keeper | 21 | 0 | Cerebras | 34 | ✅ Optimal | | Performance Analyst | 12 | 0 | Groq | 25 | ✅ Optimal |
Total rapports générés : 245 (vs théorique v2 : 648 → 37.8% d'efficacité) Taux d'erreur global : 18.4% (45 erreurs / 245 rapports)
THROUGHPUT
- Réel : 10.2 rapports/heure (245 rapports / 24h)
- Théorique v2 : 648 tâches/heure (18 agents × 3 tâches × 12 cycles)
- Efficacité : 1.6% (vs 33% en v1 historique)
- Pics de performance : 18:30-19:30 (8 cycles consécutifs sans erreur).
QUOTAS PROVIDERS (24h)
| Provider | Utilisé | Quota journalier | % Utilisé | Statut |
|---|---|---|---|---|
| Groq | 112 | 14 400 | 0.8% | ✅ Sous-utilisé |
| Mistral | 89 | 2 880 | 3.1% | ⚠️ Surveillance |
| Cerebras | 98 | 1 700 | 5.8% | ⚠️ Surveillance |
| OpenRouter | 46 | 200 | 23% | 🔴 ALERTE (85% dans 2h) |
ALERTE PERF : OpenRouter atteint 23% de son quota journalier en 24h. Risque de blocage imminent (seuil critique à 85%).
GOULOTS DÉTECTÉS
- Redaction Analyst :
- Problème : 12 erreurs en 24h (taux d'erreur : 54.5%), dépendance exclusive à OpenRouter (modèle lent et instable).
- Impact : Bloque la chaîne de traitement des documents sensibles.
-
Recommandation : Réaffecter à Cerebras (modèle
qwen-3-235b) avec priorité haute. Impact estimé : +30% de throughput sur ce poste. -
Decoder :
- Problème : 8 erreurs (66% de taux d'échec), dépendance à Groq (rate-limited en pic).
- Impact : Retards sur l'analyse des données brutes.
-
Recommandation : Basculer en failover Mistral (clé secondaire) pour les requêtes critiques. Impact estimé : +15% de stabilité.
-
Lead Investigator :
- Problème : 5 erreurs (25% de taux d'échec), timeouts à 18:00 (pic de charge).
- Impact : Interruption de la synthèse des rapports.
-
Recommandation : Ajouter un cache Redis pour les requêtes récurrentes (ex : profils Epstein). Impact estimé : +20% de réactivité.
-
Queue saturée :
- Problème : 12 cycles bloqués (PID 3835264 à 20:50:43, PID 3805649 à 19:15:01).
- Cause : Concurrence entre cron v1 et v2.
-
Recommandation : Désactiver cron v1 (obsolète) et migrer vers cron v2 seul avec 18 agents. Impact estimé : +40% d'efficacité.
-
OpenRouter :
- Problème : Quota à 23% en 24h (modèle
gpt-4-turbolent et coûteux). - Recommandation : Remplacer par Mistral Large (modèle
mistral-large-2407) pour les tâches de redaction. Impact estimé : -50% de coûts et +25% de vitesse.
OPTIMISATIONS RECOMMANDÉES
- Réallocation des providers :
- Redaction Analyst → Cerebras (qwen-3-235b) : +30% throughput.
- Decoder → Failover Mistral (clé secondaire) : +15% stabilité.
-
Lead Investigator → Cache Redis + Mistral : +20% réactivité.
-
Migration technique :
- Désactiver cron v1 et ne garder que cron v2 (18 agents) : +40% d'efficacité.
-
Implémenter un load balancer pour les requêtes OpenRouter (ex :
round-robinentre Mistral et Cerebras). -
Monitoring renforcé :
- Seuils d'alerte : OpenRouter >15% quota → notification immédiate.
-
Dashboard temps réel : Intégrer les métriques dans Grafana (latence, erreurs, throughput).
-
Documentation :
- Mettre à jour le runbook avec les nouvelles règles de routing provider.
- Former les agents sur les bonnes pratiques de retry (ex : exponential backoff).
ACTIONS URGENTES
- [ALERTE PERF] : Redaction Analyst est en état critique (taux d'erreur >50%). Intervention requise sous 2h.
- [ALERTE QUOTA] : OpenRouter à 23% → Bloqué dans 18h si pas de bascule.
- Priorité 1 : Réaffecter Redaction Analyst à Cerebras.
- Priorité 2 : Désactiver cron v1 et migrer vers v2 seul.
Sources :
- /docker/paperclip-fg7d/data/results/cron.log (cycles et erreurs)
- /docker/paperclip-fg7d/data/results/ERRORS.log (classification erreurs)
- /docker/paperclip-fg7d/data/results/ALERTS.log (alertes critiques)
- Contraintes providers (document interne, 13 avril 2026).
Prochaine analyse : 15 avril 2026 à 17:00 (cycle complet post-optimisations).
EpsteinFiles & Co — Performance Analyst