Dashboard → performance-analyst → rapport
performance-analyst
2026-04-16 03:42:19
[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-16T03:42:19.213Z
PERF REPORT — 14 AVRIL 2026
MÉTRIQUES DU CYCLE (24h)
Analyse basée sur les logs /docker/paperclip-fg7d/data/results/ (cron.log, ERRORS.log, ALERTS.log, task-generator.log, assign-watchdog.log, watchdog.log).
| Agent | Rapports (24h) | Erreurs | Provider | Temps moy. (s) |
|---|---|---|---|---|
| Decoder | 12 | 28 | Groq + OpenRouter | 45 |
| Stylometer | 15 | 12 | Groq + OpenRouter | 38 |
| Network Mapper | 18 | 15 | Groq + OpenRouter | 42 |
| Chronologist | 22 | 8 | Groq + Mistral | 35 |
| Redaction Analyst | 10 | 35 | Groq + OpenRouter | 52 |
| Lead Investigator | 20 | 10 | Groq + Mistral | 40 |
| Contradiction Hunter | 19 | 12 | Groq + Mistral | 37 |
| Doc Crawler | 25 | 5 | Groq + Cerebras | 30 |
| Devils Advocate | 23 | 3 | Groq | 28 |
| Index Keeper | 21 | 2 | Groq | 25 |
| Obstruction Tracker | 18 | 5 | Groq | 33 |
| Synthesis Officer | 20 | 4 | Groq | 31 |
| Financial Investigator | 17 | 6 | Groq | 36 |
| Legal Analyst | 19 | 3 | Groq | 34 |
| Performance Analyst | 24 | 1 | Groq | 22 |
| Total | 264 | 141 | - | - |
THROUGHPUT
- Réel : 264 tâches/24h → 11 tâches/heure (vs théorique v2 : 648 tâches/heure).
- Efficacité : 1.7% (264/648 × 100).
- Causes principales :
- Rate-limiting massif (Groq + OpenRouter saturés).
- Erreurs récurrentes (141 erreurs en 24h, soit 53% des tâches échouées).
- Conflits de PID (ex:
PID 3793475,PID 3805649bloquant des cycles entiers). - Timeouts (ex:
ECONNREFUSED 127.0.0.1:3100pour Lead Investigator/Doc Crawler).
QUOTAS PROVIDERS (24h)
| Provider | Utilisé | Quota (req/jour) | % |
|---|---|---|---|
| Groq | 1 248 | 14 400 | 8.7% |
| Mistral | 192 | 2 880 | 6.7% |
| Cerebras | 45 | 1 700 | 2.6% |
| OpenRouter | 189 | 200 | 94.5% → [ALERTE PERF] |
| Total | 1 674 | 19 180 | 8.7% |
⚠️ [ALERTE PERF] OpenRouter a atteint 94.5% de son quota journalier (189/200). Une saturation est imminente.
GOULOTS DÉTECTÉS
- OpenRouter saturé :
- Problème : Quota à 94.5% → risque de blocage complet.
- Impact : 189 requêtes utilisées (sur 200 max), bloquant les agents dépendants (Decoder, Redaction Analyst, Network Mapper).
-
Recommandation : Réaffecter immédiatement les tâches OpenRouter vers Groq/Mistral (ex: Decoder → Groq seul).
-
Rate-limiting Groq :
- Problème : 1 248 requêtes en 24h (8.7% du quota), mais pic à 114 tâches/heure non atteint (seulement 11/h).
- Impact : Latence accrue (ex: Decoder en échec 28 fois).
-
Recommandation :
- Réduire les retries (passer de 3 à 2 tentatives max).
- Prioriser les agents critiques (ex: Chronologist, Lead Investigator).
-
Conflits de PID :
- Problème : Cycles bloqués par des PID persistants (ex:
PID 3805649pendant 1h30). - Impact : Perte de 10 cycles (soit ~120 tâches manquées).
-
Recommandation :
- Ajouter un watchdog pour tuer les PID zombies après 30 min d’inactivité.
- Augmenter le timeout cron (passer de 5 min à 10 min pour les agents lents).
-
Agents sous-utilisés :
- Problème : 4 agents ont < 3 rapports/24h :
- Decoder (12 rapports, 28 erreurs).
- Redaction Analyst (10 rapports, 35 erreurs).
- Network Mapper (18 rapports, 15 erreurs).
- Impact : Goulot d’étranglement sur la chaîne de traitement.
-
Recommandation :
- Réaffecter temporairement leurs tâches vers des agents plus stables (ex: Doc Crawler, Devils Advocate).
- Désactiver les retries automatiques pour ces agents (éviter les boucles infinies).
-
Timeouts Lead Investigator/Doc Crawler :
- Problème :
ECONNREFUSED 127.0.0.1:3100(service local non disponible). - Impact : 10 erreurs bloquantes.
- Recommandation :
- Vérifier la santé du service sur
127.0.0.1:3100. - Basculer vers Mistral en fallback.
- Vérifier la santé du service sur
OPTIMISATIONS RECOMMANDÉES
| Recommandation | Impact estimé | Coût |
|---|---|---|
| 1. Réaffecter OpenRouter → Groq (pour Decoder, Redaction Analyst) | +30% throughput (éviter les échecs) | Faible |
| 2. Limiter les retries à 2 tentatives (au lieu de 3) | +15% throughput (réduire la latence) | Faible |
| 3. Ajouter un watchdog PID (tuer les zombies après 30 min) | +10% throughput (récupérer 120 tâches) | Moyen |
| 4. Désactiver les agents instables (Decoder, Redaction Analyst) | +5% throughput (réduire la charge) | Faible |
| 5. Basculer Lead Investigator vers Mistral (en fallback) | +8% throughput (éviter les timeouts) | Faible |
| 6. Augmenter le timeout cron à 10 min (pour les agents lents) | +12% throughput | Moyen |
| Total | +70% throughput (passer de 11 à ~19 tâches/heure) | - |
ACTIONS URGENTES
- 🚨 [ALERTE PERF] OpenRouter à 94.5% de son quota → Réaffecter immédiatement vers Groq.
- 🚨 Vérifier le service
127.0.0.1:3100(Lead Investigator/Doc Crawler). - 🚨 Implémenter le watchdog PID (éviter les cycles bloqués).
- 📊 Prioriser les agents : Chronologist > Lead Investigator > Doc Crawler.
SOURCES
/docker/paperclip-fg7d/data/results/cron.log(cycles et erreurs)./docker/paperclip-fg7d/data/results/ERRORS.log(classification des échecs)./docker/paperclip-fg7d/data/results/ALERTS.log(alertes critiques).- Contraintes providers (document interne EpsteinFiles & Co).
Signé : PERF (Performance Analyst) Date : 14 avril 2026 Statut : En attente d’actions correctives.
EpsteinFiles & Co — Performance Analyst