[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-16T04:18:22.504Z
PERF REPORT — 14 AVRIL 2026
Analyse des logs 24h (13/04 17:16 → 14/04 17:16)
MÉTRIQUES DU CYCLE
Données extraites de cron.log, errors.log, et watchdog.log. Les agents silencieux sont identifiés via l'absence de logs de succès sur 24h.
| Agent | Rapports (24h) | Erreurs | Provider Principal | Temps moy. (s) | Statut |
|---|---|---|---|---|---|
| Decoder | 12 | 18 | Groq/Gemini | 45 | ⚠️ Sous-performant |
| Stylometer | 15 | 12 | Groq | 38 | ⚠️ Sous-performant |
| Network Mapper | 22 | 10 | Groq | 52 | ⚠️ Sous-performant |
| Chronologist | 28 | 8 | Groq | 40 | ✅ Stable |
| Redaction Analyst | 5 | 25 | Groq/OpenRouter | 60 | [ALERTE] KO |
| Lead Investigator | 18 | 7 | Groq | 48 | ⚠️ Sous-performant |
| Doc Crawler | 25 | 5 | Groq | 35 | ✅ Stable |
| Contradiction Hunter | 20 | 6 | Groq | 42 | ✅ Stable |
| Devils Advocate | 14 | 4 | Groq | 39 | ✅ Stable |
| Legal Analyst | 10 | 3 | Mistral | 55 | ⚠️ Sous-performant |
| Obstruction Tracker | 8 | 2 | Mistral | 65 | [ALERTE] KO |
| Synthesis Officer | 12 | 1 | Cerebras | 70 | ⚠️ Sous-performant |
| Financial Investigator | 6 | 5 | Mistral | 75 | [ALERTE] KO |
| Index Keeper | 18 | 0 | Groq | 30 | ✅ Stable |
Agents silencieux (<3 rapports/24h) : - [ALERTE] Redaction Analyst (5 rapports, 25 erreurs) : KO fonctionnel. - [ALERTE] Obstruction Tracker (8 rapports, 2 erreurs) : Sous-utilisé. - [ALERTE] Financial Investigator (6 rapports, 5 erreurs) : KO fonctionnel.
THROUGHPUT
- Réel : 213 rapports/24h (moyenne : 8.9 rapports/heure)
- vs théorique v2 : 648 tâches/heure (18 agents × 3 tâches × 12 cycles).
- Efficacité : 32.9% (213/648 × 100).
- Pic de performance : 18:30-19:30 (8 rapports en 1 cycle → 96 rapports/heure, mais avec 2 échecs).
QUOTAS PROVIDERS (24h)
| Provider | Utilisé | Quota Journalier | % Quota | Statut |
|---|---|---|---|---|
| Groq | 189 | 14 400 | 1.3% | ✅ Vert |
| Mistral | 35 | 2 880 | 1.2% | ✅ Vert |
| Cerebras | 12 | 1 700 | 0.7% | ✅ Vert |
| OpenRouter | 15 | 200 | 7.5% | ⚠️ Jaune (proche limite) |
| Total | 251 | - | - | - |
Notes : - OpenRouter atteint 7.5% de son quota journalier (15/200) en 24h. [ALERTE] Risque de saturation si pic d'activité. - Groq utilisé à seulement 1.3% de son quota, mais avec des échecs répétés (ex : Decoder en échec 18 fois).
GOULOTS DÉTECTÉS
- [ALERTE PERF] Redaction Analyst :
- Problème : 25 erreurs en 24h (taux d'erreur : 83%), blocage fréquent du pipeline.
- Cause : Échecs systématiques des providers (Groq + Gemini + OpenRouter) + dépendance à OpenRouter (limite proche).
-
Recommandation : Basculer Redaction Analyst sur Cerebras (quota sous-utilisé) pour réduire la pression sur Groq/OpenRouter.
- Impact estimé : +15% throughput (réduction des goulots).
-
[ALERTE PERF] Obstruction Tracker et Financial Investigator :
- Problème : Sous-utilisation (<10 rapports/24h) + erreurs récurrentes.
- Cause : Priorisation incorrecte des tâches (ces agents sont critiques pour l'enquête).
-
Recommandation :
- Réaffecter 2 clés Groq supplémentaires à ces agents (via load balancing).
- Impact estimé : +20% throughput (meilleure parallélisation).
-
Decoder :
- Problème : 18 échecs en 24h (taux d'erreur : 60%), temps moyen élevé (45s).
- Cause : Dépendance à Groq (surchargé) + modèles trop lents (Llama-3.3-70b).
-
Recommandation :
- Utiliser Mistral pour les tâches de Decoder (modèles plus rapides).
- Impact estimé : -30% temps moyen → +10% throughput.
-
[ALERTE] OpenRouter :
- Problème : Quota à 7.5% en 24h (15/200), risque de blocage.
- Cause : Utilisé par Redaction Analyst et Decoder en fallback.
-
Recommandation :
- Désactiver OpenRouter pour Redaction Analyst (basculer sur Cerebras).
- Limiter Decoder à 1 tentative max sur OpenRouter avant fallback.
- Impact estimé : 0% risque de saturation OpenRouter.
-
Queue saturée :
- Problème : Cron jobs bloqués (ex : 17:25, 18:00, 19:00-19:30) → 30% des cycles en attente.
- Cause : Agents lents (Redaction Analyst, Decoder) + conflits PID (ex : PID 3793475).
- Recommandation :
- Implémenter un timeout de 30s pour les tâches bloquées (kill + réessai).
- Impact estimé : +25% cycles réussis.
ERREURS RÉCURRENTES (classification)
| Type d'erreur | Fréquence (24h) | Agents affectés | Cause racine |
|---|---|---|---|
| All providers failed | 58 | Decoder, Stylometer, Chronologist, etc. | Surcharge Groq/Gemini |
| ECONNREFUSED 127.0.0.1 | 3 | Lead Investigator, Doc Crawler | Service local (3100) non démarré |
| Timeout | 12 | Redaction Analyst, Decoder | Modèles lents (Llama-70b) |
| Quota OpenRouter dépassé | 2 | Redaction Analyst | Limite quotidienne atteinte |
OPTIMISATIONS RECOMMANDÉES
- Réallocation des providers :
- Redaction Analyst → Cerebras (quota sous-utilisé).
- Obstruction Tracker et Financial Investigator → +2 clés Groq (load balancing).
- Decoder → Mistral pour les tâches rapides.
-
Impact total : +45% throughput (passer de 213 à ~310 rapports/24h).
-
Amélioration de la résilience :
- Ajouter un circuit breaker pour OpenRouter (max 1 tentative avant fallback).
- Implémenter un watchdog pour tuer les tâches bloquées (>60s).
-
Impact : Réduction des erreurs de 30%.
-
Priorisation des agents critiques :
- Augmenter la fréquence des cycles pour Obstruction Tracker et Financial Investigator (toutes les 3h au lieu de 5h).
-
Impact : +10% rapports critiques (ex : preuves financières).
-
Optimisation des modèles :
- Remplacer Llama-3.3-70b par Mistral-8x22B pour Decoder/Stylometer (modèles plus rapides).
- Impact : -40% temps moyen → +15% throughput.
ALERTES CRITIQUES
- [ALERTE PERF] Redaction Analyst : Agent KO (25 erreurs/24h). À remplacer immédiatement par Cerebras.
- [ALERTE] OpenRouter : Quota à 7.5% (15/200). Bloquer l'accès pour Redaction Analyst.
- [ALERTE] Queue saturée : 30% des cycles en attente. Implémenter timeout 30s.
- [ALERTE] Services locaux : 3 erreurs "ECONNREFUSED 127.0.0.1". Vérifier le service 3100.
PROCHAINES ÉTAPES
- Urgence : Réaffecter Redaction Analyst sur Cerebras (dès aujourd'hui).
- Court terme : Ajouter 2 clés Groq pour Obstruction Tracker/Financial Investigator.
- Moyen terme : Remplacer Llama-70b par Mistral-8x22B pour Decoder/Stylometer.
- Long terme : Automatiser le circuit breaker pour OpenRouter.
Sources : - cron.log (cycles, erreurs, PID). - errors.log (classification des échecs). - watchdog.log (alertes critiques). - Quotas providers (document interne EpsteinFiles & Co).
Prochaine analyse : 15/04/2026 (suivi des optimisations).
EpsteinFiles & Co — Performance Analyst