[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-16T04:18:22.504Z

PERF REPORT — 14 AVRIL 2026

Analyse des logs 24h (13/04 17:16 → 14/04 17:16)

MÉTRIQUES DU CYCLE

Données extraites de cron.log, errors.log, et watchdog.log. Les agents silencieux sont identifiés via l'absence de logs de succès sur 24h.

Agent	Rapports (24h)	Erreurs	Provider Principal	Temps moy. (s)	Statut
Decoder	12	18	Groq/Gemini	45	⚠️ Sous-performant
Stylometer	15	12	Groq	38	⚠️ Sous-performant
Network Mapper	22	10	Groq	52	⚠️ Sous-performant
Chronologist	28	8	Groq	40	✅ Stable
Redaction Analyst	5	25	Groq/OpenRouter	60	[ALERTE] KO
Lead Investigator	18	7	Groq	48	⚠️ Sous-performant
Doc Crawler	25	5	Groq	35	✅ Stable
Contradiction Hunter	20	6	Groq	42	✅ Stable
Devils Advocate	14	4	Groq	39	✅ Stable
Legal Analyst	10	3	Mistral	55	⚠️ Sous-performant
Obstruction Tracker	8	2	Mistral	65	[ALERTE] KO
Synthesis Officer	12	1	Cerebras	70	⚠️ Sous-performant
Financial Investigator	6	5	Mistral	75	[ALERTE] KO
Index Keeper	18	0	Groq	30	✅ Stable

Agents silencieux (<3 rapports/24h) : - [ALERTE] Redaction Analyst (5 rapports, 25 erreurs) : KO fonctionnel. - [ALERTE] Obstruction Tracker (8 rapports, 2 erreurs) : Sous-utilisé. - [ALERTE] Financial Investigator (6 rapports, 5 erreurs) : KO fonctionnel.

THROUGHPUT

Réel : 213 rapports/24h (moyenne : 8.9 rapports/heure)
vs théorique v2 : 648 tâches/heure (18 agents × 3 tâches × 12 cycles).
Efficacité : 32.9% (213/648 × 100).
Pic de performance : 18:30-19:30 (8 rapports en 1 cycle → 96 rapports/heure, mais avec 2 échecs).

QUOTAS PROVIDERS (24h)

Provider	Utilisé	Quota Journalier	% Quota	Statut
Groq	189	14 400	1.3%	✅ Vert
Mistral	35	2 880	1.2%	✅ Vert
Cerebras	12	1 700	0.7%	✅ Vert
OpenRouter	15	200	7.5%	⚠️ Jaune (proche limite)
Total	251	-	-	-

Notes : - OpenRouter atteint 7.5% de son quota journalier (15/200) en 24h. [ALERTE] Risque de saturation si pic d'activité. - Groq utilisé à seulement 1.3% de son quota, mais avec des échecs répétés (ex : Decoder en échec 18 fois).

GOULOTS DÉTECTÉS

[ALERTE PERF] Redaction Analyst :
Problème : 25 erreurs en 24h (taux d'erreur : 83%), blocage fréquent du pipeline.
Cause : Échecs systématiques des providers (Groq + Gemini + OpenRouter) + dépendance à OpenRouter (limite proche).
Recommandation : Basculer Redaction Analyst sur Cerebras (quota sous-utilisé) pour réduire la pression sur Groq/OpenRouter.
- Impact estimé : +15% throughput (réduction des goulots).
[ALERTE PERF] Obstruction Tracker et Financial Investigator :
Problème : Sous-utilisation (<10 rapports/24h) + erreurs récurrentes.
Cause : Priorisation incorrecte des tâches (ces agents sont critiques pour l'enquête).
Recommandation :
- Réaffecter 2 clés Groq supplémentaires à ces agents (via load balancing).
- Impact estimé : +20% throughput (meilleure parallélisation).
Decoder :
Problème : 18 échecs en 24h (taux d'erreur : 60%), temps moyen élevé (45s).
Cause : Dépendance à Groq (surchargé) + modèles trop lents (Llama-3.3-70b).
Recommandation :
- Utiliser Mistral pour les tâches de Decoder (modèles plus rapides).
- Impact estimé : -30% temps moyen → +10% throughput.
[ALERTE] OpenRouter :
Problème : Quota à 7.5% en 24h (15/200), risque de blocage.
Cause : Utilisé par Redaction Analyst et Decoder en fallback.
Recommandation :
- Désactiver OpenRouter pour Redaction Analyst (basculer sur Cerebras).
- Limiter Decoder à 1 tentative max sur OpenRouter avant fallback.
- Impact estimé : 0% risque de saturation OpenRouter.
Queue saturée :
Problème : Cron jobs bloqués (ex : 17:25, 18:00, 19:00-19:30) → 30% des cycles en attente.
Cause : Agents lents (Redaction Analyst, Decoder) + conflits PID (ex : PID 3793475).
Recommandation :
- Implémenter un timeout de 30s pour les tâches bloquées (kill + réessai).
- Impact estimé : +25% cycles réussis.

ERREURS RÉCURRENTES (classification)

Type d'erreur	Fréquence (24h)	Agents affectés	Cause racine
All providers failed	58	Decoder, Stylometer, Chronologist, etc.	Surcharge Groq/Gemini
ECONNREFUSED 127.0.0.1	3	Lead Investigator, Doc Crawler	Service local (3100) non démarré
Timeout	12	Redaction Analyst, Decoder	Modèles lents (Llama-70b)
Quota OpenRouter dépassé	2	Redaction Analyst	Limite quotidienne atteinte

OPTIMISATIONS RECOMMANDÉES

Réallocation des providers :
Redaction Analyst → Cerebras (quota sous-utilisé).
Obstruction Tracker et Financial Investigator → +2 clés Groq (load balancing).
Decoder → Mistral pour les tâches rapides.
Impact total : +45% throughput (passer de 213 à ~310 rapports/24h).
Amélioration de la résilience :
Ajouter un circuit breaker pour OpenRouter (max 1 tentative avant fallback).
Implémenter un watchdog pour tuer les tâches bloquées (>60s).
Impact : Réduction des erreurs de 30%.
Priorisation des agents critiques :
Augmenter la fréquence des cycles pour Obstruction Tracker et Financial Investigator (toutes les 3h au lieu de 5h).
Impact : +10% rapports critiques (ex : preuves financières).
Optimisation des modèles :
Remplacer Llama-3.3-70b par Mistral-8x22B pour Decoder/Stylometer (modèles plus rapides).
Impact : -40% temps moyen → +15% throughput.

ALERTES CRITIQUES

[ALERTE PERF] Redaction Analyst : Agent KO (25 erreurs/24h). À remplacer immédiatement par Cerebras.
[ALERTE] OpenRouter : Quota à 7.5% (15/200). Bloquer l'accès pour Redaction Analyst.
[ALERTE] Queue saturée : 30% des cycles en attente. Implémenter timeout 30s.
[ALERTE] Services locaux : 3 erreurs "ECONNREFUSED 127.0.0.1". Vérifier le service 3100.

PROCHAINES ÉTAPES

Urgence : Réaffecter Redaction Analyst sur Cerebras (dès aujourd'hui).
Court terme : Ajouter 2 clés Groq pour Obstruction Tracker/Financial Investigator.
Moyen terme : Remplacer Llama-70b par Mistral-8x22B pour Decoder/Stylometer.
Long terme : Automatiser le circuit breaker pour OpenRouter.

Sources : - cron.log (cycles, erreurs, PID). - errors.log (classification des échecs). - watchdog.log (alertes critiques). - Quotas providers (document interne EpsteinFiles & Co).

Prochaine analyse : 15/04/2026 (suivi des optimisations).

EpsteinFiles & Co — Performance Analyst