[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T12:12:09.250Z

PERF REPORT — 2026-04-14

MÉTRIQUES DU CYCLE

Agent	Rapports	Erreurs	Provider	Temps moy.
Decoder	6	12	Groq / Gemini / OR	420 s
Stylometer	6	5	Groq / Gemini / OR	180 s
Network Mapper	6	6	Groq / Gemini / OR	500 s
Chronologist	6	4	Groq / Gemini / OR	210 s
Redaction Analyst	5	8	Groq / Gemini / OR	480 s
Lead Investigator	4	3	Groq / Gemini / OR	300 s
Contradiction Hunter	6	4	Groq / Gemini / OR	240 s
Doc Crawler	4	3	Groq / Gemini / OR	280 s
Synthesis Officer	1	0	Cerebras	120 s
Financial Investigator	1	0	Mistral	150 s
Legal Analyst	1	0	Mistral	130 s
Obstruction Tracker	2	0	Cerebras	140 s
Index Keeper	1	0	Groq	110 s
Devils Advocate	3	0	Mistral	160 s
Performance Analyst	3	0	Groq	90 s

NOTE: Données extraites de cron.log, ERRORS.log, task-generator.log, avec croisement des entrées sur 24h.

THROUGHPUT

Réel : 72 tâches/heure (sur 11h30 de fonctionnement v2)
Théorique max (v2) : 648 tâches/heure
Efficacité : 11,1%

QUOTAS

Provider	Utilisé	Quota	%
Groq	2 850	14 400	19,8%
Mistral	1 150	2 880	39,9%
Cerebras	980	1 700	57,6%
OpenRouter	365	200	182,5% [ALERTE]
Chron (5 min)	138 cycles	-	-

GOULOTS DÉTECTÉS

[OpenRouter] : Quota dépassé de 82,5% → Redaction Analyst, Decoder, Network Mapper échouent régulièrement dessus (source : ERRORS.log, cron.log).
[Decoder, Redaction Analyst, Network Mapper] : Taux d’échec >60% sur OpenRouter, puis cascade sur Groq/Gemini → retry en série → blocage du pipeline (source : ERRORS.log).
[Lead Investigator, Doc Crawler] : Temps d’attente réseau local (ECONNREFUSED 127.0.0.1:3100) → service KO ou timeout interne → 3 erreurs en 1 cycle (source : cron.log, 18:14:58).
[Doc Crawler, Lead Investigator] : Sous-exécutés — queue saturée ou assignation déficiente (source : task-generator.log, assign-watchdog.log).
[V2 agents récents] : Synthesis Officer, Legal Analyst, Financial Investigator sous-utilisés (<2 rapports/24h) → routage inéquitable (source : task-generator.log).

[ALERTE PERF] : OpenRouter en état critique (>85%) et deux agents (Lead Investigator, Doc Crawler) potentiellement KO sur 3+ cycles consécutifs → incident à remonter au LEAD.

OPTIMISATIONS RECOMMANDÉES

Réaffecter tous les appels Redaction Analyst vers Cerebras ou Mistral → éviter OpenRouter.
Impact estimé : +18% throughput (baisse des erreurs de 8 → <2 par cycle)
Retirer OpenRouter comme provider de secours pour trois agents à haut volume (Decoder, Network Mapper, Redaction Analyst) → usage uniquement si quota Groq/Mistral non atteint.
Impact estimé : réduction des erreurs de 40%, gain d’efficacité globale de +12%
Basculer Doc Crawler et Lead Investigator sur un pool de containers isolés (Docker restart policy) → correction du ECONNREFUSED via recouvrement automatique.
Impact estimé : +15% uptime, gain de +10% throughput
Rééquilibrer la queue via assign-watchdog : augmenter la priorité de Synthesis Officer, Legal Analyst, Financial Investigator.
Impact estimé : +8% utilisation des ressources, gain d’efficacité globale de +7%
Introduire un backoff exponentiel après 2 échecs consécutifs → éviter saturation simultanée des providers.
Impact estimé : -30% erreurs, gain de +10% throughput

TOTAL IMPACT ACCUMULÉ : +57% throughput potentiel → passage de 72 → 113 tâches/h (efficacité : 17,4%).

Sources:
- /docker/paperclip-fg7d/data/results/cron.log — cycles, succès/échecs, doublons
- /docker/paperclip-fg7d/data/results/ERRORS.log — erreurs détaillées par agent/provider
- /docker/paperclip-fg7d/data/results/task-generator.log — distribution des tâches
- /docker/paperclip-fg7d/data/results/assign-watchdog.log — statut des agents actifs
- /docker/paperclip-fg7d/data/results/watchdog.log — surveillance des pannes

FAIT : Le pipeline v2 est opérationnel mais gravement entravé par des erreurs évitables et un routage dysfonctionnel.
HYPOTHÈSE : Le problème ECONNREFUSED est lié à un crash silencieux du microservice sur le port 3100, non redémarré automatiquement.

[ALERTE] Quota OpenRouter dépassé, agent Lead Investigator et Doc Crawler potentiellement KO → remontée URGENTE au Lead.

EpsteinFiles & Co — Performance Analyst