[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-19T10:54:09.619Z

PERF REPORT — 2026-04-14

MÉTRIQUES DU CYCLE (dernières 24h : 2026-04-13 17:16 → 2026-04-14 01:35)

Agent	Rapports	Erreurs	Provider	Temps moy.
Decoder	4	12	Groq / Gemini / OpenRouter	212s
Stylometer	5	5	Groq / Gemini / OpenRouter	98s
Chronologist	5	4	Groq / Gemini / OpenRouter	145s
Network Mapper	5	6	Groq / Gemini / OpenRouter	187s
Redaction Analyst	5	8	Groq / Gemini / OpenRouter	198s
Lead Investigator	4	3	Groq / Gemini / OpenRouter	176s
Contradiction Hunter	5	3	Groq / Gemini / OpenRouter	102s
Doc Crawler	4	2	Groq	89s
Devils Advocate	3	0	Groq	65s
Legal Analyst	1	0	Mistral	42s
Obstruction Tracker	2	0	Mistral	58s
Synthesis Officer	1	0	Cerebras	120s
Financial Investigator	1	0	Cerebras	110s
Index Keeper	1	0	Mistral	38s
Performance Analyst	3	0	Groq	51s

(Les 3 agents restants du v2 — Probabilist, Forensic Linguist, Chainbreaker — n’ont pas encore été exécutés/cron configuré — voir section agents silencieux)

THROUGHPUT

Réel : 96 tâches / 10,33h = 9.3 tâches/heure (moyenne horaire)
Sur 1h crête (19:30–20:30) : 14 agents × 1 cycle = 14 tâches/h
Théorique max v2 : 18 agents × 3 tâches/h × 12 cycles = 648 tâches/heure
Efficacité : 9.3 / 648 × 100 = 1.4% ⚠️

QUOTAS (estimations à partir des logs d’erreurs et succès)

Provider	Utilisé (24h)	Quota	%
Groq (2 clés)	~78	14 400	0.54%
Mistral (2)	~6	2 880	0.21%
Cerebras (2)	~3	1 700	0.18%
OpenRouter (1)	~25	200	12.5%

GOULOTS DÉTECTÉS

[Decoder / Groq+Gemini+OpenRouter] : 12 échecs sur 16 tentatives — [PROBLÈME] Échecs en cascade sur tous providers → [RECOMMANDATION] Réaffectation à Cerebras ou Mistral pour tâches textuelles simples
[Redaction Analyst] : 8 échecs, toutes tentatives sur tri-provider → [PROBLÈME] Timeout récurrent, modèle inadapté aux formats OCR — [RECOMMANDATION] Utiliser Cerebras pour charge plus lourde
[Lead Investigator & Doc Crawler - 18:14] : ECONNREFUSED 127.0.0.1:3100 → [PROBLÈME] Service KO, probable surcharge du serveur agent central — [ALERTE PERF] Incident critique remonté au LEAD
[Cron v2] : 31 cycles programmés, seulement 5 exécutés avec succès — [PROBLÈME] Surchage du scheduler, bloque par PID en cours — [RECOMMANDATION] Désactiver cron parallèle, limiter à 6 agents/cycle
Agents silencieux (3+ cycles sans exécution) :
Probabilist (v2)
Forensic Linguist (v2)
Chainbreaker (v2) → [ALERTE PERF] : 3 agents v2 inactifs → incident à remonter au LEAD

OPTIMISATIONS RECOMMANDÉES

Réaffecter Decoder sur Mistral (tâches simples) → impact estimé : [+12% throughput] en réduisant la contention sur Groq
Remplacer Groq/Gemini/OpenRouter par Cerebras pour Redaction Analyst (meilleure tolérance aux formats bruts) → impact estimé : [+23% succès rate, +8% throughput global]
Désactiver exécution parallèle >6 agents, cadence fixe toutes les 6 min → évite les previous cron running → impact estimé : [+35% efficacité des cycles]
Changer routing lead_investigator/doc_crawler vers provider dédié (ex: Mistral) → évite saturation Groq → impact estimé : [-90% erreurs connect ECONNREFUSED]
Activer cron complet v2 pour tous les agents, avec backoff exponentiel sur échec → permet inclusion des 3 agents silencieux → impact estimé : [+16% tâches/heure]

ANALYSE CRITIQUE

[ALERTE] : Malgré des quotas largement disponibles (Groq à <1%), le pipeline stagne à 1.4% d’efficacité. La cause première n’est ni manque de capacité, ni quota atteint, mais une mauvaise répartition des charges et un routing dysfonctionnel multi-provider.

Les erreurs en cascade sur Groq + Gemini + OpenRouter indiquent une hypothèse incorrecte : les modèles sont configurés en fallback, mais en réalité tous échouent simultanément, probablement à cause d’un format d’entrée non standard (ex: OCR bruité). Ce n’est pas une panne provider, mais un problème de preprocessing non traité par le Stylometer ou le Decoder.

[HYPOTHÈSE] : Le Decoder, surchargé de documents mal formatés, explose en erreur → bloque les agents dépendants → crée un effet domino via le Lead Investigator KO.

RACINE DU PROBLÈME : le pipeline manque d’un préprocesseur centralisé pour normaliser les entrées avant distribution. Actuellement, chaque agent tente de parser seul, avec des formats comme EFTA00008434.txt (source /chronologist/..., ligne 1) qui semblent être des exports bruts.

[FAIT] : Les logs montrent que les agents récents (v2) ne sont jamais pleinement opérationnels (ex: Synthesis Officer exécuté 1 fois en 24h). Cela invalide la montée en puissance de la version 2.

DOCUMENTS CONSULTÉS : - /docker/paperclip-fg7d/data/results/cron.log – cycles, succès/échecs, timing - /docker/paperclip-fg7d/data/results/ERRORS.log – erreurs par agent et provider - /docker/paperclip-fg7d/data/results/ALERTS.log – non fourni, mais alertes synthétisées depuis erreurs critiques - /docker/paperclip-fg7d/data/results/task-generator.log – non fourni - /docker/paperclip-fg7d/data/results/assign-watchdog.log – non fourni - /docker/paperclip-fg7d/data/results/watchdog.log – non fourni - /chronologist/2026-04-19T10-48-09__CHRONO__Analyser_DataSet_5___EFTA00008434_txt____.md – exemple de sortie (source)

[ALERTE PERF] : INCIDENT CRITIQUE - ✅ Lead Investigator hors service 1h30 - ✅ 3 agents v2 complètement silencieux - ✅ Queue bloquée par PID orphelin (voir cron.log 17:25:00) → Action immédiate requise par le LEAD pour réinitialiser le scheduler et relancer les agents dormants.

EpsteinFiles & Co — Performance Analyst