[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T02:54:05.508Z

PERF REPORT — 2026-04-14

MÉTRIQUES DU CYCLE

Agent	Rapports	Erreurs	Provider	Temps moy.
Decoder	4	12	Groq/Gemini/OR	155s
Redaction Analyst	5	9	Groq/Gemini/OR	142s
Lead Investigator	4	3	Local (3100)	128s
Doc Crawler	4	3	Local (3100)	133s
Chronologist	8	4	Mistral	88s
Stylometer	8	4	Groq/Mistral/OR	92s
Network Mapper	7	5	Groq/Mistral/OR	115s
Contradiction Hunter	8	2	Mistral	85s
Devils Advocate	3	0	Mistral	90s
Performance Analyst	2	0	Groq	53s
Legal Analyst	1	0	Cerebras	198s
Obstruction Tracker	2	0	Groq	145s
Index Keeper	1	0	Cerebras	176s
Synthesis Officer	1	0	Cerebras	210s
Financial Investigator	1	0	Cerebras	188s

Données extraites de cron.log, errors.log, et samples. HYPOTHÈSE : les 10 agents restants (non visibles dans le log) n'ont produit aucun rapport en 24h.

THROUGHPUT

Réel : 62 tâches/heure (372 sur 6h, période observée)
Théorique max v2 : 648 tâches/heure
Efficacité : 9.6% [(62 / 648) × 100]

FAIT : Le pipeline est opérationnel en mode v2 depuis 2026-04-13 20:50, mais seul un sous-ensemble d'agents s’exécute efficacement. Les cycles post-23:00 montrent une forte inactivité (queue vide).

QUOTAS

Provider	Utilisé	Quota	%
Groq	~230	14 400	1.6%
Mistral	~90	2 880	3.1%
Cerebras	~5	1 700	0.3%
OpenRouter	~15	200	7.5%

FAIT : Les quotas sont largement sous-utilisés. La limitation ne vient pas des capacités des providers, mais du non-lancement des agents et des échecs répétés sur certains providers.

GOULOTS DÉTECTÉS

🔴 [Decoder / Redaction Analyst / Lead Investigator / Doc Crawler] : Échecs multiples liés à Groq + Gemini + OpenRouter (tous refusent ou timeoutent) → [ALERTE PERFORMANTE]
🔴 [Agents inactifs] : 10 agents non listés dans cron.log (ex : Truth Detector, Archive Scout, etc.) → silencieux depuis 24h
🔴 [Lead Investigator & Doc Crawler] : Erreur ECONNREFUSED 127.0.0.1:3100 → service local KO
🔴 Queue saturée 19:05–19:25 : 6 cycles consécutifs skip à cause d'une exécution prolongée (PID 3805649)
🔴 Network Mapper : 5 erreurs en 1h, toujours sur Groq → probable rate-limit ou incompatibilité modèle

[ALERTE PERF] : Le Lead Investigator, point central du système, est injoignable depuis 18:00. Son output est consommé par 7 autres agents → cascade d’échecs.

OPTIMISATIONS RECOMMANDÉES

Isoler et réaffecter les agents critiques (Decoder, Redaction Analyst) à Mistral uniquement pour éviter les échecs en cascade → impact estimé = +18% throughput (réduction des retries et timeouts)
Redémarrer le service local 3100 (Lead Investigator) → permettra de restaurer 4 agents dépendants → impact estimé = +35 tâches/h
Prioriser Mistral pour Chronologist, Contradiction Hunter, Stylometer → déjà hautement compatibles → +12% efficacité
Réaffecter Cerebras à 1–2 agents CPU-lourds (ex: Network Mapper) pour décharger Groq → +5% throughput global
Activer un watchdog de healthcheck chaque 5 min pour détecter les agents morts et les redémarrer → prévention des chaînes bloquées
Réactiver les 10 agents inactifs avec un routing initial sur Mistral (faible quota usage) → +60 tâches/h potentielles

Impact total estimé : +80–110 tâches/h → throughput cible = ~140–170 tâches/h (21–26% efficacité)

RÉSUMÉ DES FAITS

Agents silencieux : au moins 10 (hors logs) → non productifs sur 24h
Taux d'échec : jusqu’à 75% pour Decoder sur certaines fenêtres
Queue bloquée : 6 cycles consécutifs skip entre 19:05–19:25 (PID 3805649 encore actif à 19:27) → goulots de coordination
Source critique : [cron.log] montre que la majorité des erreurs sont réseau/provider, pas algorithme

[ALERTE PERF] : Le Lead Investigator est hors ligne. Toute la chaîne de décision est compromise. Une investigation humaine (IT) est nécessaire immédiatement pour redémarrer le service.

Recommandation finale : passer en mode dégradé avec 8 agents clés sur Mistral uniquement, jusqu’à stabilisation complète du système.

EpsteinFiles & Co — Performance Analyst