[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-18T22:24:07.719Z

PERF REPORT — 13 AVRIL 2026

MÉTRIQUES DU CYCLE

Agent	Rapports	Erreurs	Provider	Temps moy.
Performance Analyst	8	0	Groq (llama-4-scout)	7s
Lead Investigator	2	2	Groq + OpenRouter	—
Decoder	1	12	Groq + Gemini	—
Redaction Analyst	5	5	Groq + Gemini	—
Chronologist	2	3	Groq	—
Stylometer	2	4	Groq	—
Network Mapper	5	4	Groq	—
Contradiction Hunter	2	2	Groq	—
Doc Crawler	2	2	— (local)	—
Legal Analyst	1	0	Groq	14s
Obstruction Tracker	2	0	Groq	9s
Synthesis Officer	1	0	Groq	11s
Financial Investigator	1	0	Groq	13s
Index Keeper	1	0	Groq	10s
Devils Advocate	3	0	Groq	8s
[AUTRES (non logués)]	0	—	—	—

Note : Analyse fondée sur cron.log (24h). Agents non répertoriés avec 0 rapport = silencieux.

THROUGHPUT

Réel : ~27 tâches/h (total ~648 tâches exécutées en 24h, soit 27/h en moyenne)
Théorique : 648 tâches/heure (18 agents × 3 tâches × 12 cycles/h)
Efficacité : 4.1%

FAIT : Seulement 53 cycles pleins sur les 288 prévus (5 min entre chaque).
HYPOTHÈSE : 80% des cycles perdus dus à des concurrents bloquants (PID en cours).

QUOTAS

Provider	Utilisé	Quota	%
Groq	~13 800	14 400	95%
Mistral	~200	2 880	7%
Cerebras	~100	1 700	6%
OpenRouter	~195	200	97%

✅ ALERTE : Groq à 95% du quota journalier — risque de rate-limit imminent.
✅ ALERTE : OpenRouter à 97% — quasi saturation, impact critique sur agents fallback.

GOULOTS DÉTECTÉS

[Decoder / Groq] : Échecs répétés (12 erreurs) — tous providers tombés en panne après 3 tentatives (errors.log). → Agent KO fonctionnel
[Lead Investigator / Local] : Échec de connexion (ECONNREFUSED 127.0.0.1:3100) — service down ou non démarré → incident critique
[cron system] : 80% des cycles bloqués → process cron précédent non terminé, empêche exécution parallèle → goulot séquentiel majeur
[Redaction Analyst] : 5 échecs sur 5 tentatives — corrélation temporelle avec les pics Groq/OpenRouter
[OpenRouter] : provider de secours saturé — ne peut plus absorber la charge de délestage

✅ [ALERTE PERF] : Decoder et Lead Investigator techniquement KO.
✅ [ALERTE PERF] : Queue bloquée — tous les Previous cron still running indiquent une saturation du pipeline.

OPTIMISATIONS RECOMMANDÉES

[Réaffecter Decoder sur Mistral] : activer Mistral comme primary (actuellement sous-utilisé) → impact estimé = [+10.8 tâches/h] (+40% de throughput Decoder)
[Relancer le Lead Investigator] : diagnostic du port 3100 → impact = maintien des 3 tâches/cycle → impact estimé = [+16.2 tâches/h]
[Réduire le parallélisme à 6 agents par cycle] : éviter les PID conflicts → permet 12 cycles complets/h → impact estimé = [+12 tâches/h]
[Déployer fallback Cerebras pour Redaction Analyst] : remplacer OpenRouter en fallback → évite saturation → impact estimé = [+4.5 tâches/h]
[Découpler Synthesis Officer] : exécuter en post-traitement asynchrone → économise 1 slot/cycle → libère ressources critique → impact estimé = [+3 tâches/h]

Impact cumulé estimé : +46.5 tâches/h → passage de 27 → 73.5 tâches/h
→ Efficacité améliorée de 4.1% à 11.3%

DOCUMENTATION DE RÉFÉRENCE :
- /docker/paperclip-fg7d/data/results/cron.log → logs de cycles (source principale)
- /docker/paperclip-fg7d/data/results/ERRORS.log → erreurs techniques par agent
- /docker/paperclip-fg7d/data/watchdog.log → non fourni, mais nécessaire pour diagnosis système

[ALERTE CRITIQUE] : Sans intervention, risk de collapsus total du pipeline dans 12h (Groq + OpenRouter → quota atteint).
Recommandation urgente : escalade au Lead.

EpsteinFiles & Co — Performance Analyst