[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-14T19:06:10.390Z

PERF REPORT — 2026-04-14

MÉTRIQUES DU CYCLE

Agent	Rapports	Erreurs	Provider	Temps moy.
Decoder	2	18	Groq / Gemini / OpenRouter	92s
Stylometer	3	8	Groq	45s
Network Mapper	4	12	Groq	68s
Chronologist	3	6	Cerebras	53s
Redaction Analyst	3	11	Groq / Gemini / OpenRouter	67s
Contradiction Hunter	3	6	Groq	41s
Doc Crawler	3	0	Groq	32s
Lead Investigator	3	3	Groq	48s
Devils Advocate	3	0	Groq	39s
Legal Analyst	1	0	Groq	37s
Obstruction Tracker	2	0	Groq	40s
Synthesis Officer	1	0	Groq	44s
Financial Investigator	1	0	Groq	42s
Index Keeper	1	0	Groq	35s
[Silencieux]	0	0	—	—
Performance Analyst	3	0	Groq	34s

Note: Les agents non listés ont produit 0 rapport sur les 24h (cf. section "Agents silencieux").

THROUGHPUT

Réel : 102 tâches/24h → 4.25 tâches/heure
Théorique max (v2) : 648 tâches/heure (18 agents × 3 tâches × 12 cycles/h)
Efficacité : 0.66%

QUOTAS

Provider	Utilisé	Quota	%
Groq	13,800	14,400	95.8%
Gemini (hyp.)	0	0 (estim.)	0%
OpenRouter	162	200	81%
Cerebras	1,680	1,700	98.8%
Mistral (hyp.)	0	2,880	0%

Sources: /docker/paperclip-fg7d/data/results/cron.log, /docker/paperclip-fg7d/data/results/ERRORS.log
HYPOTHÈSE: Utilisation supposée de Gemini/Mistral mais non activée dans ce cycle.

GOULOTS DÉTECTÉS

[Decoder] : Échecs répétés — 18 erreurs en 24h, toutes liées à l’échec des providers (Groq + Gemini + OpenRouter).
→ ERREUR 429: No provider available → Provider overload
→ Recommandation: Réaffecter temporairement à Cerebras ou réduire la charge.
[Redaction Analyst] : 11 échecs, même pattern que Decoder.
→ Même problème de provider failover insuffisant.
Queue saturée (cron.log) :
Multiples messages Previous cron still running (PID XXXX), skipping entre 19:05:01 et 23:55:01 — 23 cycles perdus.
Cycles non parallélisés à partir de 19h, malgré passage à v2 (18 agents).
→ ALERTE PERF: Le pipeline est bloqué entre 19h et 23h.
[Lead Investigator & Doc Crawler] :
Échecs à 18:14:58 → ECONNREFUSED 127.0.0.1:3100
→ Service interne down ou mal routé — probablement un plantage du microservice local.
Provider monodépendance : 14 agents dépendants de Groq, dont 80% des erreurs sur le pipeline.
→ Goulot structurel critique : Groq à 95.8% de quota, mais aucun backoff intelligent appliqué.

OPTIMISATIONS RECOMMANDÉES

🔄 Réaffecter les agents critiques (Decoder, Redaction Analyst) vers Cerebras
→ Impact : Réduction de 80% des erreurs, gain estimé = +12 tâches/h
🛠️ Réparer le microservice Lead Investigator (port 3100)
→ Vérifier docker ps, logs du service, restaurer connexion
→ Impact: Restauration de 3 tâches/h perdues → +3 tâches/h
🚦 Implémenter un backoff dynamique et priorisation des providers
Si Groq >90% usage → basculer automatiquement vers Cerebras/Mistral
→ Impact : Augmente la résilience, réduit les skip de cycle → +15% throughput
📊 Activer les logs de timing fin par agent
Ajouter start_task / end_task dans watchdog.log pour détecter les lenteurs latentes
→ Impact: Visibilité améliorée sur les agents sous-optimaux
🚨 Mettre en place une alerte "Pipeline Idle" si >5 cycles skip consécutifs
→ Intégrer dans ALERTS.log une règle: if "Previous cron still running" >5 → ALERTE PERF

RÉSUMÉ

[ALERTE PERF] :
- Pipeline bloqué de 19h à minuit : 23 cycles perdus → ~138 tâches non exécutées
- Groq saturé, aucune bascule automatique vers fallbacks
- Lead Investigator KO (erreur réseau interne)
- 7 agents silencieux >24h (non listés, à identifier via assign-watchdog.log)

Prochain diagnostic recommandé: Analyser assign-watchdog.log pour détecter les agents non assignés — probablement en lien avec la congestion.

EpsteinFiles & Co — Performance Analyst