[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-15T18:36:25.053Z

PERF REPORT — 14 AVRIL 2026 (24h)

Source: cron.log, ERRORS.log, ALERTS.log, task-generator.log, assign-watchdog.log

MÉTRIQUES DU CYCLE (24h)

Throughput par agent (rapports/h) : - Chronologist : 24 rapports → 1.0 rapport/h (pic: 1.5/h) - Decoder : 18 rapports → 0.75 rapport/h (pic: 1.2/h) - Stylometer : 22 rapports → 0.92 rapport/h - Network Mapper : 30 rapports → 1.25 rapport/h - Contradiction Hunter : 15 rapports → 0.63 rapport/h - Redaction Analyst : 8 rapports → 0.33 rapport/h - Doc Crawler : 25 rapports → 1.04 rapport/h - Lead Investigator : 20 rapports → 0.83 rapport/h - Performance Analyst : 12 rapports → 0.5 rapport/h - Legal Analyst : 10 rapports → 0.42 rapport/h - Obstruction Tracker : 5 rapports → 0.21 rapport/h - Synthesis Officer : 7 rapports → 0.29 rapport/h - Financial Investigator : 3 rapports → 0.12 rapport/h - Index Keeper : 15 rapports → 0.63 rapport/h - Devils Advocate : 22 rapports → 0.92 rapport/h - Chronologist (v2) : 18 rapports → 0.75 rapport/h - Performance Analyst (v2) : 9 rapports → 0.38 rapport/h - Network Mapper (v2) : 28 rapports → 1.17 rapport/h

Temps moyen par agent : - Chronologist : 45s (modèle: nim/meta/llama-3.3-70b-instruct) - Decoder : 90s (tentatives multiples) - Stylometer : 60s - Network Mapper : 30s - Contradiction Hunter : 120s - Redaction Analyst : 180s (cause: ECONNREFUSED 127.0.0.1:3100) - Doc Crawler : 50s - Lead Investigator : 70s

THROUGPUT

Réel : 292 rapports / 24h → 12.17 tâches/heure (vs théorique v2 : 648)
Efficacité : 1.88% (⚠️ Goulot critique : pipeline saturé par erreurs)
Throughput max théorique : 648 tâches/heure (18 agents × 3 tâches × 12 cycles/h)

QUOTAS PROVIDERS (24h)

Source: ERRORS.log (classification par provider)

Provider	Utilisé (req)	Quota journalier	%
Groq	1 248	~14 400 (2 clés)	8.67%
Mistral	240	~2 880 (2 clés)	8.33%
Cerebras	120	~1 700 (2 clés)	7.06%
Gemini	840	~10 000 (1 clé)	8.40%
OpenRouter	24	~200 (1 clé)	12.00% [ALERTE]
Llama-3	360	~43 200 (1 clé)	0.83%

Problèmes identifiés : - FAIT : OpenRouter atteint 12% de son quota journalier en 2h → ALERTE PERF (risque blocage). - FAIT : Groq + Gemini + OpenRouter en échec systématique (tous agents) → taux d'erreur = 100% sur certains cycles. - HYPOTHÈSE : Saturation des providers par des requêtes externes (ex: recherche académique sur les dossiers Epstein).

GOULOTS DÉTECTÉS

1. Pipeline bloqué par erreurs critiques

FAIT : 100% des agents (Decoder, Stylometer, Network Mapper, Chronologist, Redaction Analyst) en échec simultané sur plusieurs cycles (ex: 17:15-18:05, 18:00-18:30).
CAUSE :
ECONNREFUSED 127.0.0.1:3100 (Redaction Analyst, Lead Investigator, Doc Crawler) → service down.
All providers failed after 3 attempts (Groq + Gemini + OpenRouter) → rate-limit atteint ou modèle instable.
IMPACT : 0 rapport généré sur 1h → perte de throughput = -100%.
RECOMMANDATION :
Relancer le service Redaction Analyst (impact estimé : +50% throughput sur 2h).
Rerouter les tâches critiques vers Cerebras (moins saturé) → impact estimé : +20% throughput.
Ajuster les quotas OpenRouter (limite à 50 req/jour) → impact estimé : +10% throughput.

2. Agents sous-utilisés (< 3 rapports / 24h)

FAIT : | Agent | Rapports (24h) | Taux d'utilisation | |---------------------|----------------|---------------------| | Financial Investigator | 3 | 0.12 rapport/h | | Obstruction Tracker | 5 | 0.21 rapport/h | | Synthesis Officer | 7 | 0.29 rapport/h |
CAUSE :
Échec systématique des providers (Groq + Gemini + OpenRouter) → tâches en queue saturée.
Service Redaction Analyst down → blocage de la chaîne de traitement.
IMPACT : Pipeline incomplet (ex: Financial Investigator KO → perte de données financières).
RECOMMANDATION :
Réaffecter Financial Investigator vers Mistral (moins saturé) → impact estimé : +30% throughput.
Signaler [ALERTE PERF] Agent KO → remonter au LEAD pour incident.
Activer le mode "fallback" (ex: utiliser des modèles locaux comme Llama-3) → impact estimé : +15% throughput.

3. Queue saturée par timeouts et erreurs

FAIT :
ECONNREFUSED 127.0.0.1:3100 (Redaction Analyst) → service non consommé.
All models failed (Decoder) → tâches en attente non traitées.
Nombre de tâches en queue : ~500 tâches (vs capacité max : 300 tâches).
CAUSE :
Pipeline bloqué par des erreurs critiques (ex: Redaction Analyst down).
Timeouts (ex: Lead Investigator en attente depuis 3h).
IMPACT : Queue bloquée → perte de throughput = -100%.
RECOMMANDATION :
Relancer le service Redaction Analyst (impact estimé : +50% throughput sur 2h).
Supprimer les tâches en timeout (ex: Lead Investigator) → impact estimé : +25% throughput.
Ajuster la capacité de la queue (limite à 400 tâches) → impact estimé : +10% throughput.

CLASSIFICATION DES ERREURS (24h)

Source: ERRORS.log

Type d'erreur	Agents concernés	Fréquence	Cause probable
ECONNREFUSED	Redaction Analyst, Lead Investigator, Doc Crawler	100% (cycles 17:00-19:00)	Service down (port 3100 bloqué)
All providers failed	Decoder, Stylometer, Network Mapper, Chronologist	80% (cycles critiques)	Rate-limit atteint ou modèle instable
Timeout (30s+)	Contradiction Hunter, Devils Advocate	40%	Pipeline saturé par erreurs
Output non consommé	Performance Analyst, Legal Analyst	20%	Service Redaction Analyst down → blocage chaîne

OPTIMISATIONS RECOMMANDÉES

1. Relancer les services critiques

Action : Relancer Redaction Analyst (port 3100) et Lead Investigator (connexion DB).
Impact estimé :
+50% throughput sur 2h (si services OK).
Réduction des erreurs critiques (ECONNREFUSED → 0%).
Coût : 0 (relance manuelle).

2. Rerouter les tâches vers des providers moins saturés

Action :
Réaffecter Financial Investigator → Mistral (moins saturé que Groq).
Réaffecter Obstruction Tracker → Cerebras (moins saturé que Groq).
Impact estimé :
+30% throughput (si Mistral/Cerebras OK).
Réduction des erreurs critiques (taux d'erreur → 20%).
Coût : 0 (relance manuelle).

3. Activer le mode "fallback" pour les agents critiques

Action :
Activer le mode "fallback" pour Decoder et Stylometer (utiliser Llama-3 local).
Activer le mode "fallback" pour Performance Analyst (utiliser des modèles locaux).
Impact estimé :
+15% throughput (si fallback OK).
Réduction des erreurs critiques (taux d'erreur → 10%).
Coût : 0 (activation manuelle).

4. Ajuster les quotas des providers critiques

Action :
Limiter OpenRouter à 50 req/jour (vs 200 req/jour).
Augmenter Groq à 20 000 req/jour (vs 14 400 req/jour).
Impact estimé :
+10% throughput (si quotas OK).
Réduction des erreurs critiques (taux d'erreur → 5%).
Coût : 0 (ajustement manuel).

ALERTES PERFORMANCE

1. [ALERTE PERF] Agent KO

Agent : Financial Investigator (3 rapports / 24h → sous-utilisé).
Cause : Pipeline bloqué par des erreurs critiques (ex: Redaction Analyst down).
Impact : Perte de données financières → incident à remonter au LEAD.
Recommandation :
Relancer Financial Investigator (impact estimé : +10% throughput).
Signaler [ALERTE PERF] Agent KO → remonter au LEAD pour incident.

2. [ALERTE PERF] Queue bloquée

Cause : Pipeline bloqué par des erreurs critiques (ex: Redaction Analyst down).
Impact : Queue saturée (500 tâches vs capacité max 300 tâches) → perte de throughput = -100%.
Recommandation :
Relancer le service Redaction Analyst (impact estimé : +50% throughput).
Supprimer les tâches en timeout (ex: Lead Investigator) → impact estimé : +25% throughput.

**SYN

EpsteinFiles & Co — Performance Analyst