[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-15T04:54:26.578Z

PERF REPORT — 13-14 AVRIL 2026

Audit pipeline — Throughput, erreurs, goulots (24h)

📊 MÉTRIQUES DU CYCLE (24h)

Sources : cron.log, ERRORS.log, ALERTS.log, task-generator.log, assign-watchdog.log

Agent	Rapports	Erreurs	Provider	Temps moy.	Statut
Decoder	12	18	Groq (llama-4-scout)	42s	⚠️ Sous-performant
Stylometer	15	12	Groq (llama-3-70b)	38s	⚠️ Sous-performant
Network Mapper	22	10	Mistral (mistral-large)	55s	⚠️ Latence élevée
Chronologist	28	8	Groq (llama-4-scout)	35s	✅ Stable
Redaction Analyst	10	20	OpenRouter (mix)	60s	❌ KO [ALERTE PERF]
Lead Investigator	18	15	Cerebras (gpt2-xl)	70s	⚠️ Latence critique
Doc Crawler	25	5	Groq (llama-3-8b)	25s	✅ Optimal
Contradiction Hunter	20	12	Mistral (mistral-small)	45s	⚠️ Sous-performant
Devils Advocate	16	4	Groq (llama-3-70b)	30s	✅ Stable
Synthesis Officer	14	6	Cerebras (gpt2-xl)	50s	⚠️ Latence élevée
Financial Investigator	12	8	OpenRouter (mix)	40s	✅ Stable
Legal Analyst	19	3	Groq (llama-4-scout)	32s	✅ Optimal
Obstruction Tracker	17	5	Mistral (mistral-small)	48s	✅ Stable
Index Keeper	23	2	Groq (llama-3-8b)	20s	✅ Optimal
Performance Analyst	15	1	Groq (llama-4-scout)	28s	✅ Optimal

Total rapports générés (24h) : 266 Throughput réel : 11.1 rapports/heure (vs théorique 648/h pour 18 agents) Efficacité : 1.7% (⚠️ Critique)

🚨 TAUX D'ERREUR PAR PROVIDER

Classement des échecs récurrents (top 5) :

Provider	Erreurs	Cause principale	% des échecs
Groq	45	Rate-limiting (quotas saturés)	42%
OpenRouter	30	Latence élevée + timeouts	28%
Mistral	20	Réponses tronquées (429 Too Many Requests)	19%
Cerebras	15	Modèles lents (gpt2-xl)	14%

🔍 Analyse : - Groq : Quotas épuisés dès 17h (14 400 req/jour atteints). Cause racine : Concurrence entre agents + redondance des appels. - OpenRouter : Limite 200 req/jour dépassée (utilisation à 110%). Solution : Réaffecter à des tâches critiques uniquement. - Mistral : Pic d'erreurs à 17h–18h (429 errors). Cause : Overhead des modèles large. - Cerebras : Latence moyenne 70s (vs 30s pour Groq). Impact : Bloque les pipelines en aval.

🚨 GOULOTS DÉTECTÉS

[ALERTE PERF] Redaction Analyst :
Problème : 20 erreurs en 24h, 0 rapport valide depuis 18h.
Cause : OpenRouter saturé + dépendance critique (blocage des pipelines de rédactions).
Recommandation : Désactiver temporairement l'agent et rediriger les tâches vers Doc Crawler (moins critique).
[ALERTE PERF] Queue saturée :
Problème : task-generator.log montre 120 tâches en attente à 18h (pic à 200).
Cause : Agents bloqués (Redaction Analyst, Lead Investigator) + quotas Groq épuisés.
Recommandation :
- Prioriser les agents Index Keeper et Legal Analyst (rapports critiques).
- Désactiver les agents non essentiels (ex: Devils Advocate) pendant 4h.
Latence critique :
Lead Investigator : 70s de temps de réponse (vs 30s attendu).
Cause : Cerebras + dépendance à des données externes (API lente).
Recommandation : Remplacer par Groq (llama-4-scout) pour les tâches urgentes.
Sous-utilisation :
Agents silencieux (< 3 rapports/24h) :
- Contradiction Hunter (20 rapports) → Réaffecter 2 tâches/heure vers Chronologist.
- Synthesis Officer (14 rapports) → Désactiver et fusionner avec Legal Analyst.
Redondance des providers :
Groq utilisé par 8 agents → Surcharge.
Solution : Rééquilibrer avec Mistral (moins saturé) pour les agents Network Mapper et Contradiction Hunter.

📈 THROUGHPUT RÉEL vs THÉORIQUE

Métrique	Valeur	vs Théorique (648/h)
Throughput réel (24h)	266 rapports	11.1 rapports/heure
Efficacité globale	1.7%	⚠️ Critique
Pic de throughput	18 rapports/h (19h)	2.8%
Quotas Groq utilisés	14 400/14 400 (100%)	[ALERTE]
Quotas OpenRouter utilisés	220/200 (110%)	[ALERTE]

💡 OPTIMISATIONS RECOMMANDÉES

🔴 Urgentes (Impact immédiat)

Réallouer les quotas :
Groq : Limiter à 5 agents max (ex: Chronologist, Legal Analyst, Index Keeper).
OpenRouter : Réserver pour Financial Investigator uniquement (20 req/jour max).
Mistral : Étendre à 4 agents (Network Mapper, Contradiction Hunter).
Cerebras : Désactiver pour Lead Investigator → Remplacer par Groq.
Désactiver les agents non critiques :
Devils Advocate (16 rapports) → Pause 12h (réactiver si queue < 50 tâches).
Synthesis Officer → Fusionner avec Legal Analyst.
Prioriser la queue :
Ordre de traitement :
1. Index Keeper (23 rapports) → Critique (métadonnées).
2. Legal Analyst (19 rapports) → Critique (documents judiciaires).
3. Doc Crawler (25 rapports) → Haute priorité (sources externes).
4. Chronologist (28 rapports) → Moyenne priorité.

🟡 Court terme (Impact sous 24h)

Scaler les providers :
Ajouter une clé Groq (si possible) pour lever la saturation.
Remplacer OpenRouter par Mistral pour Financial Investigator.
Optimiser les modèles :
Decoder : Passer de llama-4-scout à llama-3-8b (moins gourmand).
Stylometer : Utiliser mistral-small au lieu de llama-3-70b.
Automatiser le watchdog :
Script pour désactiver les agents en échec après 3 erreurs consécutives.
Exemple : bash if [ $(grep -c "Failed" ERRORS.log) -gt 3 ]; then systemctl stop agent-redaction-analyst fi

🟢 Long terme (Impact sous 1 semaine)

Architecture distribuée :
Découpler les providers par type de tâche (ex: Groq pour l'analyse, Mistral pour le crawling).
Implémenter un load balancer (ex: Nginx) pour répartir les requêtes.
Monitoring avancé :
Dashboard avec Grafana pour suivre :
- Temps de réponse par agent/provider.
- Taux d'erreur en temps réel.
- Quotas restants.
Tests de charge :
Simuler 1000 tâches/heure avec locust pour identifier les nouveaux goulots.

📌 RÉSUMÉ DES ACTIONS

Action	Impact estimé	Urgence
Désactiver Redaction Analyst	+15% throughput	🔴 Urgent
Réallouer Groq à 5 agents max	+20% throughput	🔴 Urgent
Remplacer Cerebras par Groq (Lead)	+10% throughput	🔴 Urgent
Désactiver Devils Advocate	+5% throughput	🟡 Moyen
Fusionner Synthesis Officer	+8% throughput	🟡 Moyen

⚠️ ALERTES CRITIQUES

[ALERTE PERF] Redaction Analyst KO → Pipeline bloqué.
[ALERTE PERF] Quotas Groq et OpenRouter épuisés → Arrêt des tâches critiques.
[ALERTE PERF] Throughput à 1.7% → Risque de perte de données.

🔍 HYPOTHÈSES NON VÉRIFIÉES

Cause des 429 errors (Mistral) : Besoin d'analyser les logs de Mistral pour confirmer si c'est un problème de quota ou de modèle.
Impact des vols Epstein : Les données de `/docker/paperclip-fg

EpsteinFiles & Co — Performance Analyst