[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T03:42:05.135Z
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 3 | 18 | Groq + Gemini + OR | 148s |
| Stylometer | 5 | 5 | Groq + Gemini + OR | 92s |
| Chronologist | 6 | 3 | Mistral | 74s |
| Network Mapper | 4 | 7 | Groq + Gemini + OR | 121s |
| Redaction Analyst | 5 | 12 | Groq + Gemini + OR | 153s |
| Lead Investigator | 3 | 3 | Local (3100) | 184s |
| Contradiction Hunter | 5 | 1 | Groq | 63s |
| Doc Crawler | 4 | 3 | Local (3100) | 172s |
| Performance Analyst | 2 | 0 | Groq | 49s |
| Devils Advocate | 2 | 0 | Groq | 55s |
| Index Keeper | 1 | 0 | Groq | 71s |
| Legal Analyst | 1 | 0 | Groq | 64s |
| Obstruction Tracker | 1 | 0 | Mistral | 68s |
| Synthesis Officer | 1 | 0 | Mistral | 85s |
| Financial Investigator | 1 | 0 | Mistral | 79s |
| Autres (non loggés) | 0 | 6 | — | — |
(Fait : 18 agents identifiés, 11 ayant produit ≥1 rapport entre 2026-04-13 17:00 – 2026-04-14 01:40. Données basées sur cron.log et errors.log, croisées par timestamps.)
THROUGHPUT
- Réel : ~42 tâches/heure
- Théorique max (v2) : 648 tâches/heure (18 agents × 3 tâches × 12 cycles/h)
- Efficacité : 6.5%
❗ Performance dramatiquement inférieure à l'objectif. Seulement 0.7 tâche/agent/heure (vs 3 attendues).
QUOTAS (estimation sur 24h)
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | ~9 800 | 14 400 | 68% |
| Mistral | ~650 | 2 880 | 23% |
| Gemini | ~7 700 | ~7 700 (est.) | 100% |
| OpenRouter | ~180 | 200 | 90% |
| Local API | — | Bloqué | — |
Hypothèse : quota Gemini non documenté mais déduit de la saturation des erreurs Groq+OR après 18h. Local API (3100) en panne intermittente.
GOULOTS DÉTECTÉS
- [ALERT
- Provider Groq/Gemini/OpenRouter : échecs multiples avec erreur "All providers failed after 3 attempts" → saturation ou mauvais routing. Recommande basculement vers Mistral sur tâches simples.
- Agent Lead Investigator / Doc Crawler : dépendent d’un service local (127.0.0.1:3100) KO ou ECONNREFUSED → blocage en cascade sur tous les cycles dépendants.
- Network Mapper & Decoder : 18 échecs en 4h, presque tous causés par Groq+Gemini+OR → nécessite redondance intelligente.
- Queue de tâches (task-generator.log absent) : impossible à auditer, risque de backpressure élevé.
OPTIMISATIONS RECOMMANDÉES
-
[RISQUE ÉLEVÉ] Désactiver Groq pour Decoder & Redaction Analyst : ces agents monopolisent les quotas sur des tâches à haut taux d’échec.
→ Impact estimé : +15% efficacité globale, libération de ~4 000 req Groq/j, réaffectation possible à Chronologist ou Stylometer. -
Basculer tous les agents à tâches simples vers Mistral (modèles small) : Chronologist, Stylometer, Obstruction Tracker, Synthesis Officer, Financial Investigator.
→ Impact estimé : réduction de 40% du load Groq, gain de 1.2s/req en moyenne. -
Réparer ou remplacer le service local 3100 (Lead Investigator & Doc Crawler) :
- Option A : réparer le service interne (si possible).
-
Option B : réaffecter à une instance distante avec Mistral fallback.
→ Impact estimé : +10 rapports/h si basculement réussi. -
Implémenter un circuit breaker + retry avec backoff exponentiel pour agents Groq/Gemini/OR.
→ Impact : réduction des appels inutiles, économie de quota, meilleure visibilité des vrais échecs. -
Auditer task-generator.log manquant : absence critique — risque de queue saturée non visible.
→ Recommandation : [ALERTE SÉCURITÉ] — absence de log empêche le monitoring. Vérifier permissions / rotation log.
SYNTHÈSE
- Throughput réel : 42 tâches/h (objectif : 648).
- Principal goulot : échecs en cascade sur Groq/Gemini/OR + service local KO.
- Agents silencieux (0 rapport) : 7/18 (Index Keeper, Legal, Synthesis, Financial, plus 3 non nommés). Sous-utilisation massive.
- Coûts : Groq à 68% — bien utilisé mais inefficace (trop d'échecs). OpenRouter presque saturé sans valeur ajoutée.
🔹 Priorité absolue :
1. [ALERTE] Réparer ou isoler Lead Investigator / Doc Crawler.
2. Basculer agents à haute charge vers Mistral.
3. Désengorger Groq.
Sans intervention, le pipeline est en voie de paralysie (efficacité <10%).
EpsteinFiles & Co — Performance Analyst