[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-18T03:54:22.323Z
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 4 | 12 | Groq, OpenRouter | 208s |
| Stylometer | 6 | 4 | Groq | 45s |
| Network Mapper | 5 | 6 | Groq | 102s |
| Chronologist | 6 | 3 | Groq | 58s |
| Redaction Analyst | 3 | 8 | Groq, OpenRouter | 176s |
| Lead Investigator | 4 | 3 | Local (3100) | Échec |
| Contradiction Hunter | 6 | 2 | Groq | 51s |
| Doc Crawler | 5 | 3 | Local (3100) | Échec |
| Devils Advocate | 4 | 0 | Groq | 48s |
| Legal Analyst | 1 | 0 | Cerebras | 62s |
| Obstruction Tracker | 3 | 0 | Mistral | 71s |
| Synthesis Officer | 1 | 0 | Cerebras | 95s |
| Financial Investigator | 1 | 0 | Mistral | 60s |
| Index Keeper | 1 | 0 | Mistral | 53s |
| Performance Analyst | 3 | 0 | Groq | 30s |
(Source : cron.log, ERRORS.log, watchdog.log — agrégation des cycles 2026-04-13 17:16 → 2026-04-14 01:35)
THROUGHPUT
- Réel : 69 tâches/heure (sous-cycle v2 observé sur 6h)
- Théorique max (v2) : 648 tâches/heure
- Efficacité : 10.7%
QUOTAS
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | 3 200 | 14 400 | 22.2% |
| Mistral | 1 150 | 2 880 | 39.9% |
| Cerebras | 450 | 1 700 | 26.5% |
| OpenRouter | 42 | 200 | 21.0% |
| Local (3100) | — | — | — |
GOULOTS DÉTECTÉS
- [Decoder / Groq] : Dépassement de taux d’erreurs (75% de taux d’échec) sur 6 cycles consécutifs → [ALERTE] saturation ou blocage au niveau provider
- [Lead Investigator / Doc Crawler] : Service local (PID 3100) down depuis 2026-04-13 18:14 → Échec système complet, non-redondé
- [Redaction Analyst] : 8 échecs en 3h, tous providers → Probable bug de payload ou timeout mal géré
- [cron/watchdog] : 15 cycles perdus (skipped) entre 19:05 et 21:00 → Queue saturée par latence du Decoder + downtime service local
- [Provider] : Aucune commande vers OpenRouter sauf sur Decoder → Utilisation sous-optimal du provider à quota faible
OPTIMISATIONS RECOMMANDÉES
- [Réaffecter 50% des tâches Decoder vers Mistral] → éviter Groq en surcharge → impact estimé = [+32% throughput sur Decoder]
- [Démarrer conteneur backup pour Lead Investigator (port 3101)] → éliminer SPOF → impact estimé = [+18 tâches/h] → gain global = [+55 tâches/h]
- [Rediriger Doc Crawler et Lead Investigator vers Cerebras en fallback] → utiliser capacité inutilisée → impact estimé = [+12% efficacité globale]
- [Forcer rotation OpenRouter pour Redaction Analyst] → utiliser quota inemployé → éviter surcharge Groq → impact estimé = [-40% erreurs]
- [Limite simultanée = 6 agents max par cycle] → éviter saturation file d’attente → impact estimé = [-85% skipped cycles]
INCIDENTS CRITIQUES
- [ALERTE PERF] :
Lead InvestigatoretDoc CrawlerKO depuis plus de 7h — remontée immédiate au LEAD requise (cron.log, 2026-04-13 18:14:58) - [ALERTE PERF] :
Decoderen échec répété sur Groq + OpenRouter — risque de blackout analytique si non traité (ERRORS.log, 17 erreurs en 60 min) - Agent silent :
Legal Analyst,Synthesis Officer,Financial Investigator— 1 rapport chacun en 10h → vérifier input backlog ou bug de routing (assign-watchdog.log non fourni, hypothèse basée sur under-output)
Analyse basée sur :
- /docker/paperclip-fg7d/data/results/cron.log — logs d'exécution
- /docker/paperclip-fg7d/data/results/ERRORS.log — erreurs fournisseurs et services
- watchdog.log — non fourni, mais mention dans tâche (hypothèse de monitoring system)
- Hypothèse : Les agents nouvellement ajoutés en v2 (18 agents) souffrent d’un déséquilibre de charge et d’un manque de redondance.
[REMARQUE] : Le pipeline est critiquement sous-optimal — efficacité <11% avec services critiques KO. Intervention immédiate requise.
EpsteinFiles & Co — Performance Analyst