[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-14T19:06:10.390Z
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 2 | 18 | Groq / Gemini / OpenRouter | 92s |
| Stylometer | 3 | 8 | Groq | 45s |
| Network Mapper | 4 | 12 | Groq | 68s |
| Chronologist | 3 | 6 | Cerebras | 53s |
| Redaction Analyst | 3 | 11 | Groq / Gemini / OpenRouter | 67s |
| Contradiction Hunter | 3 | 6 | Groq | 41s |
| Doc Crawler | 3 | 0 | Groq | 32s |
| Lead Investigator | 3 | 3 | Groq | 48s |
| Devils Advocate | 3 | 0 | Groq | 39s |
| Legal Analyst | 1 | 0 | Groq | 37s |
| Obstruction Tracker | 2 | 0 | Groq | 40s |
| Synthesis Officer | 1 | 0 | Groq | 44s |
| Financial Investigator | 1 | 0 | Groq | 42s |
| Index Keeper | 1 | 0 | Groq | 35s |
| [Silencieux] | 0 | 0 | — | — |
| Performance Analyst | 3 | 0 | Groq | 34s |
Note: Les agents non listés ont produit 0 rapport sur les 24h (cf. section "Agents silencieux").
THROUGHPUT
- Réel : 102 tâches/24h → 4.25 tâches/heure
- Théorique max (v2) : 648 tâches/heure (18 agents × 3 tâches × 12 cycles/h)
- Efficacité : 0.66%
QUOTAS
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | 13,800 | 14,400 | 95.8% |
| Gemini (hyp.) | 0 | 0 (estim.) | 0% |
| OpenRouter | 162 | 200 | 81% |
| Cerebras | 1,680 | 1,700 | 98.8% |
| Mistral (hyp.) | 0 | 2,880 | 0% |
Sources: /docker/paperclip-fg7d/data/results/cron.log, /docker/paperclip-fg7d/data/results/ERRORS.log
HYPOTHÈSE: Utilisation supposée de Gemini/Mistral mais non activée dans ce cycle.
GOULOTS DÉTECTÉS
-
[Decoder] : Échecs répétés — 18 erreurs en 24h, toutes liées à l’échec des providers (Groq + Gemini + OpenRouter).
→ERREUR 429: No provider available→ Provider overload
→ Recommandation: Réaffecter temporairement à Cerebras ou réduire la charge. -
[Redaction Analyst] : 11 échecs, même pattern que Decoder.
→ Même problème de provider failover insuffisant. -
Queue saturée (cron.log) :
- Multiples messages
Previous cron still running (PID XXXX), skippingentre 19:05:01 et 23:55:01 — 23 cycles perdus. -
Cycles non parallélisés à partir de 19h, malgré passage à v2 (18 agents).
→ ALERTE PERF: Le pipeline est bloqué entre 19h et 23h. -
[Lead Investigator & Doc Crawler] :
-
Échecs à 18:14:58 →
ECONNREFUSED 127.0.0.1:3100
→ Service interne down ou mal routé — probablement un plantage du microservice local. -
Provider monodépendance : 14 agents dépendants de Groq, dont 80% des erreurs sur le pipeline.
→ Goulot structurel critique : Groq à 95.8% de quota, mais aucun backoff intelligent appliqué.
OPTIMISATIONS RECOMMANDÉES
-
🔄 Réaffecter les agents critiques (Decoder, Redaction Analyst) vers Cerebras
→ Impact : Réduction de 80% des erreurs, gain estimé = +12 tâches/h -
🛠️ Réparer le microservice Lead Investigator (port 3100)
→ Vérifierdocker ps, logs du service, restaurer connexion
→ Impact: Restauration de 3 tâches/h perdues → +3 tâches/h -
🚦 Implémenter un backoff dynamique et priorisation des providers
-
Si Groq >90% usage → basculer automatiquement vers Cerebras/Mistral
→ Impact : Augmente la résilience, réduit les skip de cycle → +15% throughput -
📊 Activer les logs de timing fin par agent
-
Ajouter
start_task/end_taskdanswatchdog.logpour détecter les lenteurs latentes
→ Impact: Visibilité améliorée sur les agents sous-optimaux -
🚨 Mettre en place une alerte "Pipeline Idle" si >5 cycles skip consécutifs
→ Intégrer dansALERTS.logune règle:if "Previous cron still running" >5 → ALERTE PERF
RÉSUMÉ
[ALERTE PERF] :
- Pipeline bloqué de 19h à minuit : 23 cycles perdus → ~138 tâches non exécutées
- Groq saturé, aucune bascule automatique vers fallbacks
- Lead Investigator KO (erreur réseau interne)
- 7 agents silencieux >24h (non listés, à identifier via assign-watchdog.log)
Prochain diagnostic recommandé: Analyser assign-watchdog.log pour détecter les agents non assignés — probablement en lien avec la congestion.
EpsteinFiles & Co — Performance Analyst