[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T08:36:09.290Z
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 3 | 14 | Groq + Gemini + OpenRouter | 156s |
| Stylometer | 4 | 5 | Groq | 98s |
| Network Mapper | 5 | 6 | Groq + Gemini | 132s |
| Chronologist | 4 | 5 | Mistral | 87s |
| Redaction Analyst | 4 | 8 | Groq + Gemini + OpenRouter | 145s |
| Lead Investigator | 3 | 3 | Local (ECONNREFUSED) | — |
| Contradiction Hunter | 4 | 4 | Mistral | 76s |
| Doc Crawler | 3 | 3 | Local (ECONNREFUSED) | — |
| Devils Advocate | 2 | 0 | Mistral | 64s |
| Performance Analyst | 2 | 0 | Groq | 58s |
| Legal Analyst | 1 | 0 | Cerebras | 167s |
| Obstruction Tracker | 2 | 0 | Cerebras | 155s |
| Synthesis Officer | 1 | 0 | Cerebras | 189s |
| Financial Investigator | 1 | 0 | Mistral | 201s |
| Index Keeper | 1 | 0 | Groq | 142s |
THROUGHPUT
- Réel : 48 tâches/heure (vs théorique : 648)
- Efficacité : 7.4%
QUOTAS
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | 4,210 | 14,400 | 29% |
| Mistral | 860 | 2,880 | 30% |
| Cerebras | 250 | 1,700 | 15% |
| OpenRouter | 15 | 200 | 8% |
GOULOTS DÉTECTÉS
- [Decoder + Redaction Analyst] : Tous les providers Groq/Gemini/OpenRouter en échec répété → impact sur 4 agents critiques
- [Lead Investigator + Doc Crawler] : Service local KO (ECONNREFUSED 127.0.0.1:3100) → agents bloqués sur 18:14:58
- [v2, 2026-04-13 20:50:43] : Queue saturée (cron conflits) → 23 cycles skipés en 6h
- [Network Mapper] : 5 erreurs en 90 min sur Groq → instabilité détectée
OPTIMISATIONS RECOMMANDÉES
- [ALERTE PERF] : Lead Investigator et Doc Crawler KO → remonter incident au LEAD. Impact estimé : +84 tâches/h si réparé → +130% throughput
- Réaffecter Decoder, Redaction Analyst et Stylometer vers Mistral (quota à 30%) → impact estimé : +45 tâches/h → +94% throughput sur ces agents
- Ajouter une sauvegarde Cerebras pour Network Mapper → éviter dépendance Groq → gain estimé : +15 tâches/h → +31% résilience
- Résolution du conflit de cron (v2) : désactiver les anciens crons (6+2) → gain de 114 tâches/h perdues en skip → +236% throughput
Recommandation critique :
[ALERTE PERF] Lead Investigator hors ligne depuis 18:14 → incident majeur. Sans son output, Synthesis Officer et Legal Analyst ralentis. Réparation urgente requise.
[ALERTE PERF] Queue bloquée sur 19:05 → 23 cycles perdus → perte d'au moins 207 rapports potentiels (18 agents × 3 tâches × 3.8h).
Sources :
- /docker/paperclip-fg7d/data/results/cron.log — cycles d’exécution, skips, erreurs de service
- /docker/paperclip-fg7d/data/results/ERRORS.log — erreurs provider, tentatives échouées
- /docker/paperclip-fg7d/data/results/watchdog.log — état des services locaux
- /docker/paperclip-fg7d/data/results/assign-watchdog.log — répartition des agents
Hypothèse :
- L'échec répété des providers sur Decoder/Redaction Analyst suggère un problème de routing ou firewall sur les appels Groq/Gemini/OpenRouter, pas une panne isolate.
- Le service local (port 3100) down depuis au moins 18:14 — probablement un crash du container lead-agent non redémarré.
[ALERTE] : Pipeline au bord du blocage total. Si Lead Investigator non rétabli sous 1h, passage en mode dégradé recommandé.
EpsteinFiles & Co — Performance Analyst