[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T02:54:05.508Z
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 4 | 12 | Groq/Gemini/OR | 155s |
| Redaction Analyst | 5 | 9 | Groq/Gemini/OR | 142s |
| Lead Investigator | 4 | 3 | Local (3100) | 128s |
| Doc Crawler | 4 | 3 | Local (3100) | 133s |
| Chronologist | 8 | 4 | Mistral | 88s |
| Stylometer | 8 | 4 | Groq/Mistral/OR | 92s |
| Network Mapper | 7 | 5 | Groq/Mistral/OR | 115s |
| Contradiction Hunter | 8 | 2 | Mistral | 85s |
| Devils Advocate | 3 | 0 | Mistral | 90s |
| Performance Analyst | 2 | 0 | Groq | 53s |
| Legal Analyst | 1 | 0 | Cerebras | 198s |
| Obstruction Tracker | 2 | 0 | Groq | 145s |
| Index Keeper | 1 | 0 | Cerebras | 176s |
| Synthesis Officer | 1 | 0 | Cerebras | 210s |
| Financial Investigator | 1 | 0 | Cerebras | 188s |
Données extraites de cron.log, errors.log, et samples. HYPOTHÈSE : les 10 agents restants (non visibles dans le log) n'ont produit aucun rapport en 24h.
THROUGHPUT
- Réel : 62 tâches/heure (372 sur 6h, période observée)
- Théorique max v2 : 648 tâches/heure
- Efficacité : 9.6% [(62 / 648) × 100]
FAIT : Le pipeline est opérationnel en mode v2 depuis 2026-04-13 20:50, mais seul un sous-ensemble d'agents s’exécute efficacement. Les cycles post-23:00 montrent une forte inactivité (queue vide).
QUOTAS
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | ~230 | 14 400 | 1.6% |
| Mistral | ~90 | 2 880 | 3.1% |
| Cerebras | ~5 | 1 700 | 0.3% |
| OpenRouter | ~15 | 200 | 7.5% |
FAIT : Les quotas sont largement sous-utilisés. La limitation ne vient pas des capacités des providers, mais du non-lancement des agents et des échecs répétés sur certains providers.
GOULOTS DÉTECTÉS
- 🔴 [Decoder / Redaction Analyst / Lead Investigator / Doc Crawler] : Échecs multiples liés à Groq + Gemini + OpenRouter (tous refusent ou timeoutent) → [ALERTE PERFORMANTE]
- 🔴 [Agents inactifs] : 10 agents non listés dans cron.log (ex : Truth Detector, Archive Scout, etc.) → silencieux depuis 24h
- 🔴 [Lead Investigator & Doc Crawler] : Erreur
ECONNREFUSED 127.0.0.1:3100→ service local KO - 🔴 Queue saturée 19:05–19:25 : 6 cycles consécutifs skip à cause d'une exécution prolongée (PID 3805649)
- 🔴 Network Mapper : 5 erreurs en 1h, toujours sur Groq → probable rate-limit ou incompatibilité modèle
[ALERTE PERF] : Le Lead Investigator, point central du système, est injoignable depuis 18:00. Son output est consommé par 7 autres agents → cascade d’échecs.
OPTIMISATIONS RECOMMANDÉES
- Isoler et réaffecter les agents critiques (Decoder, Redaction Analyst) à Mistral uniquement pour éviter les échecs en cascade → impact estimé = +18% throughput (réduction des retries et timeouts)
- Redémarrer le service local 3100 (Lead Investigator) → permettra de restaurer 4 agents dépendants → impact estimé = +35 tâches/h
- Prioriser Mistral pour Chronologist, Contradiction Hunter, Stylometer → déjà hautement compatibles → +12% efficacité
- Réaffecter Cerebras à 1–2 agents CPU-lourds (ex: Network Mapper) pour décharger Groq → +5% throughput global
- Activer un watchdog de healthcheck chaque 5 min pour détecter les agents morts et les redémarrer → prévention des chaînes bloquées
- Réactiver les 10 agents inactifs avec un routing initial sur Mistral (faible quota usage) → +60 tâches/h potentielles
Impact total estimé : +80–110 tâches/h → throughput cible = ~140–170 tâches/h (21–26% efficacité)
RÉSUMÉ DES FAITS
- Agents silencieux : au moins 10 (hors logs) → non productifs sur 24h
- Taux d'échec : jusqu’à 75% pour Decoder sur certaines fenêtres
- Queue bloquée : 6 cycles consécutifs skip entre 19:05–19:25 (PID 3805649 encore actif à 19:27) → goulots de coordination
- Source critique : [cron.log] montre que la majorité des erreurs sont réseau/provider, pas algorithme
[ALERTE PERF] : Le Lead Investigator est hors ligne. Toute la chaîne de décision est compromise. Une investigation humaine (IT) est nécessaire immédiatement pour redémarrer le service.
Recommandation finale : passer en mode dégradé avec 8 agents clés sur Mistral uniquement, jusqu’à stabilisation complète du système.
EpsteinFiles & Co — Performance Analyst