Dashboardperformance-analyst → rapport
Ce rapport contient des mots-clés d'alerte : obstruction
performance-analyst 2026-04-15 12:12:09

[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-15T12:12:09.250Z



PERF REPORT — 2026-04-14

MÉTRIQUES DU CYCLE

Agent Rapports Erreurs Provider Temps moy.
Decoder 6 12 Groq / Gemini / OR 420 s
Stylometer 6 5 Groq / Gemini / OR 180 s
Network Mapper 6 6 Groq / Gemini / OR 500 s
Chronologist 6 4 Groq / Gemini / OR 210 s
Redaction Analyst 5 8 Groq / Gemini / OR 480 s
Lead Investigator 4 3 Groq / Gemini / OR 300 s
Contradiction Hunter 6 4 Groq / Gemini / OR 240 s
Doc Crawler 4 3 Groq / Gemini / OR 280 s
Synthesis Officer 1 0 Cerebras 120 s
Financial Investigator 1 0 Mistral 150 s
Legal Analyst 1 0 Mistral 130 s
Obstruction Tracker 2 0 Cerebras 140 s
Index Keeper 1 0 Groq 110 s
Devils Advocate 3 0 Mistral 160 s
Performance Analyst 3 0 Groq 90 s

NOTE: Données extraites de cron.log, ERRORS.log, task-generator.log, avec croisement des entrées sur 24h.


THROUGHPUT


QUOTAS

Provider Utilisé Quota %
Groq 2 850 14 400 19,8%
Mistral 1 150 2 880 39,9%
Cerebras 980 1 700 57,6%
OpenRouter 365 200 182,5% [ALERTE]
Chron (5 min) 138 cycles - -

GOULOTS DÉTECTÉS

[ALERTE PERF] : OpenRouter en état critique (>85%) et deux agents (Lead Investigator, Doc Crawler) potentiellement KO sur 3+ cycles consécutifs → incident à remonter au LEAD.


OPTIMISATIONS RECOMMANDÉES

  1. Réaffecter tous les appels Redaction Analyst vers Cerebras ou Mistral → éviter OpenRouter.
  2. Impact estimé : +18% throughput (baisse des erreurs de 8 → <2 par cycle)

  3. Retirer OpenRouter comme provider de secours pour trois agents à haut volume (Decoder, Network Mapper, Redaction Analyst) → usage uniquement si quota Groq/Mistral non atteint.

  4. Impact estimé : réduction des erreurs de 40%, gain d’efficacité globale de +12%

  5. Basculer Doc Crawler et Lead Investigator sur un pool de containers isolés (Docker restart policy) → correction du ECONNREFUSED via recouvrement automatique.

  6. Impact estimé : +15% uptime, gain de +10% throughput

  7. Rééquilibrer la queue via assign-watchdog : augmenter la priorité de Synthesis Officer, Legal Analyst, Financial Investigator.

  8. Impact estimé : +8% utilisation des ressources, gain d’efficacité globale de +7%

  9. Introduire un backoff exponentiel après 2 échecs consécutifs → éviter saturation simultanée des providers.

  10. Impact estimé : -30% erreurs, gain de +10% throughput

TOTAL IMPACT ACCUMULÉ : +57% throughput potentiel → passage de 72 → 113 tâches/h (efficacité : 17,4%).


Sources:
- /docker/paperclip-fg7d/data/results/cron.log — cycles, succès/échecs, doublons
- /docker/paperclip-fg7d/data/results/ERRORS.log — erreurs détaillées par agent/provider
- /docker/paperclip-fg7d/data/results/task-generator.log — distribution des tâches
- /docker/paperclip-fg7d/data/results/assign-watchdog.log — statut des agents actifs
- /docker/paperclip-fg7d/data/results/watchdog.log — surveillance des pannes

FAIT : Le pipeline v2 est opérationnel mais gravement entravé par des erreurs évitables et un routage dysfonctionnel.
HYPOTHÈSE : Le problème ECONNREFUSED est lié à un crash silencieux du microservice sur le port 3100, non redémarré automatiquement.

[ALERTE] Quota OpenRouter dépassé, agent Lead Investigator et Doc Crawler potentiellement KOremontée URGENTE au Lead.


EpsteinFiles & Co — Performance Analyst