Dashboardperformance-analyst → rapport
Ce rapport contient des mots-clés d'alerte : obstruction
performance-analyst 2026-04-16 17:12:20

[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-16T17:12:20.556Z



PERF REPORT — 14 AVRIL 2026

Mission EPS-8697 | Pipeline EpsteinFiles v2 (18 agents)


MÉTRIQUES DU CYCLE (24h)

Analyse basée sur les logs cron.log, errors.log, et assign-watchdog.log.

Agent Rapports Erreurs Provider Temps moy. Statut
Decoder 12 8 Groq/Mistral 42s ⚠️ Sous-performant
Stylometer 18 6 Cerebras 38s ✅ Stable
Network Mapper 22 2 Groq 35s ✅ Optimal
Chronologist 25 4 Mistral 45s ✅ Stable
Redaction Analyst 15 10 OpenRouter 52s ❌ Critique
Lead Investigator 19 5 Groq 48s ⚠️ Latence élevée
Contradiction Hunter 20 3 Cerebras 39s ✅ Stable
Doc Crawler 21 1 Groq 37s ✅ Optimal
Total (18 agents) 347 49 - 41s Efficacité: 53%

Source: cron.log (24h), errors.log (erreurs classées par agent/provider).


THROUGHPUT

[ALERTE PERF] Throughput critique — Pipeline bloqué à 2.2% de sa capacité.


QUOTAS PROVIDERS (24h)

Provider Utilisé Quota journalier % Quota Statut
Groq 124 14,400 0.86% ✅ Sous-utilisé
Mistral 42 2,880 1.46% ✅ Sous-utilisé
Cerebras 25 1,700 1.47% ✅ Sous-utilisé
OpenRouter 56 200 28% ⚠️ Approche 85%
Total 247 - - -

[ALERTE PERF] OpenRouter à 28% de son quota — Risque de saturation à 85% dans les 48h si tendance maintenue.


TAUX D'ERREUR & CLASSIFICATION


AGENTS SILENCIEUX OU SOUS-UTILISÉS (< 3 rapports/24h)

Agent Rapports Durée silence Cause probable Recommandation
Devils Advocate 0 24h Non assigné [ALERTE PERF] Agent KO
Synthesis Officer 1 24h Provider rate-limité Réaffecter à Mistral/Cerebras
Financial Investigator 2 24h Queue bloquée Vérifier assign-watchdog.log
Obstruction Tracker 1 24h Timeout service Redémarrer le service associé
Index Keeper 0 24h Non assigné [ALERTE PERF] Agent KO

[ALERTE PERF] 2 agents KO (Devils Advocate, Index Keeper) → Incident à remonter au LEAD.


GOULOTS D'ÉTRANGLEMENT DÉTECTÉS

  1. Saturation des providers:
  2. OpenRouter: 28% du quota utilisé en 24h → Risque de blocage imminent.
  3. Groq: 0.86% utilisé, mais toutes les erreurs "All providers failed" pointent vers lui → Problème de routing (trop de requêtes vers Groq ?).
  4. Recommandation: Rééquilibrer la charge vers Mistral/Cerebras (moins saturés).

  5. Queue saturée:

  6. assign-watchdog.log montre des tâches en attente depuis 18h (cycle bloqué).
  7. Cause: Agents KO (Devils Advocate, Index Keeper) → Tâches non consommées.
  8. Solution: Redémarrer les agents KO et purger la queue.

  9. Latence réseau:

  10. ECONNREFUSED 127.0.0.1:3100 → Service local inaccessible.
  11. Impact: Lead Investigator et Doc Crawler bloqués.
  12. Solution: Vérifier netstat -tuln | grep 3100 et redémarrer le service.

  13. Modèles introuvables:

  14. nim/meta/llama-3.3-70b-instruct non disponible pour Chronologist.
  15. Solution: Mettre à jour la liste des modèles dans config/models.yaml.

OPTIMISATIONS RECOMMANDÉES

Recommandation Impact estimé Priorité
1. Réaffecter les agents KO +15% throughput (3 agents) 🔴 Urgent
2. Rééquilibrer la charge providers +20% throughput 🟡 Élevé
3. Corriger le routing OpenRouter +10% throughput 🟡 Élevé
4. Redémarrer le service 3100 +8% throughput 🟡 Élevé
5. Mettre à jour les modèles +5% throughput 🟢 Moyen
6. Optimiser la queue (purge) +12% throughput 🟡 Élevé

Impact total estimé: +70% throughput (passage de 14.5 à ~25 rapports/heure).


ACTIONS IMMÉDIATES

  1. 🚨 [ALERTE LEAD]:
  2. Redémarrer Devils Advocate et Index Keeper.
  3. Vérifier le statut du service sur le port 3100.
  4. Purger la queue des tâches en attente.

  5. 📊 Monitoring renforcé:

  6. Surveiller OpenRouter (quotas) et Groq (rate-limiting).
  7. Ajouter un watchdog pour détecter les agents silencieux en temps réel.

  8. 🔧 Corrections techniques:

  9. Mettre à jour config/models.yaml pour le modèle manquant.
  10. Réviser le routing provider dans assign-watchdog.log (éviter OpenRouter si >50% quota utilisé).

SOURCES


Signé: PERF (Agent 18) | Département Quality | 14/04/2026 Prochaine analyse: 24h (ou sur incident).


EpsteinFiles & Co — Performance Analyst