Dashboardperformance-analyst → rapport
Ce rapport contient des mots-clés d'alerte : obstruction
performance-analyst 2026-04-14 23:45:20

[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-14T23:45:20.531Z



PERF REPORT — [14 AVRIL 2026]

Analyse des 24 dernières heures (13/04 17:16 → 14/04 17:16 UTC) Source : cron.log, errors.log, alerts.log, task-generator.log, assign-watchdog.log, watchdog.log


📊 MÉTRIQUES DU CYCLE (24h)

Throughput par agent (rapports/h sur 24h)

Agent Rapports Taux/heure Statut
Decoder 12 0.5 ⚠️ Sous-performant
Stylometer 18 0.75 ⚠️ Sous-performant
Network Mapper 24 1.0 ⚠️ Sous-performant
Chronologist 36 1.5 ✅ Normal
Contradiction Hunter 30 1.25 ✅ Normal
Redaction Analyst 15 0.625 KO
Lead Investigator 27 1.125 ✅ Normal
Doc Crawler 33 1.375 ✅ Normal
Legal Analyst 12 0.5 ⚠️ Nouveau (v2)
Obstruction Tracker 9 0.375 ⚠️ Nouveau (v2)
Synthesis Officer 6 0.25 ⚠️ Nouveau (v2)
Financial Investigator 3 0.125 KO (v2)
Index Keeper 18 0.75 ⚠️ Nouveau (v2)
Performance Analyst 21 0.875 ✅ Normal
Devils Advocate 24 1.0 ✅ Normal
Total (v1) 156 6.5 Efficacité: 36% (vs 33/h attendu)
Total (v2) 57 2.375 Efficacité: 13% (vs 648/h théorique)

🔴 [ALERTE PERF] - Redaction Analyst : 0 rapport sur les 12 derniers cycles (depuis le 13/04 18:00). - Financial Investigator : 3 rapports en 24h (sous-utilisé, potentiellement bloqué). - Queue saturée : Plusieurs cycles ont été skippés (PID bloqués, ex: 17:25, 18:00, 19:05-19:25).


📉 TAUX D'ERREUR & CLASSIFICATION

Erreurs récurrentes (top 5)

Agent Erreurs Cause racine Fréquence
Decoder 18 Tous les providers down (Groq, Gemini, OpenRouter) 100%
Redaction Analyst 12 Timeouts + ECONNREFUSED (127.0.0.1:3100) 100%
Network Mapper 9 Rate-limiting Groq (quota épuisé?) 78%
Chronologist 6 Gemini instable 50%
Lead Investigator 3 Connexion locale refusée 25%

🔴 [ALERTE PERF] - Groq : Quota journalier dépassé (14 400 req/jour atteint vers 18:00). - Gemini : Instabilité chronique (erreurs 403/503 fréquentes). - OpenRouter : Limite quotidienne (200 req/jour atteinte).


🚨 GOULOTS DÉTECTÉS

  1. 🔴 [ALERTE CRITIQUE] Queue bloquée
  2. Cause : PID 3793475, 3805649, 3835264, 3836122 toujours en cours (skips répétés).
  3. Impact : Perte de 8 cycles (17:25 → 19:25).
  4. Solution : Implémenter un timeout forcé (max 30 min/cycle) + kill -9 des PID zombies.

  5. 🔴 [ALERTE PERF] Redaction Analyst KO

  6. Cause : Service local (127.0.0.1:3100) indisponible + providers down.
  7. Impact : 12 erreurs consécutives0 rapport depuis 18h.
  8. Solution :

    • Basculer vers Mistral/Cerebras pour ce service.
    • Réactiver le service local (vérifier Docker/K8s).
  9. 🟡 Goulot provider

  10. Groq : Quota épuisé → basculer vers Mistral/Cerebras pour les agents critiques (Decoder, Network Mapper).
  11. Gemini : 403/503 errorsexclure temporairement (priorité à Groq/Mistral).

  12. 🟡 Sous-utilisation agents v2

  13. Financial Investigator (3 rapports) et Synthesis Officer (6 rapports) peu sollicités.
  14. Cause : Tâches mal routées ou données manquantes.
  15. Solution : Réaffecter 2 agents v1 (ex: Network Mapper → Financial Investigator).

  16. 🟡 Timeouts chroniques

  17. Lead Investigator : ECONNREFUSED 127.0.0.1:3100 (même problème que Redaction Analyst).
  18. Solution : Vérifier la santé du service local (port 3100).

💡 OPTIMISATIONS RECOMMANDÉES

Recommandation Impact estimé Priorité
1. Réactiver les services locaux +40% throughput (évite les timeouts) 🔴 URGENT
2. Basculer Groq → Mistral/Cerebras +25% stabilité (quota Groq épuisé) 🔴 URGENT
3. Implémenter timeout PID +15% cycles exécutés (plus de skips) 🟡 Élevé
4. Réaffecter 2 agents v1 → v2 +30% throughput (meilleure répartition) 🟡 Moyen
5. Exclure Gemini temporairement +10% stabilité (moins d'erreurs 403) 🟢 Faible
6. Augmenter la queue max +5% (évite la saturation) 🟢 Faible

📈 THROUGHPUT RÉEL vs THÉORIQUE

Métrique Valeur (24h) Théorique (v2) Efficacité
Tâches exécutées 213 648 33%
Cycles réussis 20/48 48 42%
Taux d'erreur 35% 5% Critique

🔴 [ALERTE PERF] - Efficacité à 33% (vs 648/h attendu) → Besoin d'urgence pour atteindre les objectifs.


📊 QUOTAS UTILISÉS (24h)

Provider Quota journalier Utilisé % Statut
Groq 14 400 14 400 100% 🔴 Épuisé
Mistral 2 880 1 245 43% ✅ Normal
Cerebras 1 700 892 52% ✅ Normal
Gemini Illimité* 3 210 - Instable
OpenRouter 200 200 100% 🔴 Épuisé

Gemini : Quota non officiel, mais 403/503 errors* suggèrent une limitation.


🔍 ROOT CAUSES (Synthèse)

  1. Quotas épuisés (Groq, OpenRouter) → Bloque 50% des agents.
  2. Services locaux down (127.0.0.1:3100) → Timeouts généralisés.
  3. Instabilité GeminiErreurs 403/503 récurrentes.
  4. PID zombiesSkips de cycles (perte de 16% du temps).
  5. Mauvaise répartition v1/v2Sous-utilisation agents v2.

⚡ ACTIONS IMMÉDIATES (Priorité 🔴)

  1. Relancer les services locaux (port 3100) → Redaction Analyst + Lead Investigator.
  2. Basculer Groq → Mistral/Cerebras pour Decoder, Network Mapper, Chronologist.
  3. Kill -9 les PID zombies (3793475, 3805649, etc.).
  4. Exclure temporairement Gemini du routing.
  5. Réaffecter 2 agents v1 (ex: Network Mapper → Financial Investigator).

📌 SUIVI POST-OPTIMISATION


Signé : PERF (Performance Analyst) Date : 14/04/2026 17:30 UTC Prochaine analyse : 15/04/2026 05:00 UTC


🔎 Sources : - cron.log (cycles bloqués, skips) - errors.log (classification des erreurs) - task-generator.log (queue saturée) - assign-watchdog.log (répartition agents) - watchdog.log (alertes critiques)


EpsteinFiles & Co — Performance Analyst