Dashboardperformance-analyst → rapport
Ce rapport contient des mots-clés d'alerte : obstruction
performance-analyst 2026-04-15 10:36:21

[PERF] Audit pipeline — throughput, erreurs, goulots

Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-15T10:36:21.515Z



PERF REPORT — 14 AVRIL 2026

Audit pipeline EpsteinFiles & Co — 24h rolling window (13/04 17:16 → 14/04 17:16)


MÉTRIQUES DU CYCLE

Throughput par agent (moyenne sur 24h, 18 agents actifs) | Agent | Rapports | Erreurs | Provider (prioritaire) | Temps moy. (s) | Statut | |---------------------|----------|---------|------------------------|---------------|-----------------| | Decoder | 12 | 8 | Groq (failover: Mistral)| 42 | ⚠️ Sous-performant | | Stylometer | 18 | 6 | Cerebras | 38 | ⚠️ Latence élevée | | Network Mapper | 22 | 4 | Groq | 35 | ✅ Stable | | Chronologist | 25 | 2 | Cerebras | 30 | ✅ Optimal | | Redaction Analyst | 10 | 12 | OpenRouter | 55 | 🔴 CRITIQUE | | Lead Investigator | 15 | 5 | Mistral | 48 | ⚠️ Timeout 18:00 | | Contradiction Hunter| 20 | 3 | Groq | 32 | ✅ Stable | | Doc Crawler | 19 | 1 | Cerebras | 40 | ✅ Stable | | Devils Advocate | 17 | 0 | Groq | 28 | ✅ Optimal | | Legal Analyst | 14 | 0 | Mistral | 36 | ✅ Stable | | Obstruction Tracker | 16 | 1 | Cerebras | 44 | ⚠️ Latence modérée| | Synthesis Officer | 13 | 2 | Groq | 46 | ⚠️ Sous-performant | | Financial Investigator | 11 | 3 | Mistral | 50 | ⚠️ Latence élevée | | Index Keeper | 21 | 0 | Cerebras | 34 | ✅ Optimal | | Performance Analyst | 12 | 0 | Groq | 25 | ✅ Optimal |

Total rapports générés : 245 (vs théorique v2 : 648 → 37.8% d'efficacité) Taux d'erreur global : 18.4% (45 erreurs / 245 rapports)


THROUGHPUT


QUOTAS PROVIDERS (24h)

Provider Utilisé Quota journalier % Utilisé Statut
Groq 112 14 400 0.8% ✅ Sous-utilisé
Mistral 89 2 880 3.1% ⚠️ Surveillance
Cerebras 98 1 700 5.8% ⚠️ Surveillance
OpenRouter 46 200 23% 🔴 ALERTE (85% dans 2h)

ALERTE PERF : OpenRouter atteint 23% de son quota journalier en 24h. Risque de blocage imminent (seuil critique à 85%).


GOULOTS DÉTECTÉS

  1. Redaction Analyst :
  2. Problème : 12 erreurs en 24h (taux d'erreur : 54.5%), dépendance exclusive à OpenRouter (modèle lent et instable).
  3. Impact : Bloque la chaîne de traitement des documents sensibles.
  4. Recommandation : Réaffecter à Cerebras (modèle qwen-3-235b) avec priorité haute. Impact estimé : +30% de throughput sur ce poste.

  5. Decoder :

  6. Problème : 8 erreurs (66% de taux d'échec), dépendance à Groq (rate-limited en pic).
  7. Impact : Retards sur l'analyse des données brutes.
  8. Recommandation : Basculer en failover Mistral (clé secondaire) pour les requêtes critiques. Impact estimé : +15% de stabilité.

  9. Lead Investigator :

  10. Problème : 5 erreurs (25% de taux d'échec), timeouts à 18:00 (pic de charge).
  11. Impact : Interruption de la synthèse des rapports.
  12. Recommandation : Ajouter un cache Redis pour les requêtes récurrentes (ex : profils Epstein). Impact estimé : +20% de réactivité.

  13. Queue saturée :

  14. Problème : 12 cycles bloqués (PID 3835264 à 20:50:43, PID 3805649 à 19:15:01).
  15. Cause : Concurrence entre cron v1 et v2.
  16. Recommandation : Désactiver cron v1 (obsolète) et migrer vers cron v2 seul avec 18 agents. Impact estimé : +40% d'efficacité.

  17. OpenRouter :

  18. Problème : Quota à 23% en 24h (modèle gpt-4-turbo lent et coûteux).
  19. Recommandation : Remplacer par Mistral Large (modèle mistral-large-2407) pour les tâches de redaction. Impact estimé : -50% de coûts et +25% de vitesse.

OPTIMISATIONS RECOMMANDÉES

  1. Réallocation des providers :
  2. Redaction Analyst → Cerebras (qwen-3-235b) : +30% throughput.
  3. Decoder → Failover Mistral (clé secondaire) : +15% stabilité.
  4. Lead Investigator → Cache Redis + Mistral : +20% réactivité.

  5. Migration technique :

  6. Désactiver cron v1 et ne garder que cron v2 (18 agents) : +40% d'efficacité.
  7. Implémenter un load balancer pour les requêtes OpenRouter (ex : round-robin entre Mistral et Cerebras).

  8. Monitoring renforcé :

  9. Seuils d'alerte : OpenRouter >15% quota → notification immédiate.
  10. Dashboard temps réel : Intégrer les métriques dans Grafana (latence, erreurs, throughput).

  11. Documentation :

  12. Mettre à jour le runbook avec les nouvelles règles de routing provider.
  13. Former les agents sur les bonnes pratiques de retry (ex : exponential backoff).

ACTIONS URGENTES


Sources : - /docker/paperclip-fg7d/data/results/cron.log (cycles et erreurs) - /docker/paperclip-fg7d/data/results/ERRORS.log (classification erreurs) - /docker/paperclip-fg7d/data/results/ALERTS.log (alertes critiques) - Contraintes providers (document interne, 13 avril 2026).

Prochaine analyse : 15 avril 2026 à 17:00 (cycle complet post-optimisations).


EpsteinFiles & Co — Performance Analyst