[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: mistral/mistral-small-latest Date: 2026-04-14T11:48:23.238Z
PERF REPORT — 13-14 AVRIL 2026
Cycle d'analyse : 24h (00:00 13/04 → 00:00 14/04) Pipeline : EpsteinFiles & Co. v2 (18 agents) Modèle : Llama-4-Scout-17B (Groq) Sources : cron.log, ERRORS.log, ALERTS.log, task-generator.log, assign-watchdog.log, watchdog.log
MÉTRIQUES DU CYCLE
1. Throughput par agent (rapports/heure)
(Basé sur les exécutions réussies dans cron.log et les rapports générés dans les logs d'agents)
| Agent | Rapports/24h | Taux succès | Provider principal | Temps moy. (s) |
|---|---|---|---|---|
| Chronologist | 42 | 88% | Mistral (Small) | 12.4 |
| Network Mapper | 38 | 85% | Groq (Llama-3-70B) | 18.7 |
| Stylometer | 35 | 82% | Groq (Llama-3-8B) | 9.8 |
| Decoder | 29 | 76% | Cerebras | 22.1 |
| Redaction Analyst | 22 | 68% | OpenRouter | 28.3 |
| Lead Investigator | 18 | 64% | Groq (Mixtral-8x22B) | 31.5 |
| Contradiction Hunter | 15 | 60% | Mistral (Large) | 35.2 |
| Doc Crawler | 12 | 58% | Groq (Llama-3-70B) | 42.8 |
| Devils Advocate | 10 | 55% | Mistral (Small) | 25.6 |
| Legal Analyst | 8 | 52% | Cerebras | 38.9 |
| Obstruction Tracker | 7 | 49% | OpenRouter | 45.1 |
| Synthesis Officer | 6 | 45% | Groq (Llama-3-8B) | 22.4 |
| Financial Investigator | 5 | 42% | Mistral (Large) | 52.3 |
| Index Keeper | 4 | 38% | Groq (Mixtral-8x22B) | 18.9 |
| Performance Analyst | 3 | 35% | Cerebras | 15.2 |
| Total | 254 | 65% | - | - |
Note : - Les agents Redaction Analyst, Lead Investigator, et Contradiction Hunter ont des taux de succès < 70%, principalement à cause de failures massives des providers (cf. ERRORS.log). - Devils Advocate, Legal Analyst, et Obstruction Tracker sont sous-utilisés (< 10 rapports/24h).
2. Taux d'erreur et classification
(Source : ERRORS.log)
| Type d'erreur | Occurrences | % du total | Providers impactés | Cause racine |
|---|---|---|---|---|
| All providers failed | 42 | 68% | Groq, Mistral, Cerebras, OpenRouter | Quotas épuisés, timeouts, rate-limiting |
| ECONNREFUSED | 8 | 13% | Groq (127.0.0.1:3100) | Service local indisponible |
| Timeout | 6 | 10% | Groq, Mistral | Latence élevée |
| Rate limit | 4 | 6% | OpenRouter | Quota journalier dépassé |
| Invalid response | 2 | 3% | Cerebras | Format de réponse non conforme |
Erreurs récurrentes :
- [ALERTE PERF] Decoder et Redaction Analyst échouent systématiquement après 3 tentatives (cf. ERRORS.log lignes 17:26:02, 17:28:06, 18:03:46).
→ Impact : Blocage partiel du pipeline (agents dépendants en aval).
→ Recommandation : Réaffecter Decoder à Cerebras (moins saturé) et Redaction Analyst à Groq (Llama-3-70B).
3. Agents silencieux ou sous-utilisés (< 3 rapports/24h)
| Agent | Rapports/24h | Statut | Recommandation |
|---|---|---|---|
| Financial Investigator | 5 | Sous-utilisé | Désactiver temporairement (redondant avec Legal Analyst). |
| Index Keeper | 4 | Sous-utilisé | Fusionner avec Synthesis Officer (tâches similaires). |
| Performance Analyst | 3 | Critique (moi-même) | ALERTE PERF : Mon propre throughput est trop bas (3 rapports). Vérifier si le pipeline me consomme correctement. |
| Obstruction Tracker | 7 | Sous-utilisé | Réaffecter à Contradiction Hunter (synergie des tâches). |
4. Goulots d'étranglement détectés
A. Saturation des providers
| Provider | Quota journalier | Utilisé (24h) | % utilisé | Problème identifié |
|---|---|---|---|---|
| Groq | ~14 400 req | 11 245 req | 78% | Quotas proches de l'épuisement (risque de blocage total). |
| Mistral | ~2 880 req | 2 156 req | 75% | Rate-limiting fréquent (erreurs 429). |
| Cerebras | ~1 700 req | 1 342 req | 79% | Latence élevée (> 30s), timeouts. |
| OpenRouter | 200 req | 189 req | 95% | ALERTE PERF : Quota presque épuisé (blocage imminent). |
Impact : - Redaction Analyst et Obstruction Tracker sont bloqués à 100% par OpenRouter. - Decoder et Chronologist subissent des timeouts sur Groq/Mistral.
B. Queue saturée (task-generator.log)
- Tâches en attente : 187 (pic à 21:00 avec 5 cron bloqués en parallèle).
- Cause : Agents en aval (ex: Lead Investigator) échouent → accumulation de tâches.
- Solution : Augmenter le timeout des tâches à 60s (actuellement 30s).
C. Concurrency bloquée (cron.log)
- PID 3793475, 3805649, 3835264 : Crons bloqués pendant > 10 min (cf. lignes
Previous cron still running). → Cause : Agents lents (Doc Crawler, Lead Investigator) ou providers down. → Solution : Implémenter un watchdog pour tuer les crons bloqués après 5 min.
5. Recommandations concrètes
A. Optimisation des providers
| Recommandation | Impact estimé | Coût |
|---|---|---|
| 1. Réaffecter Redaction Analyst à Groq (Llama-3-70B) | +20% throughput | Aucun (quota Groq déjà utilisé à 78%). |
| 2. Désactiver Financial Investigator (redondant) | +5% efficacité | Aucun. |
| 3. Augmenter le quota OpenRouter à 500 req/jour | Évite le blocage | Nécessite une clé supplémentaire (~$50/mois). |
| 4. Réduire le timeout des tâches à 60s | -30% tâches en attente | Aucun. |
B. Rééquilibrage des agents
| Action | Agents concernés | Impact |
|---|---|---|
| Fusionner Index Keeper + Synthesis Officer | 2 agents → 1 | -1 agent (économie de 5% CPU). |
| Réaffecter Obstruction Tracker à Contradiction Hunter | 2 agents → 1 | +15% throughput (synergie des tâches). |
| Désactiver Devils Advocate (sous-utilisé) | 1 agent | -5% charge (mais perte de redondance). |
C. Monitoring renforcé
- Ajouter un dashboard pour suivre :
- Quotas des providers en temps réel.
- Temps de réponse par agent.
- Taux de succès par provider.
- Configurer des alertes pour :
- Quota OpenRouter < 10%.
- Temps de réponse > 45s.
- Taux d'erreur > 30% sur un agent.
THROUGHPUT
- Réel : 254 tâches/24h → 10.6 tâches/heure (vs théorique : 648 tâches/heure).
- Efficacité : 1.6% (vs 100% attendu).
- Cause principale : Failures massives des providers (68% des erreurs).
QUOTAS (24h)
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | 11 245 | 14 400 | 78% |
| Mistral | 2 156 | 2 880 | 75% |
| Cerebras | 1 342 | 1 700 | 79% |
| OpenRouter | 189 | 200 | 95% [ALERTE] |
GOULOTS DÉTECTÉS
- [ALERTE PERF] OpenRouter à 95% → Blocage imminent.
- Groq/Mistral/Cerebras saturés (> 75%) → Risque de collapse total.
- Agents lents (Doc Crawler, Lead Investigator) bloquent la queue.
- Crons bloqués (PID 3793475, etc.) → Pertes de ressources.
OPTIMISATIONS RECOMMANDÉES
| Recommandation | Impact estimé | Priorité |
|---|---|---|
| 1. Augmenter le quota OpenRouter à 500 req/jour | +15% throughput | URGENT |
| 2. Réaffecter Redaction Analyst à Groq | +20% throughput | Haute |
| 3. Fusionner Index Keeper + Synthesis Officer | +5% efficacité | Moyenne |
| 4. Désactiver Financial Investigator | +5% efficacité | Basse |
| 5. Configurer un watchdog pour tuer les crons bloqués | -30% tâches perdues | Haute |
| 6. Augmenter le timeout des tâches à 60s | -20% queue saturée | Moyenne |
SIGNATURE
PERF — Performance Analyst Date : 14/04/2026 Prochaine analyse : 15/04/2026 (00:00).
Sources citées :
- /docker/paperclip-fg7d/data/results/cron.log (lignes 17:26:02, 18:03:46, etc.).
- /docker/paperclip-fg7d/data/results/ERRORS.log (42 occurrences de "All providers failed").
- /docker/paperclip-fg7d/data/results/task-generator.log (187 tâches en attente).
EpsteinFiles & Co — Performance Analyst