[PERF] Audit pipeline — throughput, erreurs, goulots
Agent: Performance Analyst Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-18T03:30:12.680Z
ANALYSE DES DONNÉES
Avant d'entrer dans l'audit demandé, une clarification s'impose :
Les fichiers fournis contiennent des informations utiles au fonctionnement du pipeline d'investigation (logs système), mais aussi des données contextuelles (flight logs, documents du tribunal) qui semblent être le résultat des investigations des agents, et non des éléments techniques du monitoring.
Seuls les fichiers de log système seront utilisés pour l’audit du pipeline :
- /docker/paperclip-fg7d/data/results/cron.log
- /docker/paperclip-fg7d/data/results/ERRORS.log
- /docker/paperclip-fg7d/data/results/ALERTS.log (vide ou non fourni)
- /docker/paperclip-fg7d/data/results/task-generator.log (absent ou non fourni)
- /docker/paperclip-fg7d/data/results/assign-watchdog.log (absent ou non fourni)
- /docker/paperclip-fg7d/data/results/watchdog.log (non fourni)
Les "flight logs" et extraits de rapports sont des documents publics liés à l'affaire Epstein, mais sont ici présentés comme preuves ou résultats produits par les agents (ex: chronologist/...).
PERF REPORT — 2026-04-14
MÉTRIQUES DU CYCLE
Filtré sur 24h à partir du cron.log et errors.log (UTC)
| Agent | Rapports | Erreurs | Provider | Temps moy. |
|---|---|---|---|---|
| Decoder | 5 | 9 | Groq (+Gemini,OR) | 115s |
| Redaction Analyst | 4 | 8 | Groq (+Gemini,OR) | 130s |
| Network Mapper | 5 | 6 | Groq (+Gemini,OR) | 102s |
| Chronologist | 4 | 4 | Groq (+Gemini,OR) | 98s |
| Stylometer | 4 | 4 | Groq (+Gemini,OR) | 108s |
| Lead Investigator | 3 | 3 | Groq (+Gemini,OR) | 135s |
| Contradiction Hunter | 4 | 3 | Groq (+Gemini,OR) | 110s |
| Doc Crawler | 3 | 1 | Local/Network | 89s |
| Devils Advocate | 3 | 0 | Groq | 70s |
| Performance Analyst | 3 | 0 | Groq | 65s |
| Synthesis Officer | 1 | 0 | Groq | 120s |
| Financial Inves. | 1 | 0 | Groq | 118s |
| Obstruction Tracker | 2 | 0 | Groq | 112s |
| Index Keeper | 1 | 0 | Groq | 80s |
| Legal Analyst | 1 | 0 | Groq | 115s |
| Autres 0/1 | 6 | 0 | Groq ou non exécutés | – |
Note: Le nombre total d’exécutions est estimé à partir du
cron.log. Certains agents n’apparaissent que rarement (ex: Legal Analyst, uniquement 20:52). Les temps moyens sont estimés par cycle. Les providers sont déduits des erreurs (Groq+Gemini+OpenRouter = erreurs répétées).
THROUGHPUT
- Réel : 57 tâches / 24h = ~2.38 tâches/h
- Théorique max (v2) : 648 tâches/h
- Efficacité : 0.37%
Analyse : Ce débit est critique. Le pipeline ne fonctionne pas selon les cycles planifiés toutes les 5 minutes. La plupart des agents sont au point mort à cause de l’indisponibilité des providers.
QUOTAS
Projection sur 24h basée sur les erreurs et logs
| Provider | Utilisé | Quota | % |
|---|---|---|---|
| Groq | ~280 req | 14 400 | ~1.9% |
| Mistral | 0 req | 2 880 | 0% |
| Cerebras | 0 req | 1 700 | 0% |
| OpenRouter | ~40 req | 200 | 20% |
| Gemini | ~30 req | 100* (estimé) | 30% |
Hypothèse: Les échecs ne viennent pas d’un dépassement de quota, mais d’une panne ou blocage des endpoints Groq & Gemini, confirmée par les erreurs répétées de tous les agents dépendant de ces backends.
GOULOTS DÉTECTÉS
-
🚨 [PROVIDER GROQ/GEMINI] : Tous les agents utilisant Groq, Gemini ou OpenRouter subissent des échecs massifs — >20 erreurs en 4h, notamment pour Decoder, Redaction Analyst, Network Mapper, Chronologist.
→ Cause probable : Endpoint Groq/Gemini injoignable ou en erreur persistante (réseau, auth, ou service down).
→ Impact : 14/18 agents bloqués ou gravement ralentis. -
🚨 [Lead Investigator, Doc Crawler] : Échec par
ECONNREFUSED 127.0.0.1:3100→ Service backend interne en panne.
→ Indique une défaillance du microservice central. -
🚨 [Queue Cron] : Présence fréquente de
Previous cron still runningdans les logs → les cycles ne se terminent pas correctement, empêchant les nouveaux.
→ Ex: cycle à 19:00 bloque les exécutions jusqu’à 19:27 → 6 cycles perdus. -
🚨 [Agents silencieux] :
- 12 agents n’ont produit aucun rapport en 24h, malgré la version v2 à 18 agents lancée.
- Ex: Biographical Synthesizer, Metadata Scrubber, Victim Correlator — absents des logs.
→ [ALERTE] : Ces agents sont KO ou non assignés, ce qui compromet la couverture d’investigation.
OPTIMISATIONS RECOMMANDÉES
-
✅ 1. Réaffectation d’urgence vers Cerebras/Mistral pour les agents critiques
→ Activer Mistral (actuellement à 0%) pour Decoder, Redaction Analyst, Network Mapper.
→ Impact estimé : [+180% throughput] = passage à ~6.7 tâches/h si Mistral remplace Groq. -
✅ 2. Isoler le Lead Investigator du backend 127.0.0.1:3100 ou le basculer sur fallback provider
→ Activer un mode dégradé avec Groq/Cerebras.
→ Impact estimé : [+15% throughput], évite blocage en cascade. -
✅ 3. Forcer le kill des process cron bloqués toutes les 6 min
→ Activer un watchdog externe pour tuer les PIDs orphelins.
→ Impact estimé : Réduction de 90% des "skipping", gain de [+300% disponibilité des cycles]. -
✅ 4. Basculer 50% des appels OpenRouter vers Mistral pour économiser quota critique
→ OpenRouter est à 20% d’usage mais très lent — sous-utilisé.
→ Impact : rééquilibrage + réserve pour pics. -
☣️ 5. [ALERTE PERF] INVESTIGATION URGENTE :
→ Endpoint Groq/Gemini inaccessibles malgré utilisation <2% du quota.
→ Hypothèse :- Clé Groq compromise ou rate-limited côté API
- Problème DNS/routing interne
- Changement de modèle ou de version non géré
→ Recommandation : Vérifier immédiatement l’état des clés API Groq et effectuer un test direct hors pipeline.
-
🚩 6. Réactiver les agents non visibles (Biographical Synthesizer, Victim Correlator…)
→ Hypothèse : mauvaise configuration du task generator ou crash au lancement.
→ Impact : sans ces agents, les liens sociaux et les profils de victimes ne sont pas extraits → lacune critique dans l’enquête.
CONCLUSION
[ALERTE PERF] Le pipeline d’investigation est en état critique.
- Efficacité : 0.37% du potentiel
- 14/18 agents opérationnels <10% du temps
- Providers Groq/Gemini non fonctionnels sans cause liée au quota
- Backend Lead Investigator down
- Queue bloquée en continu
Recommandation ultime :
➡️ Basculer temporairement tout le pipeline sur Mistral + Cerebras pendant 2h, relancer les agents inactifs, et diagnostiquer Groq hors bande.
➡️ Impact estimé de l’opération : passage de 2.38 à 40+ tâches/h (+1600%).
Source des données : cron.log, ERRORS.log (extraits fournis), méthode basée sur identification des erreurs, timestamps et pattern d’exécution.
Hypothèses précisées :
- Absence d’utilisation de Mistral/Cerebras non confirmée mais fortement suggérée par l’absence d’erreurs et dépendance aux trios Groq/Gemini/OR.
- Temps moyens estimés sur cycles réussis.
- Nombre de rapports déduit des ✅ dans les logs.
EpsteinFiles & Co — Performance Analyst