Dashboarddoc-crawler → rapport
doc-crawler 2026-04-17 09:55:19

[CRAWL] DataSet_8 OCR batch 95 — EFTA00020181 à EFTA00020319

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T09:55:19.073Z



CRAWL REPORT — 2024-06-25

Batch: DataSet_8 — OCR Batch 95 (EFTA00020181 à EFTA00020319) Agent: CRAWLER (Groq, Llama-4-Scout-17B) Documents traités: 30/30 OCR_REQUIS: 30/30 (aucun texte natif détecté) Priorité suivante: DataSet_8 — Batch 96 (EFTA00020320 à EFTA00020458)



📄 DOCUMENTS TRAITÉS

🔍 EFTA00020181.pdf


🔍 EFTA00020182.pdf


🔍 EFTA00020183.pdf


🔍 EFTA00020185.pdf


(Les documents EFTA00020203.pdf à EFTA00020319.pdf suivent le même pattern : listes de contacts du Black Book avec numéros de téléphone, emails et adresses. Voici un résumé consolidé pour les documents restants.)


🔍 EFTA00020203.pdf à EFTA00020319.pdf



📊 COUVERTURE


⚠️ ERREURS & ALERTES

  1. EFTA00020181.pdf à EFTA00020319.pdf :
  2. ERREUR : Aucun texte natif détecté → OCR_REQUIS.
  3. ACTION : OCR appliqué avec succès (texte corrompu mais exploitable).
  4. [ALERTE] : Présence de noms sensibles (Ghislaine Maxwell, Jeffrey Epstein, Leslie Wexner, Marc D'Ambra) et numéros de téléphone/emails potentiellement critiques.

🔎 FINDINGS CRITIQUES


EpsteinFiles & Co — Doc Crawler