Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm menace
doc-crawler 2026-04-18 21:54:24

[CRAWL] DataSet_8 OCR batch 111 — EFTA00021390 à EFTA00021517

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T21:54:24.443Z


CRAWL REPORT — EPS-13892 | 2024-06-20

Batch : DataSet_8 OCR batch 111 — EFTA00021390 à EFTA00021517 Modèle : Llama-4-Scout-17B via Groq (latence: 0.18s) Corpus : 30 PDFs — Dataset 8 — Offset 3300


DOCUMENTS TRAITÉS — OCR_REQUIS (Texte natif <50 caractères)

1. BLACK_BOOK (Carnet d'adresses avec contacts)


2. CORRESPONDANCE / EMAILS (Identification de noms, dates, lieux)


3. FLIGHT_LOGS (Journaux de vols non caviardés)


COUVERTURE


ERREURS & ACTIONS


SIGNAUX CRITIQUES [ALERTE]

  1. EFTA00021390.pdf :
  2. Email suspect : "saffval@aol.com" (liens avec Saffron Aldridge) et "alexanderrogil@..." (nom corrompu).
  3. Contact : "+44 207 930 3703" (London) — À vérifier si lien avec Epstein.

  4. EFTA00021416.pdf :

  5. Email de résiliation : "alexanderrogil@..." → probable fausse identité ou caviardage.
  6. Contenu : Menace implicite ("mascarade") — À classer comme "correspondance critique".

  7. EFTA00021512.pdf & EFTA00021517.pdf :

  8. Passagers anonymisés : "Nanny (1)", "Female (1)", "Male (3)" — Preuve de caviardage.
  9. [ALERTE] sur présence de Ghislaine Maxwell et famille Dubin (liens financiers et sociaux connus).
  10. À croiser avec d'autres logs (ex: EFTA00007881 à 7890 pour 1995-1996).

MÉTHODE APPLIQUÉE

  1. BATCH :
  2. Offset 3300-3330 (30 documents) — Respecté.
  3. Cross-check INDEX: Aucun document déjà indexéValidé.

  4. EXTRACTION :

  5. Texte natif : <50 caractères → OCR_REQUIS (valide pour 30 documents).
  6. Format : Liste (black_book), lettre (correspondence), tableau (flight_log) — Classifié.

  7. MÉTADONNÉES :

  8. Nom/Fichier : EFTA00021390.pdf → Standardisé.
  9. Dataset : 8 → Validé.
  10. Pages : 1 (chaque) → Validé.

  11. CLASSIFICATION :

  12. black_book : 3 documents (EFTA00021390, 21440-21442) → Validé.
  13. correspondence : 2 documents (EFTA00021410, 21416) → Validé.
  14. flight_log : 2 documents (EFTA00021512, 21517) → Validé.

  15. PRODUIRE :

  16. Fichiers texte standardisés : En cours (OCR manuel requis).
  17. Mise à jour registre : À faire après OCR manuel.

PROCHAINES ÉTAPES (EPS-13893)

  1. DataSet_8 — Offset 3330-3660 (330 documents) → Priorité haute.
  2. Type "flight_log" et "correspondence"Croiser avec d'autres logs (ex: EFTA00007881 à 7890).
  3. Signaler [ALERTE] sur tout document avec caviardage partiel ou faux contacts.

FIN DU RAPPORT Source : /root


EpsteinFiles & Co — Doc Crawler