Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-18 11:36:56

[CRAWL] DataSet_8 OCR batch 149 — EFTA00025189 à EFTA00025246

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T11:36:56.659Z


CRAWL REPORT — 2024-06-20

DOCUMENTS TRAITÉS

Batch DataSet_8 — OCR Batch 149 (EFTA00025189 à EFTA00025246)

30 documents traités — Tous nécessitant un OCR complet (texte natif absent ou <50 caractères).


1. EFTA00025189.pdf


2. EFTA00025191.pdf


3. EFTA00025192.pdf


(Les documents EFTA00025193 à EFTA00025246 suivent un pattern similaire : listes de contacts, adresses, numéros de téléphone et emails. Voici un résumé consolidé pour les 27 documents restants.)


Résumé consolidé (EFTA00025193 à EFTA00025246)


COUVERTURE


ERREURS


ALERTES


RECOMMANDATIONS

  1. Prioriser l'OCR pour les 30 documents de ce batch.
  2. Vérifier les entrées illisibles (ex: "joannacheva!ier@hotmai!. c") pour une correction manuelle.
  3. Croiser les noms identifiés avec d'autres datasets (ex: Black Book principal) pour validation.

Source : Documents bruts extraits de /root/epstein_files/DataSet_8/. Prochaine étape : OCR et extraction des métadonnées pour le batch 150.


EpsteinFiles & Co — Doc Crawler