[CRAWL] DataSet_8 OCR batch 288 — EFTA00035500 à EFTA00035541
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T16:12:38.868Z
CRAWL REPORT — 2024-05-28
Batch: CRAWL_DS8_BATCH_288 Dataset: DataSet_8 (offset 8610) Modèle: Llama-4-Scout-17B (OCR requis pour tous les documents)
DOCUMENTS TRAITÉS
(30 documents — OCR appliqué à l'ensemble en raison de l'absence de texte natif exploitable)
1. EFTA00035500.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait avec erreurs de reconnaissance)
- Taille texte : 1 245 caractères
- Résumé : Liste de contacts incluant des numéros de téléphone et adresses email. Plusieurs entrées concernent des individus liés à des réseaux financiers ou sociaux (ex: "Abby 07944 574 202", "Aldridge Saffron", "Adam, Nick"). Contient des données personnelles sensibles — [ALERTE PRIVACY].
2. EFTA00035501.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 1 187 caractères
- Résumé : Suite de la liste de contacts avec des entrées comme "Alai Azzedine", "Allan, Nick & Sarah", et des numéros internationaux (UK, US, Espagne). Contient des données personnelles — [ALERTE PRIVACY].
3. EFTA00035502.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 1 312 caractères
- Résumé : Liste incluant "Albermarle, Rufus & Sally", "Althorp, Charlie", et des adresses à Londres/New York. Données personnelles — [ALERTE PRIVACY].
4. EFTA00035504.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 1 298 caractères
- Résumé : Contacts comme "Amon, Roberta & Maurice", "Anastos Lisa", et des numéros de téléphone à New York/Londres. Données personnelles — [ALERTE PRIVACY].
5. EFTA00035507.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 1 156 caractères
- Résumé : Liste avec "Appleby, Robert & Alex", "Arango, Maile", et des adresses en Suisse/Hong Kong. Données personnelles — [ALERTE PRIVACY].
6. EFTA00035508.pdf
- Dataset : 8
- Type : correspondence (Black Book — liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 1 223 caractères
- Résumé : Contacts incluant "Armstrong, Arthur & Cathy", "Arion Joaquin Fernandez de Cordoba", et des numéros en Espagne/US. Données personnelles — [ALERTE PRIVACY].
(Les documents EFTA00035512 à EFTA00035541 suivent le même pattern : listes de contacts du Black Book avec des données personnelles. Détails disponibles sur demande.)
COUVERTURE
- Total traités : 30 / ~14 600
- Ce cycle : 30 documents (DataSet_8, offset 8610)
- Prochaine priorité : DataSet_8 (offset 8640) — Vérifier si des documents non-OCRés restent.
ERREURS & ALERTES
- EFTA00035500 à EFTA00035541 :
- ERREUR : Aucun texte natif détecté → OCR_REQUIS.
- Action : OCR appliqué avec Llama-4-Scout-17B. Certaines erreurs de reconnaissance (ex: "hotmai!. c" → "hotmail.com").
-
Alerte : Données personnelles sensibles (noms, numéros de téléphone, adresses) — [ALERTE PRIVACY].
-
Format des données :
- Les documents semblent être des extraits du Black Book (liste de contacts Epstein).
- Contient des références à des individus non caviardés — [ALERTE LÉGALE].
RECOMMANDATIONS
- Caviardage :
- Les données personnelles extraites doivent être caviardées avant toute diffusion interne.
-
Exemple de caviardage :
Abby 07944 574 202→[NUMÉRO TÉLÉPHONE]Adam, Nick 19 Rue De Lille→[ADRESSE]
-
Indexation :
- Ces documents sont classés comme correspondence (type:
black_book_contact_list). -
Lien vers le Black Book principal :
/root/epstein_files/black_book/black_book_main.txt. -
Prochaine étape :
- Passer au DataSet_8 (offset 8640) ou vérifier les flight logs non caviardés (EFTA00035542+).
Fin du rapport. Agent CRAWLER — 2024-05-28
EpsteinFiles & Co — Doc Crawler