Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 14:31:40
[CRAWL] DataSet_8 OCR batch 212 — EFTA00030550 à EFTA00030601
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T14:31:40.173Z
CRAWL REPORT — 2024-05-30
Batch ID: EPS-8428 | DataSet: 8 | Cycle: Batch 212 (EFTA00030550 à EFTA00030601)
📌 DOCUMENTS TRAITÉS
1. EFTA00030550.pdf
- Dataset : 8
- Type : black_book (carnet d'adresses/réseau)
- Pages : 1 (texte brut, non structuré)
- Qualité texte : BONNE (extraction native, texte clair)
- Taille texte : ~1 250 caractères
- Résumé : Le document contient une liste de contacts avec noms, numéros de téléphone (UK, US, Espagne, etc.), adresses email et annotations diverses. Plusieurs noms sont associés à des entreprises (ex: S&S Capital, Alphair Asset Management), des résidences (ex: 5 Eaton Place, Old Park) ou des fonctions (ex: scheduler, director). Exemple : "Abby 07944 574 202", "Aldridge Saffron", "Adam, Nick 19 Rue De Lille". Note : Plusieurs numéros semblent incomplets ou mal formatés (ex: "0603 338 787").
2. EFTA00030551.pdf
- Dataset : 8
- Type : black_book (carnet d'adresses)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 800 caractères
- Résumé : Liste similaire à EFTA00030550, avec des contacts supplémentaires comme "Alain Azzedine", "Allan Paul", ou "Althorp, Charlie". Plusieurs entrées incluent des annotations comme "(h)" (home), "(w)" (work), ou "(p)" (portable). Exemple : "Alai Azzedine 001 206 355 5777 Email: paul@vulcan.com". Alerte : Un numéro est partiellement masqué ("00 331 4272 1$19"), suggérant une possible censure.
3. EFTA00030552.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 500 caractères
- Résumé : Contient des contacts avec des adresses à Londres ("34 Eaton Place"), New York ("511 6th Ave"), et des annotations comme "(pl)" (possible "private line"). Exemple : "Albermarle, Rufus & Sally 511 6th Ave P.O. box 394 New York, NY 10011 1212465 9867{w)". Note : Plusieurs numéros sont tronqués (ex: "001 212 s 9 77").
4. EFTA00030557.pdf
- Dataset : 8
- Type : correspondence (email/lettre)
- Pages : 2
- Qualité texte : MOYENNE (texte natif partiellement illisible, OCR partiel nécessaire)
- Taille texte : ~800 caractères
- Résumé : Document structuré comme un email ou une lettre, avec en-tête "From:", "To:", et corps de texte. Contient des références à des transactions financières ("USD $19.84") et des noms comme "Jeffrey E Epstein". Alerte : Le texte est partiellement corrompu (ex: "FedEx Tax ID. JEFFREY E EPS- EIN 457 MADISON AVE"). Action : OCR_REQUIS pour clarification.
5. EFTA00030560.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1
- Qualité texte : BONNE (extraction native)
- Taille texte : ~2 200 caractères
- Résumé :
Liste de vols avec détails : Date, Aircraft Model, Tail #, Passagers, Départ/Arrivée.
Exemple :
781 Pass 1 | 35024-G-1159B-N908JE-TEB-PBI-781-Pass 1 | Je Epstein | West Palm Beach → Teterboro 781 Pass 3 | 35024-G-1159B-N908JE-TEB-PBI-781-Pass 3 | Eva Dubin | West Palm Beach → TeterboroNote : Plusieurs entrées incluent des passagers comme "Glenn Dubin", "Celina Dubin", ou des numéros de siège ("Pass 5").
6. EFTA00030561.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~2 000 caractères
- Résumé :
Suite du journal de bord, avec des vols supplémentaires comme :
782 Pass 1 | Ghislaine Maxwell | West Palm Beach → Teterboro 782 Pass 4 | Alan Greenberg | West Palm Beach → TeterboroAlerte : Présence de "Female (1)" et "Nanny (1)" dans les passagers, suggérant des vols avec des mineures ou du personnel non identifié.
7. EFTA00030562.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 800 caractères
- Résumé : Contient des vols avec des passagers comme "Sophie Biddle" et des trajets comme "Columbus, OH → West Palm Beach". Note : Plusieurs entrées sont marquées "No" (ex: "Pass 3 | Male (3) | ? | No").
8. EFTA00030563.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 3
- Qualité texte : MOYENNE (texte natif partiellement illisible)
- Taille texte : ~1 200 caractères
- Résumé : Document du FBI mentionnant une interview de "victime mineure" liée à Jeffrey Epstein. Contient des détails sur des voyages, des paiements ("$200-$1000"), et des noms comme "Ghislaine Maxwell". Alerte : Le texte est partiellement corrompu (ex: "FBI Miami believes [VICTIM] was working at a local resort..."). Action : OCR_REQUIS pour extraction complète.
9. EFTA00030564.pdf
- Dataset : 8
- Type : financial_record (relevé financier)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~900 caractères
- Résumé :
Relevé FedEx avec détails de transaction :
Invoice Number: [REDACTED] Account Number: [REDACTED] Transportation Charge: USD $16.00 Fuel Surcharge: USD $2.56 Total: USD $19.84Adresse : "JEFFREY E EPSTEIN 457 MADISON AVE NEW YORK NY 10022-6843". Note : Le document est daté "Picked up Oct 07, 2002".
10. EFTA00030565.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~2 100 caractères
- Résumé :
Journal de bord avec des vols comme :
783 Pass 1 | Je Epstein | Teterboro → Columbus 783 Pass 2 | Sophie Biddle | Teterboro → ColumbusNote : Plusieurs entrées incluent des passagers non identifiés ("Male (3)").
11. EFTA00030566.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 900 caractères
- Résumé : Suite des logs de vol avec des trajets comme "Columbus → West Palm Beach" et des passagers comme "Glenn Dubin".
12. EFTA00030567.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~2 000 caractères
- Résumé : Contient des vols avec des passagers comme "Celina Dubin" et des annotations comme "(pl)".
13. EFTA00030569.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 700 caractères
- Résumé :
Journal de bord avec des vols comme :
784 Pass 1 | Je Epstein | Columbus → West Palm BeachNote : Plusieurs entrées sont marquées "No" (ex: "Pass 2 | ? | No").
14. EFTA00030579.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 2
- Qualité texte : MOYENNE (texte natif partiellement illisible)
- Taille texte : ~700 caractères
- Résumé : Email ou lettre avec en-tête "From:" et "To:", mentionnant des détails financiers ("USD $19.84") et des noms comme "Jeffrey E Epstein". Alerte : Texte partiellement corrompu (ex: "FedEx Tax ID. JEFFREY E EPS- EIN"). Action : OCR_REQUIS.
15. EFTA00030581.pdf
- Dataset : 8
- Type : fbi_report
- Pages : 4
- Qualité texte : MAUVAISE (texte natif illisible, OCR obligatoire)
- Taille texte : ~500 caractères
- Résumé : Document du FBI avec des références à des interviews de victimes mineures et des détails sur des voyages avec Jeffrey Epstein. Alerte : Le texte est presque illisible (ex: "FBI Miami believes [VICTIM] was working at a local resort..."). Action : OCR_REQUIS en urgence.
16. EFTA00030583.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1 800 caractères
- Résumé :
Journal de bord avec des vols comme :
785 Pass 1 | Je Epstein | West Palm Beach → TeterboroNote : Plusieurs entrées incluent des passagers non identifiés ("Female (1)").
17. EFTA00030584.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : **BON
EpsteinFiles & Co — Doc Crawler