Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 09:48:30
[CRAWL] DataSet_8 OCR batch 96 — EFTA00020320 à EFTA00020371
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T09:48:30.576Z
CRAWL REPORT — 2024-05-15
TÂCHE EPS-12697 | DataSet_8 OCR Batch 96 (EFTA00020320 à EFTA00020371)
📌 DOCUMENTS TRAITÉS
1. EFTA00020320.pdf
- Dataset : 8
- Type : correspondence (email + liste de contacts)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 1 245 caractères
- Résumé :
Liste partielle de contacts avec noms, numéros de téléphone (UK/US/Europe) et emails. Inclut des individus comme Abby, Aldridge Saffron, Adam Nick, Alaranti Giacomo, etc. Plusieurs entrées semblent incomplètes ou corrompues (ex:
joannacheva!ier@hotmai!. c). → [ALERTE] Présence de données personnelles sensibles (numéros de téléphone, emails). Vérifier la légalité de la diffusion.
2. EFTA00020321.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1 (OCR requis)
- Qualité texte : OCR_REQUIS (texte illisible en natif)
- Taille texte : 0 caractères (après extraction native)
- Résumé : Document scanné avec texte manuscrit ou image de mauvaise qualité. Impossible d'extraire le contenu sans OCR. → Action : Lancer OCR via Tesseract avec pré-traitement (binarisation, déskew).
3. EFTA00020322.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 2 (texte natif extrait)
- Qualité texte : MOYENNE (formatage complexe)
- Taille texte : 3 210 caractères
- Résumé : Relevés de compte avec transactions datées (2002-2003), montants en USD/GBP, et références à des virements. Mention de Jeffrey E. Epstein et d'adresses (457 Madison Ave, New York). → [ALERTE] Données financières sensibles. Croiser avec les registres de la SEC/FBI.
4. EFTA00020331.pdf
- Dataset : 8
- Type : fbi_report (rapport d'enquête)
- Pages : 3 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 4 890 caractères
- Résumé : Rapport du FBI Miami détaillant l'enquête sur Jeffrey Epstein pour trafic sexuel de mineures. Mention de victimes recrutées via des massages, paiements de 200$–1000$, et voyages organisés. Une victime nommée ** (caviardée) a identifié d'autres complices. → [ALERTE CRITIQUE] Preuves directes de crimes fédéraux. À transmettre à l'US Attorney's Office.**
5. EFTA00020333.pdf
- Dataset : 8
- Type : flight_log (journal de bord aérien)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 1 560 caractères
- Résumé : Log de vol pour l'appareil N908JE (Gulfstream G-IV) avec passagers comme Ghislaine Maxwell, Glenn Dubin, Celina Dubin, et des "Female (1)" non identifiées. Trajets entre PBI (West Palm Beach), TEB (Teterboro), et CMH (Columbus). → [ALERTE] Lien direct avec Epstein et ses associés. Croiser avec les manifests de la FAA.
6. EFTA00020335.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 4 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 6 230 caractères
- Résumé : Déposition sous serment de ** (caviardée) décrivant des abus sexuels par Epstein et Maxwell dans leur résidence de New York. Détails sur des "parties" avec mineures et pression pour recruter d'autres victimes. → [ALERTE] Témoignage clé pour la procédure pénale. À classer "SECRET" dans l'index.**
7. EFTA00020337.pdf
- Dataset : 8
- Type : email (correspondance interne)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 890 caractères
- Résumé : Email de ** (caviardé) à * (caviardé) discutant de "l'événement du 15/08" et de la nécessité de "nettoyer les traces". Ton urgent et ambigu. *→ [ALERTE] Possible obstruction à la justice. À signaler au procureur.
8. EFTA00020338.pdf
- Dataset : 8
- Type : photo (métadonnées EXIF)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 450 caractères
- Résumé : Métadonnées d'une photo montrant Jeffrey Epstein et Ghislaine Maxwell à bord d'un jet privé (N908JE). Date : 11/26/1995. Lieu : West Palm Beach → Teterboro. → À associer avec le flight log EFTA00020333.
9. EFTA00020339.pdf
- Dataset : 8
- Type : financial_record (factures)
- Pages : 2 (texte natif extrait)
- Qualité texte : MOYENNE (tableaux)
- Taille texte : 2 100 caractères
- Résumé : Factures de FedEx pour livraisons à Jeffrey E. Epstein (457 Madison Ave) en 2002. Montants : 16,00$ + frais de carburant. Référence à un colis expédié le 07/10/2002. → Croiser avec les registres de livraison de l'USPS.
10. EFTA00020340.pdf
- Dataset : 8
- Type : correspondence (lettre officielle)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 1 020 caractères
- Résumé : Lettre du U.S. Department of Justice (Southern District of NY) datée du 05/07/2019, émettant une grand jury subpoena pour une enquête sur des violations de 18 U.S.C. §§ 1591, 2421-2423 (trafic sexuel, corruption). → [ALERTE] Document judiciaire prioritaire. À archiver avec les autres subpoenas (EFTA00005727).
11. EFTA00020341.pdf
- Dataset : 8
- Type : black_book (carnet d'adresses)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 1 870 caractères
- Résumé : Extrait du Black Book avec noms, numéros de téléphone (UK/Europe), et emails. Inclut des personnalités comme Ashley Hicks, Astor Viscount William, Bamford Sir Anthony. → [ALERTE] Réseau social d'Epstein. À croiser avec les données du FBI (EFTA00020331).
12. EFTA00020342.pdf
- Dataset : 8
- Type : fbi_report (rapport d'interview)
- Pages : 5 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 7 890 caractères
- Résumé : Rapport du FBI détaillant l'interview de ** (victime) en Australie (17/03/2011). Elle décrit des abus répétés par Epstein et Maxwell, avec paiements en échange de silence. Mention de * (associé d'Epstein) facilitant les voyages. *→ [ALERTE] Témoignage corroborant les autres rapports (EFTA00005711).
13. EFTA00020343.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 1 340 caractères
- Résumé : Log de vol pour le jet N908JE avec passagers comme Alan Greenberg, Kathy Greenberg, et des "Nanny (1)" non identifiées. Trajet : PBI → TEB → CMH (Columbus, OH). → À lier avec les autres logs (EFTA00020333).
14. EFTA00020344.pdf
- Dataset : 8
- Type : deposition (transcription judiciaire)
- Pages : 6 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 9 210 caractères
- Résumé : Transcription d'une déposition de Ghislaine Maxwell (2016) niant toute connaissance des activités illégales d'Epstein. Mentions de "parties" avec des mineures mais qualifiées de "rumeurs". → [ALERTE] Contredit les témoignages des victimes (EFTA00020335). À analyser pour incohérences.
15. EFTA00020345.pdf
- Dataset : 8
- Type : correspondence (email interne)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 780 caractères
- Résumé : Email de ** à * discutant de "l'arrangement" avec une mineure nommée . Ton suggestif et mentions de paiements. *→ [ALERTE] Possible preuve de corruption. À transmettre au procureur.
16. EFTA00020346.pdf
- Dataset : 8
- Type : financial_record (relevés de carte)
- Pages : 3 (texte natif extrait)
- Qualité texte : MOYENNE (chiffres illisibles par endroits)
- Taille texte : 2 980 caractères
- Résumé : Relevés de carte de crédit pour Jeffrey E. Epstein (2001-2002) avec dépenses chez Victoria's Secret, Neiman Marcus, et des hôtels de luxe. Montants dépassant 10 000$ par transaction. → [ALERTE] Dépenses suspectes. À croiser avec les registres bancaires (EFTA00020322).
17. EFTA00020347.pdf
- Dataset : 8
- Type : photo (métadonnées)
- Pages : 1 (texte natif extrait)
- Qualité texte : BONNE
- Taille texte : 320 caractères
- **Résumé
EpsteinFiles & Co — Doc Crawler