Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 04:06:23
[CRAWL] DataSet_8 OCR batch 272 — EFTA00034616 à EFTA00034650
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T04:06:23.364Z
CRAWL REPORT — 2024-05-27
CRAWL_DS8_BATCH_272
DOCUMENTS TRAITÉS
1. EFTA00034616.pdf
- Dataset : 8
- Type : correspondence (Black Book extrait)
- Pages : 1 (extrait de liste de contacts)
- Qualité texte : MAUVAISE (OCR nécessaire, texte très dégradé)
- Taille texte : 1 245 caractères
- Résumé : Extrait d’un annuaire de contacts incluant des noms (ex. Abby, Aldridge Saffron, Abousleiman Joanna), numéros de téléphone (UK, US, Espagne) et adresses email (ex. joannacheva!ier@hotmai!.c). Contient des erreurs de transcription évidentes (ex. "hotmai!" au lieu de "hotmail").
- Noms identifiés : Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, Alexander Pam, Alaranti Giacomo, Agag Alejandro, Allan Paul, Allan Nick & Sarah, Althorp Charlie, Alun Jones (Carella, Jeremy & Deborah), Amon (Roberta & Maurice), Anastos Lisa, Anderson Lulu, Alvarez Vincente, Amon Mr Philippe, Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Ash Lorinda, Ashley & Allegra Hicks.
- Numéros de téléphone : UK (+44 7944 574202, +44 207 221 3621), US (+1 212 879 7653), Espagne (+34 603 338 787).
- Adresses email : joannacheva!ier@hotmai!.c (corrompu), saffval@aol.com, patexander@alexanderrogil, aagag@as!investments.com.
- Adresses postales : 19 Rue De Lille (Paris), 4 7 Idbrooke Rd (London W11 3PD), Flat 4 83 Duke St (London W1), 511 6th Ave (New York), 65 Banyan Villas (Hong Kong), 16 Grafton Square (London SW), etc.
- [ALERTE] : Présence de numéros de téléphone et adresses email potentiellement sensibles. Vérifier la légalité de la diffusion avant traitement ultérieur.
2. EFTA00034617.pdf
- Dataset : 8
- Type : unknown (texte non structuré, OCR requis)
- Pages : 1 (texte partiel)
- Qualité texte : OCR_REQUIS (texte illisible ou incomplet)
- Taille texte : 48 caractères
- Résumé : Fragment de texte non identifiable sans OCR. Contient des caractères corrompus (ex. "EFTA00003523.txt (DS2)" en en-tête, suggérant une possible confusion de fichier).
- Action : RETRY avec OCR forcé.
3. EFTA00034618.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 2
- Qualité texte : BONNE (extraction native réussie)
- Taille texte : 3 456 caractères
- Résumé : Relevés de salaire de Jeffrey E. Epstein pour mars 2005 (période du 03/03 au 17/03). Salaire brut : $2115.39 par période de paie. Déductions : FICA ($162.48), impôt fédéral ($350.04). Net payé : $1 412.87.
- Employeur : Non précisé (mention de "Palm Beach, FL").
- Numéro de sécurité sociale : Partiellement masqué (20109373).
- Statut marital : Célibataire (SINGLE).
- [ALERTE] : Données financières personnelles sensibles. À traiter avec confidentialité maximale.
4. EFTA00034619.pdf
- Dataset : 8
- Type : flight_log (extrait de logs de vol)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis pour lisibilité)
- Taille texte : 2 103 caractères
- Résumé : Extrait de logs de vol pour l’avion N908JE (modèle Gulfstream G-IV). Inclut des dates (novembre 1995), passagers (ex. Epstein, Maxwell Ghislaine, Greenberg Alan), et trajets (West Palm Beach ↔ Teterboro).
- Passagers fréquents : Jeffrey Epstein (JE), Ghislaine Maxwell (GM), Glenn Dubin (GD), Eva Dubin (ED).
- Aéroport de départ/arrivée : PBI (Palm Beach), TEB (Teterboro), CMH (Columbus).
- [ALERTE] : Données de voyage sensibles. Vérifier la conformité RGPD avant diffusion.
5. EFTA00034620.pdf
- Dataset : 8
- Type : correspondence (email ou lettre)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte dégradé)
- Taille texte : 156 caractères
- Résumé : Fragment de texte non exploitable sans OCR. Contient des mentions de "Clinton Trips-NY,LA,London" et des numéros de série (ex. "IMG_1339.JPG").
- Action : RETRY avec OCR forcé.
6. EFTA00034621.pdf
- Dataset : 8
- Type : fbi_report (rapport d’enquête)
- Pages : 3
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 892 caractères
- Résumé : Rapport du FBI mentionnant des serial numbers et des demandes de relevés téléphoniques (ex. "561-790-5475", "561-676-5619"). Titres de sections : "PROVIDE PHONE AND TOLL RECORDS", "SUBPOENA".
- Agences impliquées : FBI, collect.cjis.ct.gov.
- Contexte : Enquête sur des numéros de téléphone associés à des activités suspectes.
- [ALERTE] : Données d’enquête sensibles. À isoler pour analyse légale.
7. EFTA00034622.pdf
- Dataset : 8
- Type : photo (métadonnées de photos)
- Pages : 1
- Qualité texte : BONNE (extraction native)
- Taille texte : 4 321 caractères
- Résumé : Liste de fichiers image (format .JPG) avec noms de fichiers séquentiels (ex. "DSC01165.JPG", "IMG_4613.JPG"). Contient des mentions de photographes et de lieux (ex. "knee, misc", "Clinton Trips").
- Lieux : Miami, Ohio, Hawaii, Espagne (Alhambra).
- Événements : "ROLLING STONES", "VANITY FAIR", "AFRICA SEPT.O".
- Action : Classer comme photo avec métadonnées associées.
8. EFTA00034623.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 2
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 987 caractères
- Résumé : Extrait de déposition avec mentions de "Grand Jury-NY" et "United States v. Ghislaine Maxwell" (date : 07/08/2020). Contient des questions posées aux jurés (ex. "Do any of you believe that you personally know Ghislaine Maxwell?").
- Contexte : Procès fédéral contre Ghislaine Maxwell.
- [ALERTE] : Données judiciaires sensibles. À traiter avec extrême confidentialité.
9. EFTA00034626.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 2 789 caractères
- Résumé : Relevé de compte pour Jeffrey E. Epstein (avril 2005). Solde initial : $148,071.71. Déductions : FICA ($162.48), impôt fédéral ($350.04). Net payé : $1 412.87.
- Employeur : Non précisé (mention de "Palm Beach, FL").
- Numéro de sécurité sociale : Partiellement masqué.
- [ALERTE] : Données financières personnelles sensibles.
10. EFTA00034629.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 65 caractères
- Résumé : Fragment de texte illisible sans OCR. Contient des mentions de "ITEM WAS NOT SCANNED".
- Action : RETRY avec OCR forcé.
11. EFTA00034630.pdf
- Dataset : 8
- Type : correspondence (email ou lettre)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 023 caractères
- Résumé : Extrait d’un email ou d’une lettre mentionnant des noms (ex. Bamford Sir Anthony, Bannister Clive) et des numéros de téléphone UK (+44 207 991 6182).
- Adresses : 69 Stanhope Mews East (London), 60 Sloane Avenue (London SW3).
- Contexte : Correspondance entre contacts haut de gamme.
- [ALERTE] : Données personnelles sensibles.
12. EFTA00034631.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 567 caractères
- Résumé : Log de vol pour l’avion N908JE (modèle Gulfstream G-IV). Dates : novembre 1995. Passagers : Epstein, Maxwell Ghislaine, Greenberg Alan, Greenberg Kathy.
- Trajets : West Palm Beach ↔ Teterboro, Columbus (CMH).
- Heures de vol : 22 heures par trajet.
- [ALERTE] : Données de voyage sensibles.
13. EFTA00034632.pdf
- Dataset : 8
- Type : fbi_report
- Pages : 2
- Qualité texte : OCR_REQUIS
- Taille texte : 892 caractères
- Résumé : Rapport du FBI mentionnant des serial numbers et des demandes de relevés téléphoniques (ex. "SERIAL #87 : PROVIDE PHONE AND TOLL RECORDS").
- Contexte : Enquête sur des activités suspectes liées à des numéros de téléphone.
- [ALERTE] : Données d’enquête sensibles.
14. EFTA00034633.pdf
- Dataset : 8
- Type : photo
- Pages : 1
-
Qualité texte : BONNE
EpsteinFiles & Co — Doc Crawler