[CRAWL] DataSet_8 OCR batch 337 — EFTA00038234 à EFTA00038298
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T05:30:43.433Z
CRAWL REPORT — DataSet_8 Batch 337 (EPS-14646)
Date: 2024-06-20 Modèle OCR: Groq (llama-4-scout-17b-16e-instruct) + Tesseract 5.3.2 Source: /root/epstein_files/DataSet_8/ (offset 10080)
DOCUMENTS TRAITÉS (30/30)
1. EFTA00038234.pdf (OCR_REQUIS)
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1 (estimation)
- Qualité texte: MAUVAISE — OCR_REQUIS
- Taille texte: 0 caractères (extraction native impossible)
- Résumé : Document scanné avec qualité d'image <150 DPI. Texte non exploitable sans OCR avancé.
- Action : Marqué OCR_REQUIS — passage en mode OCR haute résolution (Tesseract + correction de biais).
2. EFTA00038235.pdf (OCR_REQUIS)
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1 (estimation)
- Qualité texte: MAUVAISE — OCR_REQUIS
- Taille texte: 0 caractères
- Résumé : Même problème que EFTA00038234 — qualité d'image trop basse pour extraction native.
- Action : OCR_REQUIS — traitement en mode OCR avec correction de biais (ex: suppression des artefacts de scannage).
3. EFTA00038250.pdf (OCR_REQUIS)
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1 (estimation)
- Qualité texte: MAUVAISE — OCR_REQUIS
- Taille texte: 0 caractères
- Résumé : Document scanné avec qualité d'image <150 DPI. Texte non exploitable sans OCR avancé.
- Action : OCR_REQUIS — traitement en mode OCR avec correction de biais.
4. EFTA00038251.pdf (OCR_REQUIS)
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1 (estimation)
- Qualité texte: MAUVAISE — OCR_REQUIS
- Taille texte: 0 caractères
- Résumé : Même problème que EFTA00038250 — qualité d'image trop basse pour extraction native.
- Action : OCR_REQUIS — traitement en mode OCR avec correction de biais.
5. EFTA00038253.pdf (BLACK_BOOK)
- Dataset: 8
- Type: black_book (liste de contacts)
- Pages: 1 (liste de noms et numéros)
- Qualité texte: BONNE (extraction native)
- Taille texte: 1 971 caractères
- Résumé :
- Liste de noms et numéros de téléphone (format Black Book).
- Contient des noms comme Abby, Aldridge Saffron, Abousleiman, Joanna, etc.
- Numéros de téléphone : format international (ex: +44 771 730 6038).
-
Email : format standard (ex: joannacheva!ier@hotmai!.c).
-
Noms extraits :
- Abby (UK)
- Aldridge Saffron
- Abousleiman, Joanna (0603 338 787)
- Adam, Nick (19 Rue De Lille, Paris)
- Alexander Pam (01415 644 305S)
- Alaranti Giacomo
- Agag Alejandro (Flat4 83 Duke St, London)
- Allan Paul (001 206 355 5777)
- Allan, Nick & Sarah (65 Banyan Villas, HK)
- Althorp, Charlie
- Alun..Jones, Carella (34 Eaton Place, London)
- Amon, Roberta & Maurice (4 East 72nd St, NY)
- Anastos Lisa (200 E 72nd St, NY)
- Anderson Lulu
- Alvarez Senor Vincente (00 34 1 276 6697)
- Amon Mr Philippe (16 Grafton Square, London)
- Appleby Robert & Alex (Domaine de Bougy, Switzerland)
- Arango Maile (Madrid, Spain)
- Armstrong Arthur & Cathy (15 Cadogan Square, London)
- Arion Joaquin Fernandez de Cordoba (Castillo de Mafpicas, Spain)
- Ash Lorinda (100 Park Ave, NY)
- Ashley & Allegra Hicks (32 Walpole St, London SW34QS)
- Astaire Mr Simon
- Baddeley Jean (60 Calhcart Road, London SW10)
- Astor Viscount William (29100 Coin, Malaga, Spain)
- Bahrke Peter
- Atkin Helene
- Ashley Nick & Ari (London)
-
Aznar Jose (S&S Capital, London)
-
Lieux extraits :
- Paris : 19 Rue De Lille (Adam, Nick)
- London : 34 Eaton Place (Alun..Jones, Carella), 15 Cadogan Square (Armstrong, Arthur & Cathy)
- New York : 4 East 72nd St (Amon, Roberta & Maurice), 200 E 72nd St (Anastos Lisa)
- Madrid, Spain : Arango Maile (Espaller #10)
-
Switzerland : Appleby Robert & Alex (Domaine de Bougy, 1170 Aubonne)
-
Dates extraites : Aucune (liste de contacts uniquement).
-
Montants extraits : Aucun.
-
Action critique : Aucune — document de type black_book (liste de contacts).
6. EFTA00038255.pdf (FLIGHT_LOG)
- Dataset: 8
- Type: flight_log (journal de vol)
- Pages: 1 (liste de vols)
- Qualité texte: BONNE (extraction native)
- Taille texte: 1 200 caractères
- Résumé :
- Liste de vols avec numéro de vol, date, lieu de départ, lieu d'arrivée, nom du passager.
- Contient des noms comme Epstein, Jeffrey, Dubin, Glenn, Maxwell, Ghislaine.
- Format : Unique ID / Nom / Prénom / Abréviation / Statut (Yes/No).
-
Exemple :
- 779 Pass 1 : Unique ID = 35020-G-1159B-N908JE-CMH-PBI-779-Pass 1
- Nom : Epstein
- Prénom : Jeffrey
- Abréviation : JE
- Statut : Yes
- Trajet : West Palm Beach, FL, USA → Teterboro, NJ, USA
-
Noms extraits :
- Epstein, Jeffrey (JE)
- Dubin, Glenn (GD)
- Dubin, Eva (ED)
- Dubin, Celina (CD)
- Dubin, Sophie (SB)
- Maxwell, Ghislaine (GM)
- Greenberg, Alan (AG)
-
Greenberg, Kathy (KG)
-
Lieux extraits :
- West Palm Beach, FL, USA (départ)
- Teterboro, NJ, USA (arrivée)
- Columbus, OH, USA (trajet intermédiaire)
-
New York, NY, USA (trajet final)
-
Dates extraites :
- 11/21/1995 (vol 779 Pass 1)
- 11/26/1995 (vol 782 Pass 1-9)
- 11/29/1995 (vol 784 Pass 1-2)
-
11/30/1995 (vol 784 Pass 2)
-
Montants extraits : Aucun (journal de vol uniquement).
-
Action critique : Aucune — document de type flight_log (journal de vol).
7. EFTA00038256.pdf (CORRESPONDANCE)
- Dataset: 8
- Type: correspondence (correspondance)
- Pages: 2 (estimation)
- Qualité texte: BONNE (extraction native)
- Taille texte: 2 500 caractères
- Résumé :
- Lettre de Jeffrey E. Epstein à Interlochen Center for the Arts.
- Date : 9 février 1994.
- Montant : 20 000 $ (pour une nouvelle bourse).
- Lieu : New York, NY, USA.
-
Contenu :
- Remerciements pour un don généreux.
- Tax code : inclus pour le dossier d'Epstein.
- Demande : réserver deux semaines pour l'été 1994.
-
Noms extraits :
- Epstein, Jeffrey E. (expéditeur)
- Perlman (concert mentionné)
-
Interlochen Center for the Arts (destinataire)
-
Lieux extraits :
- New York, NY, USA (adresse d'Epstein)
-
Interlochen, MI, USA (adresse du centre pour les arts)
-
Dates extraites :
- 9 février 1994 (lettre)
-
Août 1994 (réservation mentionnée)
-
Montants extraits :
- 20 000 $ (don pour une bourse)
-
Tax code : inclus pour le dossier (à vérifier)
-
Action critique : Aucune — document de type correspondence (correspondance).
8. EFTA00038258.pdf (FBI_REPORT)
- Dataset: 8
- Type: fbi_report (rapport du FBI)
- Pages: 4 (estimation)
- Qualité texte: BONNE (extraction native)
- Taille texte: 8 000 caractères
- Résumé :
- Titre : United States v. Jeffrey Epstein
- Date : Août 2018 (rapport supplémentaire)
- Lieu : United States Courthouse, 40 Foley Square, New York, NY 10007
-
Contenu :
- Apparences : ESQ. (Assistant United States Attorney)
- Acting Grand Jury Reporter : Fink & Carney Reporting and Video Services
- Témoignage : Spécial Agent (nom non mentionné) — interview sur les crimes d'Epstein.
- Hearsay evidence : mentionnée comme admissible dans les procédures du grand jury.
-
Noms extraits :
- Epstein, Jeffrey E. (défendeur)
- Spécial Agent (interviewé, nom non mentionné pour protection)
-
MS. (Assistant United States Attorney, nom non mentionné)
-
Lieux extraits :
- New York, NY, USA (courthouse)
-
Foley Square (adresse spécifique)
-
Dates extraites :
- Août 2018 (rapport supplémentaire)
-
Juillet 2019 (mention dans le texte)
-
Montants extraits : Aucun (procédure judiciaire uniquement).
-
Action critique : Aucune — document de type fbi_report (rapport du FBI).
9. EFTA00038259.pdf (DEPOSITION)
- Dataset: 8
- Type: deposition (déposition)
- Pages: 3 (estimation)
- Qualité texte: BONNE (extraction native)
- Taille texte: 6 000 caractères
- Résumé :
- Titre : United States Grand Jury — Southern District of New York
- Date : 2 juillet 2019
- Lieu : United States Courthouse, 40 Foley Square, New York, NY 10007
- Contenu :
- **Déposition
EpsteinFiles & Co — Doc Crawler