Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 00:48:21
[CRAWL] DataSet_8 OCR batch 197 — EFTA00029582 à EFTA00029647
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T00:48:21.078Z
CRAWL REPORT — 2024-06-25
Batch: DataSet_8 — OCR Batch 197 (EFTA00029582 à EFTA00029647) Agent: CRAWLER (modèle: llama-4-scout-17b-16e-instruct) Fichiers traités: 30/30 OCR requis: 30/30 (tous les PDFs étaient des images scannées ou des documents non textuels) Métadonnées: Tous les fichiers proviennent du DataSet_8 (offset 5880). Type dominant: unknown (documents administratifs, listes, logs, ou contenus non classifiables sans OCR avancé).
📄 DOCUMENTS TRAITÉS
1. EFTA00029582.pdf
- Dataset: 8
- Type: unknown (liste de contacts/numéros de téléphone)
- Pages: 1
- Qualité texte: OCR_REQUIS (image scannée)
- Taille texte: 1 245 caractères
- Résumé:
Liste partielle de contacts avec noms (ex: "Abby", "Aldridge Saffron"), numéros de téléphone (UK/US/Europe), et emails (ex:
joannacheva!ier@hotmai!.c). Contient des adresses postales (Londres, New York) et des codes pays. Contient des données personnelles sensibles [ALERTE: Données PII exposées]. - Noms identifiés: Abby, Aldridge Saffron, Joanna Abousleiman, Nick Adam, Pam Alexander, Giacomo Alaranti, Alejandro Agag, etc.
- Dates/Lieux: Londres (SW1, W11), New York (NY 10021), Madrid (Espagne), Hong Kong.
- Montants: Aucun.
2. EFTA00029584.pdf
- Dataset: 8
- Type: unknown (liste de contacts/entreprises)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 987 caractères
- Résumé:
Liste de contacts professionnels avec noms (ex: "Arango, Maile"), entreprises (ex: "S&S Capital"), emails (ex:
aagag@as!investments.com), et numéros de téléphone internationaux. Inclut des adresses email potentiellement corrompues (ex:saffval@aol.com). - Noms identifiés: Maile Arango, Jose Aznar, Lorenzo Baumer, Peter Bamford, etc.
- Dates/Lieux: Londres (SW1), New York (NY), Madrid (Espagne), Suisse (Aubonne).
- Montants: Aucun.
3. EFTA00029587.pdf
- Dataset: 8
- Type: unknown (logistique/transport)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 023 caractères
- Résumé: Document administratif lié à des frais de transport ou à une chaîne logistique. Contient des références à des numéros de compte, des adresses (ex: "457 Madison Ave, New York"), et des montants partiels (ex: "USD $19.84").
- Noms identifiés: Jeffrey E. Epstein (référence implicite via l'adresse).
- Dates/Lieux: New York (NY 10022-6843).
- Montants: USD $19.84 (frais de transport).
4. EFTA00029588.pdf
- Dataset: 8
- Type: unknown (liste de passagers de vol)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 156 caractères
- Résumé: Extrait d'un log de vol (similaire aux Flight Logs du corpus). Liste des passagers avec noms (ex: "Epstein, Je", "Maxwell, Ghislaine"), codes de vol (ex: "PBI-TEB"), et dates (novembre 1995).
- Noms identifiés: Jeffrey Epstein, Ghislaine Maxwell, Glenn Dubin, Eva Dubin, etc.
- Dates/Lieux: West Palm Beach (PBI), Teterboro (TEB), Columbus (CMH).
- Montants: Aucun.
5. EFTA00029589.pdf
- Dataset: 8
- Type: flight_log (extrait)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 342 caractères
- Résumé: Log de vol détaillé avec numéros de vol (ex: "781 Pass 1"), modèles d'avion (ex: "G-1159B"), et passagers (ex: "Dubin, Glenn", "Dubin, Eva").
- Noms identifiés: Glenn Dubin, Eva Dubin, Celina Dubin, Alan Greenberg, Kathy Greenberg.
- Dates/Lieux: Novembre 1995 (PBI ↔ TEB).
- Montants: Aucun.
6. EFTA00029590.pdf
- Dataset: 8
- Type: financial_record
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 892 caractères
- Résumé: Document financier lié à des frais de téléphonie mobile (T-Mobile USA). Contient un numéro de compte, des détails d'abonnement (ex: "Monthly Service Charges: $47.24"), et des appels internationaux (ex: Miami, FL).
- Noms identifiés: Jeffrey E. Epstein (compte associé).
- Dates/Lieux: Février 2005, Miami (FL).
- Montants: USD $47.24 (frais mensuels + taxes).
6. EFTA00029595.pdf
- Dataset: 8
- Type: correspondence (email/lettre)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 789 caractères
- Résumé: Lettre ou email non daté avec en-tête "United States v. Ghislaine Maxwell" et mention de "Superseding Indictment" (2021). Contient des références à des numéros de dossier (ex: "S1 20 Cr. 330 (AJN)").
- Noms identifiés: Ghislaine Maxwell, Jeffrey Epstein.
- Dates/Lieux: Southern District of New York.
- Montants: Aucun.
7. EFTA00029596.pdf
- Dataset: 8
- Type: fbi_report
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 456 caractères
- Résumé: Rapport du FBI lié à une enquête (ex: "Federal Express Record"). Contient des numéros de facture (ex: "Invoice Number: 14"), des adresses (ex: "457 Madison Ave, New York"), et des montants (ex: "USD $16.00").
- Noms identifiés: Jeffrey E. Epstein.
- Dates/Lieux: Octobre 2002, New York.
- Montants: USD $16.00 (frais de livraison).
8. EFTA00029598.pdf
- Dataset: 8
- Type: flight_log
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 201 caractères
- Résumé: Log de vol avec détails sur des trajets (ex: "January 2001 Flights"). Contient des codes de vol (ex: "01W"), des modèles d'avion (ex: "AraTel Nano"), et des passagers (ex: "Epstein, Je").
- Noms identifiés: Jeffrey Epstein.
- Dates/Lieux: Janvier 2001.
- Montants: Aucun.
9. EFTA00029600.pdf
- Dataset: 8
- Type: unknown (document judiciaire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 987 caractères
- Résumé: Document judiciaire lié à l'affaire "United States v. Ghislaine Maxwell" (2020). Contient des références à des audiences (ex: "July 8, 2020") et des numéros de dossier (ex: "2018R01618").
- Noms identifiés: Ghislaine Maxwell.
- Dates/Lieux: White Plains, New York.
- Montants: Aucun.
10. EFTA00029601.pdf
- Dataset: 8
- Type: deposition
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 123 caractères
- Résumé: Déposition ou transcript d'une audience judiciaire. Contient des dialogues (ex: "MS. [Nom] grand jurors present") et des références à des numéros de dossier (ex: "GM_GLSDNY_00000209").
- Noms identifiés: Non extraits (formatage pauvre).
- Dates/Lieux: 2020, Southern District of New York.
- Montants: Aucun.
11. EFTA00029606.pdf
- Dataset: 8
- Type: unknown (liste de contacts)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 045 caractères
- Résumé:
Liste de contacts avec noms (ex: "Bamford Sir Anthony"), numéros de téléphone (UK), et emails (ex:
alice@scbpartners.com). Contient des données personnelles sensibles [ALERTE: Données PII]. - Noms identifiés: Anthony Bamford, Peter Barnes, etc.
- Dates/Lieux: Londres (SW1), New York.
- Montants: Aucun.
12. EFTA00029610.pdf
- Dataset: 8
- Type: financial_record
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 876 caractères
- Résumé: Facture ou relevé financier avec détails de paiement (ex: "Total Charges: $47.24"). Contient des références à des services (ex: "T-Mobile USA").
- Noms identifiés: Jeffrey E. Epstein (compte associé).
- Dates/Lieux: Février 2005.
- Montants: USD $47.24.
13. EFTA00029614.pdf
- Dataset: 8
- Type: flight_log
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 302 caractères
- Résumé: Log de vol avec détails sur des trajets (ex: "November 1995 Flights"). Contient des codes de vol (ex: "PBI-TEB"), des modèles d'avion (ex: "G-1159B"), et des passagers (ex: "Epstein, Je", "Maxwell, Ghislaine").
- Noms identifiés: Jeffrey Epstein, Ghislaine Maxwell.
- Dates/Lieux: Novembre 1995.
- Montants: Aucun.
14. EFTA00029615.pdf
- Dataset: 8
- Type: unknown (document administratif)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 956 caractères
- Résumé: Document lié à des frais de service (ex: "Chain of Custody"). Contient des références à des numéros de dossier (ex: "FB-504b") et des types de médias (ex: "Magnetic Tape").
- Noms identifiés: Aucun extrait.
- Dates/Lieux: Non spécifié.
- Montants: Aucun.
15. EFTA00029616.pdf
- **Dataset
EpsteinFiles & Co — Doc Crawler