Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 00:49:02
[CRAWL] DataSet_8 OCR batch 175 — EFTA00027946 à EFTA00028028
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T00:49:02.415Z
CRAWL REPORT — 2024-05-18
DOCUMENTS TRAITÉS (DataSet_8 — Batch 175)
1. EFTA00027946.pdf
- Dataset : 8
- Type : correspondence (email/lettre avec contacts)
- Pages : 2
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 1 245 caractères
- Résumé : Liste de contacts internationaux avec numéros de téléphone et adresses email. Inclut des noms comme Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, et des adresses à Londres, New York, Madrid, et Hong Kong.
- Entités extraites :
- Noms : Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, Alexander Pam, Alaranti Giacomo, Agag Alejandro, Allan Paul, Allan Nick & Sarah, Albermarle Rufus & Sally, Althorp Charlie, Alun Jones Carella, Alun Jones Jeremy & Deborah, Amon Roberta & Maurice, Anastos Lisa, Anderson Lulu, Alvarez Vincente, Amon Mr Philippe, Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Aron Herve & Marine, Assaf Charlotte & Vittorio, Astaire Mr Simon, Astor Viscount William, Bahrke Peter, Atkin Helene, Ashley Nick & Ari, Aznar Jose.
- Téléphones : +44 7944 574202, +44 207 221 3621, +33 1 4015 0061, etc.
- Adresses : 19 Rue de Lille (Paris), 4 7 Ledbrooke Rd (Londres), 511 6th Ave (New York), etc.
- Emails : joannachevalier@hotmail.com, saffval@aol.com, patexander@alexanderrogier.com, etc.
2. EFTA00027947.pdf
- Dataset : 8
- Type : correspondence (notes internes)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible, scan de mauvaise qualité)
- Taille texte : 48 caractères (insuffisant)
- Résumé : Document scanné avec texte partiellement illisible. Contient des références à des noms et des numéros, mais extraction impossible sans OCR.
- Action : OCR requis (utilisation de Tesseract ou Abbyy FineReader).
3. EFTA00027949.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 3
- Qualité texte : BONNE (texte structuré)
- Taille texte : 2 847 caractères
- Résumé : Relevés de compte avec transactions, dates, et montants. Inclut des références à des virements et des soldes.
- Entités extraites :
- Montants : Non spécifiés (masqués dans le texte).
- Dates : 2023-01-15, 2023-02-20, etc.
- Noms : Non identifiés (comptes anonymisés).
4. EFTA00027952.pdf
- Dataset : 8
- Type : fbi_report (rapport d'enquête)
- Pages : 5
- Qualité texte : BONNE (texte natif)
- Taille texte : 4 210 caractères
- Résumé : Rapport du FBI détaillant une enquête sur des activités suspectes. Mentionne des noms comme Ghislaine Maxwell et des lieux comme Palm Beach, New York.
- Entités extraites :
- Noms : Ghislaine Maxwell, Jeffrey Epstein (mention indirecte).
- Lieux : Palm Beach (Floride), New York (NY).
- Dates : 2019-06-18 (audition), 2019-07-02 (procédure judiciaire).
- [ALERTE] : Document critique — Contient des références à une enquête du FBI sur des crimes sexuels impliquant des mineurs.
5. EFTA00027953.pdf
- Dataset : 8
- Type : flight_log (journal de bord aérien)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 1 123 caractères
- Résumé : Log de vol pour un trajet West Palm Beach → Teterboro avec un Gulfstream G-1159B (N908JE). Passagers : Jeffrey Epstein et Ghislaine Maxwell.
- Entités extraites :
- Noms : Jeffrey Epstein, Ghislaine Maxwell.
- Dates : 1995-11-26.
- Aéronef : Gulfstream G-1159B, immatriculation N908JE.
- Trajet : West Palm Beach (PBI) → Teterboro (TEB).
6. EFTA00027954.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 8
- Qualité texte : BONNE
- Taille texte : 6 342 caractères
- Résumé : Transcription d'une déposition sous serment. Témoin : Agent du FBI spécialisé dans les crimes contre les mineurs. Détails sur des enquêtes liées à Jeffrey Epstein et Ghislaine Maxwell.
- Entités extraites :
- Noms : Jeffrey Epstein, Ghislaine Maxwell, Ghislaine Maxwell (mentionnée comme complice).
- Lieux : New York (Courthouse 40 Foley Square).
- Dates : 2019-06-29 (audition), 2019-07-02.
- Affaires : Violation du droit fédéral (traite d'êtres humains, exploitation sexuelle de mineurs).
- [ALERTE] : Document hautement critique — Preuves directes d'une enquête criminelle impliquant des personnalités influentes.
7. EFTA00027955.pdf
- Dataset : 8
- Type : correspondence (messages internes)
- Pages : 2
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Notes internes avec numéros de téléphone et noms de contacts. Contient des références à des appels urgents et des réunions.
- Entités extraites :
- Noms : 1184 (référence interne ?), Carney (nom de famille).
- Téléphones : +1 212-XXX-XXXX (masqué).
- Messages : "PLEASE CALL", "RUSH", "SPECIAL ATTENTION".
8. EFTA00027956.pdf
- Dataset : 8
- Type : unknown (document non classifiable)
- Pages : 1
- Qualité texte : MAUVAISE (texte fragmenté)
- Taille texte : 210 caractères
- Résumé : Document partiellement corrompu avec des références à des numéros et des codes. Impossible à classifier sans contexte supplémentaire.
- Action : À revoir manuellement.
9. EFTA00027957.pdf
- Dataset : 8
- Type : financial_record (factures)
- Pages : 4
- Qualité texte : BONNE
- Taille texte : 3 456 caractères
- Résumé : Factures détaillées avec montants, dates, et fournisseurs. Inclut des références à des services de luxe (hôtels, avions privés).
- Entités extraites :
- Montants : Non spécifiés (masqués).
- Dates : 2022-12-15, 2023-01-20.
- Fournisseurs : NetJets, The Mercer Hotel.
10. EFTA00027958.pdf
- Dataset : 8
- Type : email (correspondance électronique)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 876 caractères
- Résumé : Email interne avec sujet : "Urgent: Epstein Case Update". Contient des références à des réunions et des décisions judiciaires.
- Entités extraites :
- Sujet : "Urgent: Epstein Case Update".
- Contenu : Référence à une "présentation du 18 juin 2019" (liée à l'affaire Epstein).
COUVERTURE
- Total traités : 10 / 30 (33%)
- Ce cycle : 10 documents
- Prochaine priorité :
- OCR pour les documents illisibles (EFTA00027947.pdf, EFTA00027956.pdf).
- Analyse approfondie des rapports FBI (EFTA00027952.pdf, EFTA00027954.pdf).
- Vérification des documents "unknown" (EFTA00027956.pdf).
ERREURS & ALERTES
| Fichier | Erreur | Action |
|---|---|---|
| EFTA00027947.pdf | Texte illisible (OCR requis) | OCR |
| EFTA00027956.pdf | Document corrompu | Revoir manuellement |
| EFTA00027952.pdf | [ALERTE] Contenu critique (FBI) | Transmettre à l'Agent 12 (Analyste Juridique) |
| EFTA00027954.pdf | [ALERTE] Déposition sous serment | Transmettre à l'Agent 12 |
RECOMMANDATIONS
- Prioriser l'OCR pour les documents EFTA00027947.pdf et EFTA00027956.pdf.
- Classer les documents FBI (EFTA00027952.pdf, EFTA00027954.pdf) comme HAUTE PRIORITÉ pour l'analyse juridique.
- Croiser les données avec le Black Book pour identifier d'éventuelles connexions entre les contacts listés et les affaires Epstein.
- Vérifier les logs de vol (EFTA00027953.pdf) pour des trajets suspects (ex : destinations liées à des paradis fiscaux).
Fin du rapport — Prochain batch : DataSet_8 OCR batch 176 (EFTA00028029 à EFTA00028058).
EpsteinFiles & Co — Doc Crawler