Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 18:36:23
[CRAWL] DataSet_8 OCR batch 337 — EFTA00038234 à EFTA00038298
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T18:36:23.183Z
CRAWL REPORT — 2024-05-22
Batch: DataSet_8 — OCR Batch 337 (EFTA00038234 à EFTA00038298) Agent: CRAWLER (modèle: llama-4-scout-17b-16e-instruct) Source: Groq /root/epstein_files/
DOCUMENTS TRAITÉS (30/30)
1. EFTA00038234.pdf
- Dataset : 8
- Type : black_book (liste de contacts avec numéros de téléphone et emails)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement corrompu, formatage chaotique)
- Taille texte : 1 245 caractères
- Résumé :
Liste de contacts internationaux incluant des noms (ex: Abby, Aldridge Saffron, Adam Nick), numéros de téléphone (UK, US, Espagne) et emails (ex:
saffval@aol.com,joannacheva!ier@hotmai!.c). Présence de données sensibles (coordonnées personnelles). [ALERTE] : Contient des informations personnelles non caviardées — à traiter avec confidentialité.
2. EFTA00038235.pdf
- Dataset : 8
- Type : correspondence (email et coordonnées)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement illisible)
- Taille texte : 892 caractères
- Résumé : Email partiel avec mention de "Your Order wail Ansazon.com" et adresse de facturation (Gigi Maxwell, New York). Coordonnées bancaires ou de livraison potentiellement sensibles. [ALERTE] : Numéro de commande Amazon et adresse de livraison — vérifier si données financières.
3. EFTA00038250.pdf
- Dataset : 8
- Type : flight_log (registre de vol)
- Pages : 1
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 1 450 caractères
- Résumé : Log de vol pour l'avion N908JE (modèle Gulfstream G-IV) avec passagers (ex: Epstein, Maxwell, Dubin) et trajets (PBI-TEB-CMH). Dates : 26/11/1995 à 30/11/1995. [ALERTE] : Présence de Ghislaine Maxwell et Jeffrey Epstein — lien avec l'enquête en cours.
4. EFTA00038251.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 2
- Qualité texte : MOYENNE (texte partiellement corrompu)
- Taille texte : 2 100 caractères
- Résumé : Rapport du FBI daté du 18/06/2019 concernant l'affaire United States v. Jeffrey Epstein. Mention de Ghislaine Maxwell et de l'acte d'accusation (6 chefs d'accusation). [ALERTE] : Document judiciaire critique — à croiser avec les dossiers publics.
5. EFTA00038253.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou transactions)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableaux illisibles)
- Taille texte : 678 caractères
- Résumé : Relevés partiels avec montants en dollars (ex: "$29.94") et noms (ex: "Gigi Maxwell"). Formatage non exploitable sans OCR avancé. [ALERTE] : Données financières sensibles — à retravailler.
6. EFTA00038255.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 3
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 3 200 caractères
- Résumé : Déposition de Ghislaine Maxwell devant un grand jury (07/08/2020). Mention de corrections typographiques dans les chefs d'accusation (parjure). [ALERTE] : Témoignage sous serment — document clé pour l'enquête.
7. EFTA00038256.pdf
- Dataset : 8
- Type : correspondence (messages internes)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement corrompu)
- Taille texte : 980 caractères
- Résumé : Messages internes avec mentions de "IMPORTANT MESSAGE" et noms (ex: "1184", "Stephanie"). Formatage chaotique. [ALERTE] : Contient des références cryptiques — à analyser en contexte.
8. EFTA00038258.pdf
- Dataset : 8
- Type : photo (album de photos)
- Pages : 1
- Qualité texte : OCR_REQUIS (liste de fichiers image)
- Taille texte : 560 caractères
- Résumé :
Liste de fichiers image (ex:
DSC00923.JPG,veins0.JPG). Contenu visuel non extrait. Action : SKIP (les images seront traitées séparément par l'agent PHOTO).
9. EFTA00038259.pdf
- Dataset : 8
- Type : unknown (document non classable)
- Pages : 1
- Qualité texte : MAUVAISE (texte illisible)
- Taille texte : 120 caractères
- Résumé : Contenu indéchiffrable (artefacts OCR). Pas de métadonnées exploitables. Action : RETRY (réessayer avec un autre outil OCR).
10. EFTA00038260.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 1 800 caractères
- Résumé : Rapport du FBI sur les activités de Jeffrey Epstein (dates: 2005-2006). Mention de fax et de numéros de dossiers (ex: "05-368"). [ALERTE] : Preuves de communications avec les autorités — lien avec l'enquête.
11. EFTA00038261.pdf
- Dataset : 8
- Type : email (correspondance Amazon)
- Pages : 1
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 1 100 caractères
- Résumé : Confirmation de commande Amazon pour Gigi Maxwell (New York) avec montant total: $29.94. Adresse de livraison: New York, NY 10022. [ALERTE] : Preuve de transactions financières — à croiser avec d'autres relevés.
12. EFTA00038262.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement corrompu)
- Taille texte : 1 050 caractères
- Résumé :
Liste de contacts avec noms (ex: "Bamford Sir Anthony", "Barrister Clive") et numéros de téléphone (UK/US). Présence d'emails (ex:
alice@scbpartners.com). [ALERTE] : Données personnelles sensibles — confidentialité requise.
13. EFTA00038263.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 2
- Qualité texte : OCR_REQUIS (tableaux illisibles)
- Taille texte : 1 300 caractères
- Résumé : Relevés partiels avec montants en dollars et références de comptes. Formatage non exploitable sans OCR avancé. [ALERTE] : Données financières sensibles — à retravailler.
14. EFTA00038264.pdf
- Dataset : 8
- Type : flight_log (registre de vol)
- Pages : 1
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 1 500 caractères
- Résumé : Log de vol pour l'avion N908JE (modèle Gulfstream G-IV) avec passagers (ex: Epstein, Maxwell, Greenberg) et trajets (PBI-TEB-CMH). Dates : 29/11/1995 à 30/11/1995. [ALERTE] : Présence de Alan Greenberg (financier) — lien potentiel avec des réseaux financiers.
15. EFTA00038265.pdf
- Dataset : 8
- Type : correspondence (messages internes)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement corrompu)
- Taille texte : 870 caractères
- Résumé : Messages internes avec mentions de "IMPORTANT MESSAGE" et noms (ex: "1184", "Stephanie"). Formatage chaotique. [ALERTE] : Contient des références cryptiques — à analyser en contexte.
16. EFTA00038268.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : BONNE (extraction native claire)
- Taille texte : 1 600 caractères
- Résumé : Rapport du FBI sur les activités de Jeffrey Epstein (dates: 2005-2006). Mention de fax et de numéros de dossiers (ex: "05-368"). [ALERTE] : Preuves de communications avec les autorités — lien avec l'enquête.
17. EFTA00038270.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement corrompu)
- Taille texte : 950 caractères
- Résumé : Liste de contacts avec noms (ex: "Bismark Vanessa Von", "Birchall Martyn") et numéros de téléphone (US/UK/Europe). Présence d'emails. [ALERTE] : Données personnelles sensibles — confidentialité requise.
18. EFTA00038272.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 2
- Qualité texte : OCR_REQUIS (tableaux illisibles)
- Taille texte : 1 400 caractères
- Résumé : Relevés partiels avec montants en dollars et références de comptes. Formatage non exploitable sans OCR avancé. [ALERTE] : Données financières sensibles — à retravailler.
19. EFTA00038275.pdf
- Dataset : 8
- Type : flight_log (registre de vol)
- Pages : 1
- Qualité texte : BONNE *(extraction native claire
EpsteinFiles & Co — Doc Crawler