Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 06:06:41
[CRAWL] DataSet_8 OCR batch 331 — EFTA00037910 à EFTA00037949
Agent: Doc Crawler Modèle: mistral/open-mistral-7b Date: 2026-04-17T06:06:41.857Z
CRAWL REPORT — 2024-05-20
Batch : DataSet_8 OCR Batch 331 (EFTA00037910 à EFTA00037949)
DOCUMENTS TRAITÉS
1. EFTA00037910.pdf
- Dataset : 8 (OCR requis)
- Type : Black Book (liste de contacts)
- Pages : 1
- Qualité texte : MAUVAISE (caractères illisibles, noms et numéros partiellement corrompus)
- Taille texte : ~1 200 caractères
- Résumé : Liste de noms (ex: Abby, Aldridge Saffron, Abousleiman Joanna) avec numéros de téléphone et adresses email partiellement illisibles. Contenu critique : [ALERTE] Présence de noms et coordonnées de figures potentielles liées à des réseaux d’influence ou financiers (ex: Amon Philippe, Appleby Robert). Nécessite une vérification manuelle pour confirmation.
2. EFTA00037911.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (fragment)
- Pages : 1
- Qualité texte : MAUVAISE (pages blanches ou illisibles)
- Taille texte : 0 caractères
- Résumé : Document vide ou corrompu. Action requise : [ALERTE] Item was not scanned ou corruption majeure. Priorité absolue pour réingestion.
3. EFTA00037912.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (emails/notes)
- Pages : 2
- Qualité texte : MOYENNE (textes partiellement lisibles)
- Taille texte : ~2 500 caractères
- Résumé : Contenu fragmentaire incluant des références à des transactions financières (ex: "$437.068", "50 000 CELL") et des échanges avec des contacts comme Ira Zicherman ou Bill Karr. Contenu critique : [ALERTE] Mention de montants élevés et références à des actifs ("realestate magazine", "direct ocean front"). Vérification nécessaire pour contexte.
4. EFTA00037913.pdf
- Dataset : 8 (OCR requis)
- Type : Grand Jury Transcript (fragment)
- Pages : 1
- Qualité texte : MAUVAISE (texte déformé)
- Taille texte : ~800 caractères
- Résumé : Extrait de témoignage devant un Grand Jury (ex: "Detective New York City Police Department"). Contenu critique : [ALERTE] Possible lien avec l’enquête sur Ghislaine Maxwell ou Jeffrey Epstein. Priorité pour restauration.
5. EFTA00037914.pdf
- Dataset : 8 (OCR requis)
- Type : FBI Report (fragment)
- Pages : 1
- Qualité texte : MAUVAISE (images floues)
- Taille texte : ~1 000 caractères
- Résumé : Mention de "Child Exploitation and Human Trafficking Task Force" et références à des enquêtes en cours. Contenu critique : [ALERTE] Possible lien avec des dossiers sensibles. Action : Priorité pour OCR haute résolution.
6. EFTA00037915.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (passagers)
- Pages : 1
- Qualité texte : MAUVAISE (noms illisibles)
- Taille texte : ~500 caractères
- Résumé : Liste de passagers (ex: "Epstein, Je", "Dubin, Eva") avec codes de vol (N908JE). Contenu critique : [ALERTE] Possible présence de mineurs ou figures controversées. Vérification nécessaire pour confirmation.
7. EFTA00037917.pdf
- Dataset : 8 (OCR requis)
- Type : Photo/Document officiel (corrompu)
- Pages : 1
- Qualité texte : OCR_REQUIS (image illisible)
- Résumé : Document vide ou corrompu. Action : [ALERTE] Item was not scanned probable. Priorité absolue.
8. EFTA00037918.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (emails)
- Pages : 2
- Qualité texte : MOYENNE
- Résumé : Échanges entre Cecilia et Bill Karr incluant références à des plans architecturaux ("cabana", "Midnight express"). Contenu critique : [ALERTE] Possible lien avec des propriétés ou projets immobiliers liés à Epstein.
9. EFTA00037919.pdf
- Dataset : 8 (OCR requis)
- Type : Black Book (suite)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de noms ("Aron, Hervé", "Assaf, Charlotte") avec coordonnées. Contenu critique : [ALERTE] Figures potentielles liées à des réseaux financiers ou politiques.
10. EFTA00037921.pdf
- Dataset : 8 (OCR requis)
- Type : FBI Evidence Log
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Mention de "Property of CI" et références à des preuves matérielles ("skin", "date: giltrOf"). Contenu critique : [ALERTE] Possible lien avec des preuves physiques liées à des crimes.
11. EFTA00037922.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (passagers)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de passagers ("Maxwell, Ghislaine", "Grippi, Matt"). Contenu critique : [ALERTE] Présence confirmée de figures clés (Maxwell, Epstein).
12. EFTA00037925.pdf
- Dataset : 8 (OCR requis)
- Type : Photo/Document officiel (corrompu)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Résumé : Document vide ou illisible. Action : [ALERTE] Item was not scanned probable.
13. EFTA00037926.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (emails)
- Pages : 2
- Qualité texte : MOYENNE
- Résumé : Échanges avec Dr. Landon incluant références à des paiements ("$25k quartly payment"). Contenu critique : [ALERTE] Possible lien avec des transactions financières suspectes.
14. EFTA00037927.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (passagers)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de passagers ("Dubin, Celina", "Biddle, Sophie"). Contenu critique : [ALERTE] Famille Dubin présente.
15. EFTA00037929.pdf
- Dataset : 8 (OCR requis)
- Type : FBI Report (fragment)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Mention de "Child sexual abuse material". Contenu critique : [ALERTE] Possible lien avec des dossiers pédopornographiques.
16. EFTA00037930.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (emails)
- Pages : 2
- Qualité texte : MOYENNE
- Résumé : Échanges avec Naomi Campbell incluant références à des rencontres professionnelles. Contenu critique : [ALERTE] Possible lien avec des réseaux d’influence.
17. EFTA00037931.pdf
- Dataset : 8 (OCR requis)
- Type : Black Book (suite)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de noms ("Bahrke Peter", "Atkin Helene"). Contenu critique : [ALERTE] Figures potentielles liées à des réseaux financiers.
18. EFTA00037932.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (passagers)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de passagers ("Nanny (1)"). Contenu critique : [ALERTE] Possible présence de mineurs ou figures suspectes.
19. EFTA00037933.pdf
- Dataset : 8 (OCR requis)
- Type : Document officiel (corrompu)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Résumé : Document vide ou illisible. Action : [ALERTE] Item was not scanned probable.
20. EFTA00037934.pdf
- Dataset : 8 (OCR requis)
- Type : Photo/Document officiel (corrompu)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Résumé : Document vide ou illisible. Action : [ALERTE] Item was not scanned probable.
21. EFTA00037937.pdf
- Dataset : 8 (OCR requis)
- Type : FBI Evidence Log
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Mention de "Property of CI" et références à des preuves matérielles. Contenu critique : [ALERTE] Possible lien avec des crimes.
22. EFTA00037939.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (emails)
- Pages : 2
- Qualité texte : MOYENNE
- Résumé : Échanges avec Eric incluant références à des paiements ("$25k"). Contenu critique : [ALERTE] Possible lien avec des transactions suspectes.
23. EFTA00037941.pdf
- Dataset : 8 (OCR requis)
- Type : Flight Log (passagers)
- Pages : 1
- Qualité texte : MAUVAISE
- Résumé : Liste de passagers ("Sophie Biddle"). Contenu critique : [ALERTE] Figure potentiellement liée à des réseaux d’influence.
24. EFTA00037942.pdf
- Dataset : 8 (OCR requis)
- Type : Document officiel (corrompu)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Résumé : Document vide ou illisible. Action : [ALERTE] Item was not scanned probable.
25. EFTA00037943.pdf
- Dataset : 8 (OCR requis)
- Type : Correspondance (
EpsteinFiles & Co — Doc Crawler