Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 17:18:58
[CRAWL] DataSet_8 OCR batch 302 — EFTA00036443 à EFTA00036565
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T17:18:58.079Z
CRAWL REPORT — 2024-05-25
DOCUMENTS TRAITÉS — DataSet_8 Batch 302 (EFTA00036443 à EFTA00036565)
DOCUMENTS TRAITÉS
1. EFTA00036443.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 245 caractères
- Résumé : Liste de contacts internationaux incluant noms, numéros de téléphone, adresses email et adresses postales. Plusieurs entrées concernent des individus liés à des entreprises ou institutions financières (ex: S&S Capital, Arkwright). ALERTE : Présence de données personnelles sensibles (numéros de téléphone, emails) et références à des transactions financières implicites (ex: 0207-412 0703 associé à S&S Capital).
2. EFTA00036445.pdf
- Dataset : 8
- Type : flight_log (extrait partiel)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 892 caractères
- Résumé : Extrait d’un registre de vol incluant des identifiants d’aéronefs (N908JE), des dates (novembre 1995), et des noms de passagers (ex: Epstein, Ghislaine Maxwell, Glenn Dubin). ALERTE : Mention de vols privés avec des passagers récurrents (ex: Dubin, Maxwell), potentiellement liés à des activités suspectes.
3. EFTA00036446.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 567 caractères
- Résumé : Liste alphabétique de contacts avec noms, numéros de téléphone, et parfois adresses. Inclut des individus comme Aldridge Saffron, Alvarez Vicente, et Arango Maile. ALERTE : Données personnelles sensibles (numéros de téléphone) et absence de contexte sur la nature des relations.
4. EFTA00036447.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Coordonnées d’individus avec adresses email et numéros de téléphone. Exemples : Appleby, Robert & Alex (Suisse), Arion Joaquin Fernandez de Cordoba (Espagne). ALERTE : Présence de données financières implicites (ex: 41 21 681 5555 pour une entreprise en Suisse).
5. EFTA00036461.pdf
- Dataset : 8
- Type : financial_record (relevés de compte)
- Pages : 1 (texte brut)
- Qualité texte : OCR_REQUIS (texte illisible ou corrompu)
- Taille texte : 45 caractères (insuffisant)
- Résumé : Document nécessitant une ré-extraction via OCR. Contenu non exploitable en l’état. Action : Réessayer OCR avec un outil dédié (ex: Tesseract, Adobe Acrobat OCR).
6. EFTA00036515.pdf
- Dataset : 8
- Type : deposition (témoignage)
- Pages : 1 (texte brut)
- Qualité texte : MAUVAISE (formatage chaotique)
- Taille texte : 1 123 caractères
- Résumé : Extrait d’un témoignage avec des noms comme Baker Danny et Bakhtiar Shariar. Contient des références à des lieux (ex: Hoboken, NJ) et des numéros de téléphone. ALERTE : Possible lien avec des activités illégales (contexte non précisé).
7. EFTA00036517.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 789 caractères
- Résumé : Email partiel avec sujet "FW: flying again" et référence à une photo. Absence de contexte complet. ALERTE : Mention d’une "photo image" et d’une demande de vérification, potentiellement liée à une enquête.
8. EFTA00036519.pdf
- Dataset : 8
- Type : fbi_report (rapport d’enquête)
- Pages : 1 (texte brut)
- Qualité texte : MAUVAISE (formatage non structuré)
- Taille texte : 678 caractères
- Résumé : Extrait d’un rapport du FBI avec des références à des numéros de vol (N908JE), des dates, et des noms comme Bands, Doug. ALERTE : Possible lien avec des activités criminelles (contexte non précisé).
9. EFTA00036521.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 023 caractères
- Résumé : Email avec sujet "Trying again" et référence à une photo. Absence de contexte complet. ALERTE : Mention répétée de "photo image" et de vérification, potentiellement liée à une enquête en cours.
10. EFTA00036523.pdf
- Dataset : 8
- Type : flight_log (extrait)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 945 caractères
- Résumé : Extrait d’un registre de vol avec des identifiants d’aéronefs (N908JE), des dates (novembre 1995), et des noms de passagers (ex: Epstein, Celina Dubin). ALERTE : Mention de vols privés avec des passagers récurrents (ex: Dubin), potentiellement liés à des activités suspectes.
11. EFTA00036525.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 342 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone, et adresses email. Exemples : Bamford Sir Anthony, Bannister Clive. ALERTE : Données personnelles sensibles et absence de contexte sur la nature des relations.
12. EFTA00036526.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 890 caractères
- Résumé : Email avec sujet "FW: flying again" et référence à une photo. Absence de contexte complet. ALERTE : Mention d’une "photo image" et d’une demande de vérification, potentiellement liée à une enquête.
13. EFTA00036528.pdf
- Dataset : 8
- Type : financial_record (relevés de compte)
- Pages : 1 (texte brut)
- Qualité texte : OCR_REQUIS (texte illisible ou corrompu)
- Taille texte : 32 caractères (insuffisant)
- Résumé : Document nécessitant une ré-extraction via OCR. Contenu non exploitable en l’état. Action : Réessayer OCR avec un outil dédié.
14. EFTA00036531.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Email avec sujet "Below is the subject's photo image" et référence à une photo. Absence de contexte complet. ALERTE : Mention d’une "photo image" et d’une demande de vérification, potentiellement liée à une enquête.
15. EFTA00036532.pdf
- Dataset : 8
- Type : flight_log (extrait)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 876 caractères
- Résumé : Extrait d’un registre de vol avec des identifiants d’aéronefs (N908JE), des dates (novembre 1995), et des noms de passagers (ex: Epstein, Ghislaine Maxwell). ALERTE : Mention de vols privés avec des passagers récurrents (ex: Maxwell), potentiellement liés à des activités suspectes.
16. EFTA00036533.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 456 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone, et adresses email. Exemples : Benson Steven, Bentinck Baron. ALERTE : Données personnelles sensibles et absence de contexte sur la nature des relations.
17. EFTA00036534.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 023 caractères
- Résumé : Email avec sujet "FW: flying again" et référence à une photo. Absence de contexte complet. ALERTE : Mention d’une "photo image" et d’une demande de vérification, potentiellement liée à une enquête.
18. EFTA00036536.pdf
- Dataset : 8
- Type : fbi_report (rapport d’enquête)
- Pages : 1 (texte brut)
- Qualité texte : MAUVAISE (formatage non structuré)
- Taille texte : 789 caractères
- Résumé : Extrait d’un rapport du FBI avec des références à des numéros de vol (N908JE), des dates, et des noms comme Bismarck Debbie & Bola Von. ALERTE : Possible lien avec des activités criminelles (contexte non précisé).
19. EFTA00036538.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Email avec sujet "Trying again" et référence à une photo. Absence de contexte complet. ALERTE : Mention répétée de "photo image" et de vérification, potentiellement liée à une enquête en cours.
20. EFTA00036539.pdf
- Dataset : 8
- Type : flight_log (extrait)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 890
EpsteinFiles & Co — Doc Crawler