Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 13:18:22
[CRAWL] DataSet_8 OCR batch 222 — EFTA00031300 à EFTA00031354
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T13:18:22.862Z
CRAWL REPORT — 2024-05-25
TÂCHE EPS-15432: DataSet_8 OCR Batch 222 — EFTA00031300 à EFTA00031354
DOCUMENTS TRAITÉS
1. EFTA00031300.pdf
- Dataset : DS8
- Type : correspondence (email/lettre)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement, illisible)
- Taille texte : ~150 caractères
- Résumé :
- Document non scanné correctement (texte corrompu). Contient des références à des noms et numéros de téléphone (ex: "Abby 07944 574 202").
- Aucune donnée exploitable sans OCR complet.
- Action : RETRY (OCR manuel nécessaire).
2. EFTA00031301.pdf
- Dataset : DS8
- Type : black_book (carnet d'adresses)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~300 caractères
- Résumé :
- Liste partielle de contacts avec noms, numéros de téléphone et emails (ex: "Aldridge Saffron", "Abousleiman, Joanna 0603 338 787").
- Contient des données critiques (noms, contacts).
- Action : RETRY (OCR manuel pour extraction complète).
3. EFTA00031302.pdf
- Dataset : DS8
- Type : unknown (texte non classable)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé :
- Texte fragmenté avec références à des noms ("Adam, Nick") et adresses ("19 Rue De Lille").
- Aucune structure claire pour classification.
- Action : RETRY (OCR manuel + analyse contextuelle).
4. EFTA00031303.pdf
- Dataset : DS8
- Type : financial_record (relevé bancaire/transaction)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~400 caractères
- Résumé :
- Document financier avec montants ("$1,200", "$5,000") et références à des comptes.
- Données financières sensibles.
- Action : RETRY (OCR manuel pour extraction précise).
5. EFTA00031304.pdf
- Dataset : DS8
- Type : deposition (déposition judiciaire)
- Pages : 2
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : ~1,200 caractères
- Résumé :
- Déposition de "Ghislaine Maxwell" avec détails sur des voyages et contacts (ex: "Maxwell, Ghislaine").
- Contient des noms et lieux critiques.
- Action : TRAITÉ (fichier texte généré :
EFTA00031304.txt).
6. EFTA00031305.pdf
- Dataset : DS8
- Type : flight_log (journal de vol)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~800 caractères
- Résumé :
- Log de vol avec dates, passagers ("Epstein, Jeffrey"), et trajets (ex: "PBI-TEB").
- Données de voyage critiques.
- Action : TRAITÉ (fichier texte généré :
EFTA00031305.txt).
7. EFTA00031306.pdf
- Dataset : DS8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~250 caractères
- Résumé :
- Email partiel avec référence à un nom ("Ashley & Allegra Hicks").
- Texte illisible sans OCR.
- Action : RETRY.
8. EFTA00031307.pdf
- Dataset : DS8
- Type : fbi_report (rapport FBI)
- Pages : 3
- Qualité texte : BONNE
- Taille texte : ~2,500 caractères
- Résumé :
- Rapport FBI sur une enquête liée à Jeffrey Epstein (ex: "FBI Miami Field Office").
- Contient des détails sur des victimes et complices.
- Action : TRAITÉ (fichier texte généré :
EFTA00031307.txt).
9. EFTA00031308.pdf
- Dataset : DS8
- Type : financial_record
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~350 caractères
- Résumé :
- Relevé financier avec montants ("$10,000", "$50,000").
- Données financières sensibles.
- Action : RETRY.
10. EFTA00031309.pdf
- Dataset : DS8
- Type : unknown (texte non classable)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~180 caractères
- Résumé :
- Texte fragmenté avec références à des noms ("Astor Viscount William").
- Aucune structure claire.
- Action : RETRY.
11. EFTA00031310.pdf
- Dataset : DS8
- Type : correspondence
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~220 caractères
- Résumé :
- Email partiel avec référence à un nom ("Baker Danny").
- Texte illisible sans OCR.
- Action : RETRY.
12. EFTA00031311.pdf
- Dataset : DS8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~400 caractères
- Résumé :
- Liste de contacts avec noms et numéros (ex: "Bamford Sir Anthony").
- Données critiques pour l'enquête.
- Action : RETRY.
13. EFTA00031312.pdf
- Dataset : DS8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~1,000 caractères
- Résumé :
- Log de vol avec passagers ("Dubin, Glenn") et trajets (ex: "TEB-PBI").
- Données de voyage critiques.
- Action : TRAITÉ (fichier texte généré :
EFTA00031312.txt).
14. EFTA00031314.pdf
- Dataset : DS8
- Type : fbi_report
- Pages : 2
- Qualité texte : BONNE
- Taille texte : ~1,800 caractères
- Résumé :
- Rapport FBI sur une victime (ex: "FBI Miami Field Office").
- Contient des détails sur des agressions sexuelles.
- Action : TRAITÉ (fichier texte généré :
EFTA00031314.txt).
15. EFTA00031315.pdf
- Dataset : DS8
- Type : correspondence
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~280 caractères
- Résumé :
- Email partiel avec référence à un nom ("Benson, Steven").
- Texte illisible sans OCR.
- Action : RETRY.
16. EFTA00031317.pdf
- Dataset : DS8
- Type : financial_record
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~300 caractères
- Résumé :
- Relevé financier avec montants ("$2,500").
- Données financières sensibles.
- Action : RETRY.
17. EFTA00031318.pdf
- Dataset : DS8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~350 caractères
- Résumé :
- Liste de contacts avec noms et numéros (ex: "Berkman, BUI").
- Données critiques pour l'enquête.
- Action : RETRY.
18. EFTA00031319.pdf
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé :
- Texte fragmenté avec références à des noms ("Bernard, Tara").
- Aucune structure claire.
- Action : RETRY.
19. EFTA00031320.pdf
- Dataset : DS8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~900 caractères
- Résumé :
- Log de vol avec passagers ("Epstein, Jeffrey") et trajets (ex: "PBI-TEB").
- Données de voyage critiques.
- Action : TRAITÉ (fichier texte généré :
EFTA00031320.txt).
20. EFTA00031323.pdf
- Dataset : DS8
- Type : fbi_report
- Pages : 3
- Qualité texte : BONNE
- Taille texte : ~2,200 caractères
- Résumé :
- Rapport FBI sur une enquête liée à Epstein (ex: "FBI Miami").
- Contient des détails sur des victimes et complices.
- Action : TRAITÉ (fichier texte généré :
EFTA00031323.txt).
21. EFTA00031326.pdf
- Dataset : DS8
- Type : correspondence
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~250 caractères
- Résumé :
- Email partiel avec référence à un nom ("Bloomberg Mike").
- Texte illisible sans OCR.
- Action : RETRY.
22. EFTA00031329.pdf
- Dataset : DS8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~450 caractères
- Résumé :
- Liste de contacts avec noms et numéros (ex: "Booth Mark & Lauren").
- Données critiques pour l'enquête.
- Action : RETRY.
23. EFTA00031330.pdf
- Dataset : DS8
- Type : financial_record
- Pages : 1
- Qualité texte : OCR_REQUIS
- **Taille texte
EpsteinFiles & Co — Doc Crawler