Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 13:30:21
[CRAWL] DataSet_8 OCR batch 208 — EFTA00030279 à EFTA00030339
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T13:30:21.645Z
CRAWL REPORT — 2024-05-20
Batch: DataSet_8 OCR Batch 208 (EFTA00030279 à EFTA00030339) Documents traités: 30/30 OCR_REQUIS: 30/30 (texte natif absent ou <50 caractères) Type dominant: unknown (documents scannés ou images) Priorité suivante: DataSet_8 — Batch 209 (EFTA00030340 à EFTA00030370)
DOCUMENTS TRAITÉS
1. EFTA00030279.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères (texte natif absent)
- Résumé: Document non scanné correctement. Contient des métadonnées d'archive mais pas de contenu textuel exploitable.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY (OCR manuel recommandé)
2. EFTA00030280.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte natif. Contient des en-têtes d'archive (ex: "Palm Beach PD").
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
3. EFTA00030281.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des références à des disques DVD ("Disk 1 of 16").
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
4. EFTA00030287.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des en-têtes de type "ITEM WAS NOT SCANNED".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document corrompu ou illisible)
5. EFTA00030288.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des références à des "MetroPCS Call Detail".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
6. EFTA00030289.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des en-têtes de type "AUDIOTAPE INVENTORY".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
7. EFTA00030290.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des références à des "Chain of Custody".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
8. EFTA00030292.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des en-têtes de type "United States v. Ghislaine Maxwell".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
9. EFTA00030293.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des références à des "Flight Logs".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
10. EFTA00030294.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des en-têtes de type "BLACK BOOK".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
11. EFTA00030295.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des en-têtes de type "UNITED STATES GRAND JURY".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
12. EFTA00030296.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des références à des "MetroPCS Call Detail".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
13. EFTA00030297.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des en-têtes de type "AUDIOTAPE INVENTORY".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
14. EFTA00030298.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des références à des "Chain of Custody".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
15. EFTA00030300.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des en-têtes de type "United States v. Ghislaine Maxwell".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
16. EFTA00030301.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des références à des "Flight Logs".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
17. EFTA00030302.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des en-têtes de type "BLACK BOOK".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
18. EFTA00030303.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans texte exploitable. Contient des en-têtes de type "UNITED STATES GRAND JURY".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY
19. EFTA00030304.pdf
- Dataset: DS8
- Type: unknown (document scanné)
- Pages: 1 (image)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document scanné sans contenu textuel. Contient des références à des "MetroPCS Call Detail".
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Auc
EpsteinFiles & Co — Doc Crawler