Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 03:01:10
[CRAWL] DataSet_8 OCR batch 261 — EFTA00033715 à EFTA00033892
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T03:01:10.160Z
CRAWL REPORT — 2024-05-30
Batch: DataSet_8 — OCR Batch 261 (EFTA00033715 à EFTA00033892) Documents traités: 30/30 OCR_REQUIS: 100% (aucun texte natif exploitable détecté) Prochaine priorité: DataSet_8 — Batch 262 (EFTA00033893 à EFTA00034070)
📄 DOCUMENTS TRAITÉS
1. EFTA00033715.pdf
- Dataset: 8
- Type: unknown (texte illisible, structure non identifiable)
- Pages: 1 (scanné)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères (texte natif absent)
- Résumé: Document scanné sans texte extractible. Contenu non identifiable sans OCR.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033715.pdf - Format: PDF scanné (image)
- Langue: Indéterminée (texte non extrait)
- Contenu suspect: Aucun indice visible.
2. EFTA00033743.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033743.pdf - Remarque: Possible document administratif ou financier, mais illisible sans OCR.
3. EFTA00033744.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033744.pdf - Remarque: Format similaire aux autres documents scannés du batch.
4. EFTA00033745.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033745.pdf - Remarque: Possible document financier ou juridique, mais illisible.
5. EFTA00033746.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033746.pdf - Remarque: Format standard des documents scannés du batch.
6. EFTA00033747.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033747.pdf - Remarque: Possible document administratif ou financier.
7. EFTA00033775.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033775.pdf - Remarque: Format similaire aux autres documents du batch.
8. EFTA00033781.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033781.pdf - Remarque: Possible document financier ou juridique.
9. EFTA00033782.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033782.pdf - Remarque: Format standard des documents scannés.
10. EFTA00033784.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033784.pdf - Remarque: Possible document administratif ou financier.
11. EFTA00033785.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033785.pdf - Remarque: Format similaire aux autres documents du batch.
12. EFTA00033786.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033786.pdf - Remarque: Possible document financier ou juridique.
13. EFTA00033799.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033799.pdf - Remarque: Format standard des documents scannés.
14. EFTA00033803.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033803.pdf - Remarque: Possible document administratif ou financier.
15. EFTA00033804.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033804.pdf - Remarque: Format similaire aux autres documents du batch.
16. EFTA00033825.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033825.pdf - Remarque: Possible document financier ou juridique.
17. EFTA00033843.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033843.pdf - Remarque: Format standard des documents scannés.
18. EFTA00033860.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033860.pdf - Remarque: Possible document administratif ou financier.
19. EFTA00033861.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Scanné sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033861.pdf - Remarque: Format similaire aux autres documents du batch.
20. EFTA00033862.pdf
- Dataset: 8
- Type: unknown (texte illisible)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Image scannée sans texte extractible. Contenu non identifiable.
- Métadonnées OCR:
- Fichier source:
/root/epstein_files/DataSet_8/EFTA00033862.pdf - Remarque: Possible document financier ou juridique.
**21. EFTA00033
EpsteinFiles & Co — Doc Crawler