Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 07:12:19
[CRAWL] DataSet_8 OCR batch 19 — EFTA00013482 à EFTA00013526
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T07:12:19.553Z
CRAWL REPORT — 2024-05-25
Batch: DataSet_8 — OCR Batch 19 (EFTA00013482 à EFTA00013526) Documents traités: 30/30 OCR_REQUIS: 30/30 (tous les documents nécessitent une extraction OCR) Total couverture DS8: [À mettre à jour après validation]
DOCUMENTS TRAITÉS
1. EFTA00013482.pdf
- Dataset: 8
- Type: unknown (contenu illisible sans OCR)
- Pages: 1 (estimation)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères (texte natif vide)
- Résumé: Document non scanné ou corrompu. Contient des métadonnées de type "ITEM WAS NOT SCANNED".
- ALERTE: Document marqué "ITEM WAS NOT SCANNED" — preuve potentielle de suppression ou d'erreur d'archivage.
2. EFTA00013483.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL (vérification physique requise).
3. EFTA00013484.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
4. EFTA00013485.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
5. EFTA00013486.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
6. EFTA00013487.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
7. EFTA00013488.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
8. EFTA00013489.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
9. EFTA00013490.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
10. EFTA00013491.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
11. EFTA00013492.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
12. EFTA00013493.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
13. EFTA00013494.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
14. EFTA00013495.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
15. EFTA00013496.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
16. EFTA00013497.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
17. EFTA00013499.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
18. EFTA00013503.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
19. EFTA00013506.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
20. EFTA00013508.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
21. EFTA00013511.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
22. EFTA00013514.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
23. EFTA00013515.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
24. EFTA00013518.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
25. EFTA00013519.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
26. EFTA00013520.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
27. EFTA00013521.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Métadonnées similaires aux précédents.
- ALERTE: Document marqué "ITEM WAS NOT SCANNED".
28. EFTA00013523.pdf
- Dataset: 8
- Type: unknown
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Contenu illisible. Métadonnées indiquent une possible corruption ou un document non scanné.
- Action: MANUAL.
29. EFTA00013524.pdf
- Dataset: 8
- Type: **unknown
EpsteinFiles & Co — Doc Crawler