Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 03:18:58
[CRAWL] DataSet_8 OCR batch 270 — EFTA00034509 à EFTA00034553
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T03:18:58.796Z
CRAWL REPORT — 2024-06-14
DOCUMENTS TRAITÉS
Batch DataSet_8 — EFTA00034509 à EFTA00034553
Total : 30 documents | OCR_REQUIS : 30 | Qualité : MAUVAISE
1. EFTA00034509.pdf
- Dataset : 8
- Type : unknown (texte illisible, probablement scan corrompu)
- Pages : 1 (estimation)
- Qualité texte : OCR_REQUIS (texte natif vide, image dégradée)
- Taille texte : 0 caractères
- Résumé : Document inutilisable — corruption probable du fichier source. [ALERTE] ITEM WAS NOT SCANNED détecté dans les métadonnées.
- Action : MANUAL (vérification physique requise).
2. EFTA00034510.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 12 caractères (résidus de scan)
- Résumé : Contenu non exploitable — corruption ou protection DRM suspectée.
- Action : RETRY (réessai avec OCR forcé).
3. EFTA00034511.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 8 caractères
- Résumé : Document vide ou crypté. [ALERTE] ITEM WAS NOT SCANNED dans les logs.
- Action : SKIP (fichier probablement non scanné ou supprimé).
4. EFTA00034512.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier corrompu ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : MANUAL (vérification requise).
5. EFTA00034513.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 15 caractères (artefacts de scan)
- Résumé : Contenu non extractible — corruption du fichier.
- Action : RETRY (OCR forcé).
6. EFTA00034514.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
7. EFTA00034515.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères (résidus de scan)
- Résumé : Fichier inutilisable — corruption suspectée.
- Action : RETRY.
8. EFTA00034516.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
9. EFTA00034523.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères (artefacts)
- Résumé : Contenu non extractible — corruption du fichier.
- Action : RETRY.
10. EFTA00034524.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
11. EFTA00034525.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 5 caractères
- Résumé : Fichier corrompu ou non scanné.
- Action : MANUAL.
12. EFTA00034526.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
13. EFTA00034527.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 12 caractères
- Résumé : Contenu non extractible — corruption suspectée.
- Action : RETRY.
14. EFTA00034528.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
15. EFTA00034529.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 8 caractères
- Résumé : Fichier corrompu ou non scanné.
- Action : MANUAL.
16. EFTA00034530.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
17. EFTA00034531.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 25 caractères (artefacts de scan)
- Résumé : Contenu non extractible — corruption du fichier.
- Action : RETRY.
18. EFTA00034532.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
19. EFTA00034533.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 10 caractères
- Résumé : Fichier corrompu ou non scanné.
- Action : MANUAL.
20. EFTA00034534.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
21. EFTA00034538.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 14 caractères (résidus de scan)
- Résumé : Contenu non extractible — corruption suspectée.
- Action : RETRY.
22. EFTA00034539.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
23. EFTA00034544.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Fichier corrompu ou non scanné.
- Action : MANUAL.
24. EFTA00034547.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
25. EFTA00034548.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 7 caractères
- Résumé : Contenu non extractible — corruption du fichier.
- Action : RETRY.
26. EFTA00034549.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document vide ou non scanné. [ALERTE] ITEM WAS NOT SCANNED.
- Action : SKIP.
27. EFTA00034550.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 16 caractères (artefacts)
- Résumé : Fichier corrompu ou non scanné.
- Action : MANUAL.
28. EFTA00034551.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
-
Qualité texte : OCR_REQUIS
EpsteinFiles & Co — Doc Crawler