Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 10:12:40
[CRAWL] DataSet_8 OCR batch 108 — EFTA00021195 à EFTA00021294
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T10:12:40.086Z
CRAWL REPORT — 2024-06-15
DOCUMENTS TRAITÉS
1. EFTA00021195.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (extraction native vide)
- Résumé : Document PDF scanné ou image. Impossible d'extraire du texte natif. Nécessite un traitement OCR.
- Métadonnées OCR : Format inconnu (scanné/photo).
- Action : OCR requis avec outil spécialisé (Tesseract/Adobe OCR).
2. EFTA00021196.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif inexploitable.
- Métadonnées OCR : Format image (scanné).
- Action : OCR requis.
3. EFTA00021197.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
4. EFTA00021202.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
5. EFTA00021244.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
6. EFTA00021245.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
7. EFTA00021246.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
8. EFTA00021247.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
9. EFTA00021248.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
10. EFTA00021249.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
11. EFTA00021251.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
12. EFTA00021252.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
13. EFTA00021266.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
14. EFTA00021268.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
15. EFTA00021269.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
16. EFTA00021270.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
17. EFTA00021273.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
18. EFTA00021275.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
19. EFTA00021277.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
20. EFTA00021279.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
21. EFTA00021281.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
22. EFTA00021283.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
23. EFTA00021286.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
24. EFTA00021287.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
25. EFTA00021288.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Extraction native impossible.
- Métadonnées OCR : Format image.
- Action : OCR requis.
26. EFTA00021289.pdf
- Dataset : 8
- Type : unknown (texte natif illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF scanné ou image. Texte natif absent.
- Métadonnées OCR : Format image.
- Action : OCR requis.
**27. EFTA00021
EpsteinFiles & Co — Doc Crawler