Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 10:30:39
[CRAWL] DataSet_8 OCR batch 137 — EFTA00024270 à EFTA00024358
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T10:30:39.505Z
CRAWL REPORT — 2024-05-25
DOCUMENTS TRAITÉS
Batch DataSet_8 OCR Batch 137 (EFTA00024270 à EFTA00024358)
Total : 30 documents traités
1. EFTA00024270.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (texte natif vide)
- Résumé : Document scanné illisible. Contient des artefacts de scan et des caractères corrompus. Aucune information exploitable.
- Action : [RETRY] — OCR requis avec outil spécialisé (Tesseract + nettoyage manuel).
2. EFTA00024275.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "4/%1 •\ 1 zio 0- tS Trtto"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
3. EFTA00024279.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "444 - AM/ 1.1."). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
4. EFTA00024285.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00003402"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
5. EFTA00024287.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00003607"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
6. EFTA00024291.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "ITEM WAS NOT SCANNED DESCRIPTION"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
7. EFTA00024292.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00003933"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
8. EFTA00024294.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00004064"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
9. EFTA00024295.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00004448"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
10. EFTA00024296.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00004450"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
11. EFTA00024297.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00004455"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
12. EFTA00024299.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00004460"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
13. EFTA00024301.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00005284"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
14. EFTA00024302.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00005290"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
15. EFTA00024303.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00005705"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
16. EFTA00024304.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00005714"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
17. EFTA00024305.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00005878"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
18. EFTA00024306.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00006043"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
19. EFTA00024307.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00007720"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
20. EFTA00024310.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00008417"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
21. EFTA00024311.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00008469"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
22. EFTA00024345.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00008497"). Aucune information exploitable.
- Action : [RETRY] — OCR requis.
23. EFTA00024346.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec artefacts. Contient des lignes de texte corrompues (ex: "EFTA00008708
EpsteinFiles & Co — Doc Crawler