Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 08:43:01
[CRAWL] DataSet_8 OCR batch 62 — EFTA00017058 à EFTA00017139
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T08:43:01.162Z
CRAWL REPORT — 2024-05-15
MISSION: DataSet_8 OCR Batch 62 — EFTA00017058 à EFTA00017139 PROVIDER: Groq (llama-4-scout-17b-16e-instruct) STATUT: 30 documents traités — OCR requis pour 100% des fichiers (texte natif absent ou <50 caractères).
DOCUMENTS TRAITÉS
1. EFTA00017058.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1 (document vide ou corrompu)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent). Nécessite OCR manuel ou correction de corruption.
- Action : [RETRY]
2. EFTA00017061.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte natif.
- Action : [RETRY]
3. EFTA00017063.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
4. EFTA00017064.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
5. EFTA00017066.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
6. EFTA00017067.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
7. EFTA00017068.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
8. EFTA00017070.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
9. EFTA00017074.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
10. EFTA00017084.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
11. EFTA00017085.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
12. EFTA00017090.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
13. EFTA00017091.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
14. EFTA00017092.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
15. EFTA00017093.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
16. EFTA00017094.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
17. EFTA00017095.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
18. EFTA00017101.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
19. EFTA00017102.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
20. EFTA00017104.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
21. EFTA00017105.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
22. EFTA00017107.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
23. EFTA00017108.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
24. EFTA00017109.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou corrompu. Nécessite OCR manuel.
- Action : [RETRY]
25. EFTA00017123.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte natif absent).
- Action : [RETRY]
26. EFTA00017124.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document PDF vide ou illisible. Impossible d'extraire du texte.
- Action : [RETRY]
27. EFTA00017125.pdf
- Dataset : 8
- Type : unknown (contenu illisible, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF inutilisable (texte nat
EpsteinFiles & Co — Doc Crawler