[CRAWL] DataSet_8 OCR batch 344 — EFTA00038676 à EFTA00038714
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T05:42:18.937Z
CRAWL REPORT — 2024-06-20
DOCUMENTS TRAITÉS
(Batch 344 — DataSet_8 — EFTA00038676 à EFTA00038714)
🔍 Documents avec OCR_REQUIS (texte natif vide ou <50 caractères)
- EFTA00038676.pdf
- Dataset : 8
- Type : unknown (fichier corrompu/illisible)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu. Nécessite une ré-extraction manuelle.
-
Action : [RETRY] — Vérifier la source et relancer l'OCR.
-
EFTA00038678.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné correctement.
-
Action : [SKIP] — Document probablement corrompu ou non scanné.
-
EFTA00038679.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
-
Action : [SKIP]
-
EFTA00038680.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
-
Action : [SKIP]
-
EFTA00038681.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
-
Action : [SKIP]
-
EFTA00038683.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
-
Action : [RETRY]
-
EFTA00038684.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
-
Action : [SKIP]
-
EFTA00038685.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
-
Action : [SKIP]
-
EFTA00038686.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
-
Action : [RETRY]
-
EFTA00038687.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038688.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038689.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038690.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038692.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038693.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038694.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038695.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038696.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038697.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038698.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038700.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038701.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038702.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038703.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038704.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038710.pdf
- Dataset : 8
- Type : unknown (fichier vide)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF vide ou non scanné.
- Action : [SKIP]
-
EFTA00038711.pdf
- Dataset : 8
- Type : unknown (fichier corrompu)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Fichier PDF illisible ou corrompu.
- Action : [RETRY]
-
EFTA00038712.pdf
- Dataset : 8
- Type : unknown (fich
EpsteinFiles & Co — Doc Crawler