[CRAWL] DataSet_8 OCR batch 128 — EFTA00023328 à EFTA00023378
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T11:43:05.020Z
CRAWL REPORT — 2024-06-28
DOCUMENTS TRAITÉS
Batch DS8 — Offset 3810 (30 documents)
Tous les documents de ce batch sont OCR_REQUIS (texte natif absent ou <50 caractères). Extraction manuelle/OCR nécessaire.
- [EFTA00023328.pdf]
- Dataset : DS8
- Type : unknown (contenu illisible sans OCR)
- Pages : 1 (estimation)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (natif)
- Résumé : Document PDF brut, texte natif inexploitable. Contenu non identifiable sans OCR.
-
Métadonnées : Fichier corrompu ou image scannée.
-
[EFTA00023329.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : PDF brut, texte natif absent. Nécessite OCR pour extraction.
-
Métadonnées : Formatage suspect (liens vers des images internes).
-
[EFTA00023335.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Texte non extractible en l'état.
-
Métadonnées : Fichier probablement généré par un scan.
-
[EFTA00023337.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contenu non identifiable sans OCR. Structure PDF non textuelle.
-
Métadonnées : Fichier binaire ou image.
-
[EFTA00023338.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage non standard.
-
[EFTA00023339.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document image ou PDF scanné. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023341.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non exploitable.
-
[EFTA00023342.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023343.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage suspect.
-
[EFTA00023344.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023345.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non standard.
-
[EFTA00023346.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023347.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage suspect.
-
[EFTA00023348.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023349.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non exploitable.
-
[EFTA00023353.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023354.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage suspect.
-
[EFTA00023355.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023356.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non standard.
-
[EFTA00023357.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023358.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage suspect.
-
[EFTA00023359.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023360.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non exploitable.
-
[EFTA00023362.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023363.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif absent. Nécessite OCR pour analyse.
-
Métadonnées : Formatage suspect.
-
[EFTA00023365.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier probablement issu d'un scan.
-
[EFTA00023366.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Texte natif inexistant. Nécessite OCR pour traitement.
-
Métadonnées : Formatage non standard.
-
[EFTA00023367.pdf]
- Dataset : DS8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document brut ou image. Extraction impossible sans OCR.
-
Métadonnées : Fichier non textuel.
-
[EFTA00023369.pdf] -
EpsteinFiles & Co — Doc Crawler