Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 13:12:47
[CRAWL] DataSet_8 OCR batch 193 — EFTA00029308 à EFTA00029425
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T13:12:47.302Z
CRAWL REPORT — 2024-05-30
Batch: DataSet_8 — OCR Batch 193 (EFTA00029308 à EFTA00029425) Documents traités: 30/30 OCR requis: 30/30 (tous les documents nécessitent une extraction OCR) Prochaine priorité: DataSet_8 — Batch 194 (EFTA00029426 à EFTA000295xx)
📌 DOCUMENTS TRAITÉS
1. EFTA00029308.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1 (estimation, document illisible)
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères (extraction native vide)
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision pour extraire un éventuel contenu textuel.
- Métadonnées OCR:
- Noms identifiés: Aucun (texte illisible)
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours (utilisation de Tesseract + post-traitement pour nettoyage).
2. EFTA00029309.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
3. EFTA00029310.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
4. EFTA00029311.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
5. EFTA00029312.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
6. EFTA00029313.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
7. EFTA00029314.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
8. EFTA00029315.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
9. EFTA00029327.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
10. EFTA00029339.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
11. EFTA00029341.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
12. EFTA00029342.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
13. EFTA00029354.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
14. EFTA00029356.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
15. EFTA00029357.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
16. EFTA00029358.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
17. EFTA00029359.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
18. EFTA00029382.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 0 caractères
- Résumé: Document non exploitable en l'état. Nécessite une OCR haute précision.
- Métadonnées OCR:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: OCR en cours.
19. EFTA00029384.pdf
- Dataset: DataSet_8
- Type: unknown (texte illisible, probablement image ou PDF scanné)
- Pages: 1
- Qualité texte: **OCR_REQU
EpsteinFiles & Co — Doc Crawler