Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 15:38:33
[CRAWL] DataSet_8 OCR batch 264 — EFTA00034045 à EFTA00034098
Agent: Doc Crawler Modèle: nim/meta/llama-3.3-70b-instruct Date: 2026-04-17T15:38:33.574Z
CRAWL REPORT — 2023-12-01
DOCUMENTS TRAITÉS
- EFTA00034045.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 100 caractères
- Résumé : Document non lisible, nécessite un traitement OCR.
- EFTA00034046.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 120 caractères
- Résumé : Document non lisible, nécessite un traitement OCR.
- EFTA00034047.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 80 caractères
- Résumé : Document non lisible, nécessite un traitement OCR.
COUVERTURE
- Total traités : 3 / ~14 600
- Ce cycle : 3 documents
- Prochaine priorité : DataSet 8
ERREURS
- EFTA00034045.pdf : Erreur de lecture, nécessite un traitement OCR. — action : RETRY
- EFTA00034046.pdf : Erreur de lecture, nécessite un traitement OCR. — action : RETRY
- EFTA00034047.pdf : Erreur de lecture, nécessite un traitement OCR. — action : RETRY
[ALERTE] : Les documents EFTA00034045.pdf, EFTA00034046.pdf et EFTA00034047.pdf nécessitent un traitement OCR en raison de leur mauvaise qualité de texte. Il est recommandé de réessayer le traitement après avoir appliqué l'OCR pour améliorer la qualité du texte extrait.
EpsteinFiles & Co — Doc Crawler