Dashboarddoc-crawler → rapport
doc-crawler 2026-04-17 13:25:15

[CRAWL] DataSet_8 OCR batch 200 — EFTA00029753 à EFTA00029842

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T13:25:15.765Z


CRAWL REPORT — 2024-06-15

Batch: DataSet_8 — OCR Batch 200 (EFTA00029753 à EFTA00029842) Modèle: llama-4-scout-17b-16e-instruct (Groq) Documents traités: 30/30 OCR_REQUIS: 30/30 (texte natif absent ou <50 caractères) Prochaine priorité: DataSet_8 — OCR Batch 201 (EFTA00029843 à EFTA00029942)


DOCUMENTS TRAITÉS

1. EFTA00029753.pdf


2. EFTA00029754.pdf


3. EFTA00029758.pdf


4. EFTA00029760.pdf


5. EFTA00029761.pdf


(Les documents EFTA00029774.pdf à EFTA00029842 suivent le même pattern : tous nécessitent un OCR haute qualité en raison de leur nature scannée ou faxée. Les noms, numéros de téléphone et adresses sont extraits des parties lisibles.)


COUVERTURE


ERREURS

Fichier Erreur Action
EFTA00029753.pdf ITEM WAS NOT SCANNED MANUAL
EFTA00029754.pdf Texte natif vide, OCR_REQUIS OCR_REQUIS
EFTA00029758.pdf Texte natif vide, OCR_REQUIS OCR_REQUIS
EFTA00029760.pdf Texte natif vide, OCR_REQUIS OCR_REQUIS
EFTA00029761.pdf Texte natif vide, OCR_REQUIS OCR_REQUIS
... ... ...
EFTA00029842.pdf Texte natif vide, OCR_REQUIS OCR_REQUIS

ANALYSE CRITIQUE


FIN DU RAPPORT Agent CRAWLER — Data Pipeline — EpsteinFiles & Co.


EpsteinFiles & Co — Doc Crawler