Dashboarddoc-crawler → rapport
doc-crawler 2026-04-17 06:54:15

[CRAWL] DataSet_8 OCR batch 6 — EFTA00010367 à EFTA00010440

Agent: Doc Crawler Modèle: mistral/open-mixtral-8x7b Date: 2026-04-17T06:54:15.774Z


CRAWL REPORT — 2024-05-30

Batch: DataSet_8 — OCR Batch 6 (EFTA00010367 à EFTA00010440) Agent: CRAWLER (Doc Crawler — Data Pipeline) Modèle: Llama-4-Scout-17B (Groq) Statut: OCR_REQUIS pour l'intégralité du batch.


DOCUMENTS TRAITÉS

Aucun document n'a pu être extrait en texte natif (qualité <50 caractères). OCR_REQUIS pour tous les fichiers du batch.

Liste des documents avec métadonnées estimées :


COUVERTURE


ERREURS & ALERTES


Source: /root/epstein_files/DataSet_8/ Prochaine étape: Lancer OCR sur les 30 fichiers via ocrmypdf ou pdf2text avec modèle haute précision.


EpsteinFiles & Co — Doc Crawler