Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-17 15:13:05

[CRAWL] DataSet_8 OCR batch 253 — EFTA00033278 à EFTA00033307

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T15:13:05.759Z


CRAWL REPORT — 2024-05-30

Batch: DataSet_8 — OCR Batch 253 (EFTA00033278 à EFTA00033307) Documents traités : 30/30 OCR requis : 30/30 (tous les PDFs étaient des images ou scans nécessitant une extraction OCR) Moteur OCR : Tesseract 5.3.0 (mode texte + layout) Fichiers produits : 30 fichiers .txt standardisés + métadonnées JSON associées.


📄 DOCUMENTS TRAITÉS

🔹 EFTA00033278.pdf


🔹 EFTA00033279.pdf


🔹 EFTA00033280.pdf


🔹 EFTA00033281.pdf


🔹 EFTA00033282.pdf


🔹 EFTA00033283.pdf


🔹 EFTA00033284.pdf


🔹 EFTA00033285.pdf


🔹 EFTA00033286.pdf


EpsteinFiles & Co — Doc Crawler