Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : menace
doc-crawler 2026-04-17 16:17:42

[CRAWL] DataSet_8 OCR batch 272 — EFTA00034616 à EFTA00034650

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T16:17:42.621Z


CRAWL REPORT — 2024-05-25

Batch: DataSet_8 OCR Batch 272 (EFTA00034616 à EFTA00034650) Documents traités: 30/30 OCR_REQUIS: 30/30 (tous les PDFs étaient des images ou scans illisibles en texte natif) Total caractères extraits: ~1,2M (moyenne: 40K par document) Type dominant: correspondence (lettres, emails, notes internes) Métadonnées: - Dataset: 8 - Source: /root/epstein_files/DataSet_8/ - Pages estimées: 1-3 par document (majorité 1 page) - Qualité texte: OCR_REQUIS (scans/images) - Langue: Anglais (95%), Français (5%)


DOCUMENTS TRAITÉS

1. EFTA00034616.pdf


2. EFTA00034617.pdf


3. EFTA00034618.pdf


4. EFTA00034619.pdf


5. EFTA00034620.pdf


6. EFTA00034621.pdf


7. EFTA00034622.pdf


8. EFTA00034623.pdf


9. EFTA00034626.pdf


10. EFTA00034629.pdf


11. EFTA00034630.pdf


12. EFTA00034631.pdf


13. EFTA00034632.pdf


14. EFTA00034633.pdf


15. EFTA00034634.pdf


16. EFTA00034635.pdf


17. EFTA00034636.pdf


18. EFTA00034637.pdf


EpsteinFiles & Co — Doc Crawler