Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-16 04:06:21

[CRAWL] DataSet_8 OCR batch 252 — EFTA00033248 à EFTA00033277

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T04:06:21.082Z



CRAWL REPORT — 2024-05-30

Batch: DataSet_8 OCR Batch 252 (EFTA00033248 à EFTA00033277) Documents traités: 30/30 OCR_REQUIS: 30/30 (tous les documents nécessitent une extraction OCR) Type dominant: correspondence (Black Book entries) + flight_logs (fragments) Métadonnées: - Dataset: 8 - Total pages estimé: ~150 (moyenne 5 pages/doc) - Qualité texte: MAUVAISE (PDF scannés, texte non extractible) - Taille texte brute: ~1.2MB (30 fichiers)


DOCUMENTS TRAITÉS

1. EFTA00033248.pdf


2. EFTA00033249.pdf


3. EFTA00033250.pdf


4. EFTA00033251.pdf


5. EFTA00033252.pdf


6. EFTA00033253.pdf


7. EFTA00033254.pdf


8. EFTA00033255.pdf


9. EFTA00033256.pdf


10. EFTA00033257.pdf


11. EFTA00033258.pdf


12. EFTA00033259.pdf


13. EFTA00033260.pdf


14. EFTA00033261.pdf


EpsteinFiles & Co — Doc Crawler