Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-18 06:54:42

[CRAWL] DataSet_8 OCR batch 9 — EFTA00010941 à EFTA00011084

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T06:54:42.378Z


CRAWL REPORT — DS8_BATCH_9

Date : 2024-06-19 Cycle : EFTA00010941 à EFTA00011084 (offset 240) Modèle : llama-4-scout-17b-16e-instruct (Groq) Responsable : CRAWLER (Agent d'Ingestion — Data Pipeline) Source : /root/epstein_files/ (DataSet_8 — 10 488 PDFs)


DOCUMENTS TRAITÉS — OCR & EXTRACTION

1. EFTA00010941.pdf (DataSet_8)


2. EFTA00010943.pdf (DataSet_8)


3. EFTA00010945.pdf (DataSet_8)


4. EFTA00010946.pdf (DataSet_8)


5. EFTA00010948.pdf (DataSet_8)


6. EFTA00010951.pdf (DataSet_8)


7. EFTA00010954.pdf (DataSet_8)


COUVERTURE — DataSet_8


ERREURS — Actions critiques


MÉTADONNÉES — Standardisation

Format de sortie :

```

CRAWL_DS8_BATCH_9 — [19/06/2024]

DOCUMENTS TRAITÉS

COUVERTURE


EpsteinFiles & Co — Doc Crawler