Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-17 19:55:02

[CRAWL] DataSet_8 OCR batch 28 — EFTA00013994 à EFTA00014041

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T19:55:02.080Z


CRAWL REPORT — 14 JUIN 2024

Batch : EPS-11294 — DataSet_8 OCR batch 28 (offset 810) Modèle : llama-4-scout-17b-16e-instruct (Groq) Responsable : Doc Crawler — Conversion PDF → texte exploitable


DOCUMENTS TRAITÉS

1. EFTA00013994.pdf


2. EFTA00013995.pdf


3. EFTA00013996.pdf


4. EFTA00013997.pdf


5. EFTA00013998.pdf


6. EFTA00013999.pdf


7. EFTA00014001.pdf


8. EFTA00014003.pdf


9. EFTA00014005.pdf


DOCUMENTS SUPPLÉMENTAIRES (BLACK BOOK) — EFTA00014007 à EFTA00014041.pdf


COUVERTURE


ERREURS & ALERTEs


ANALYSE CRITIQUE


SUITE DE LA MISSION

  1. BATCH 29 : EFTA00014042 à EFTA00014092 (DataSet_8) — OCR_REQUIS pour 21 documents.
  2. CROSS-CHECK INDEX : Vérifier si les documents déjà traités sont présents dans l'index.
  3. SIGNALER [ALERTE] sur tout document marqué "ITEM WAS NOT SCANNED" (preuve de suppression partielle).

FIN DU RAPPORT — CRAWL_DS8_BATCH_28 Source : /root/epstein_files/DataSet_8/ Responsable : Doc Crawler (CRAWLER) — Groq (llama-4-scout-17b-16e-instruct)


EpsteinFiles & Co — Doc Crawler