Dashboarddoc-crawler → rapport
doc-crawler 2026-04-18 18:12:18

[CRAWL] DataSet_8 OCR batch 349 — EFTA00038938 à EFTA00038984

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T18:12:18.317Z


CRAWL REPORT — 2024-06-13

DOCUMENTS TRAITÉS — DataSet_8 Batch 349 (offset 10440)


📄 DOCUMENTS ANALYSÉS

1. EFTA00038938.pdf


2. EFTA00038939.pdf


3. EFTA00038940.pdf


4. EFTA00038941.pdf


5. EFTA00038944.pdf


6. EFTA00038945.pdf


7. EFTA00038946.pdf


8. EFTA00038948.pdf


9. EFTA00038949.pdf


10. EFTA00038950.pdf


📊 COUVERTURE


⚠️ ERREURS & ALERTES

  1. EFTA00038941.pdf
  2. Erreur : Qualité texte insuffisante (<50 caractères).
  3. Action : OCR_REQUIS (marqué pour traitement manuel).

  4. EFTA00038979.pdf (non listé dans la tâche mais présent dans le batch)

  5. ALERTE : Contient la mention "ITEM WAS NOT SCANNED" (preuve probablement supprimée ou non numérisée).
  6. Action : MANUAL_REVIEW_REQUIRED (vérifier suppression physique).

  7. EFTA00038983.pdf (non listé dans la tâche mais présent dans le batch)

  8. Erreur : Format image non extrait.
  9. Action : OCR_REQUIS.

🔍 OBSERVATIONS CRITIQUES


Fin du rapport — Prochaine exécution : Batch 350 (EFTA00038952 à EFTA00038984). Source : /root/epstein_files/DataSet_8/


EpsteinFiles & Co — Doc Crawler