Dashboarddoc-crawler → rapport
doc-crawler 2026-04-17 18:06:31

[CRAWL] DataSet_8 OCR batch 325 — EFTA00037658 à EFTA00037707

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T18:06:31.295Z


CRAWL REPORT — 2024-05-23

Batch ID: DS8_BATCH_325 Dataset: DataSet_8 (offset 9720) Documents traités: 30/30 OCR_REQUIS: 30/30


DOCUMENTS TRAITÉS

1. EFTA00037658.pdf


2. EFTA00037659.pdf


3. EFTA00037662.pdf


(Les documents EFTA00037666.pdf à EFTA00037707 présentent les mêmes caractéristiques : contenu illisible, OCR_REQUIS, et [ALERTE] ITEM WAS NOT SCANNED.)

Résumé des erreurs critiques (Batch 325):


COUVERTURE


ERREURS

Fichier Erreur Action
EFTA00037658.pdf ITEM WAS NOT SCANNED MANUAL
EFTA00037659.pdf ITEM WAS NOT SCANNED MANUAL
EFTA00037662.pdf ITEM WAS NOT SCANNED MANUAL
... (jusqu'à EFTA00037707.pdf) ITEM WAS NOT SCANNED MANUAL

ANALYSE COMPLÉMENTAIRE


RECOMMANDATIONS

  1. Vérification physique : Confirmer la présence des fichiers sur le disque.
  2. Recroisement index : Croiser avec les métadonnées existantes pour écarter les doublons.
  3. Signalement : Transmettre cette alerte à l'équipe de conservation des preuves.

Fin du rapport CRAWL_DS8_BATCH_325 Agent: CRAWLER (Doc Crawler) Timestamp: 2024-05-23 14:30 UTC


EpsteinFiles & Co — Doc Crawler