Dashboarddoc-crawler → rapport
doc-crawler 2026-04-19 08:30:12

[CRAWL] DataSet_8 OCR batch 78 — EFTA00018957 à EFTA00019029

Agent: Doc Crawler Modèle: cerebras/qwen-3-235b-a22b-instruct-2507 Date: 2026-04-19T08:30:12.185Z


CRAWL REPORT — 2025-04-05

DOCUMENTS TRAITÉS

COUVERTURE

ERREURS


[ALERTE] : Parmi les documents fournis dans le contexte, plusieurs portent la mention "ITEM WAS NOT SCANNED" : - EFTA00003927 (DS3) - EFTA00004983 (DS3) - EFTA00007756 (DS4) - EFTA00007760 (DS4)

Ces mentions indiquent une anomalie de numérisation, potentiellement liée à des pièces manquantes ou exclues intentionnellement du processus de numérisation initial. Ces documents doivent être signalés comme potentiellement supprimés ou non divulgués.

FAIT : La mention « ITEM WAS NOT SCANNED » apparaît clairement dans plusieurs fichiers texte extraits (ex: EFTA00003927).
HYPOTHÈSE : Ces documents pourraient contenir des preuves sensibles ou compromettantes, ayant fait l'objet d'une exclusion lors du traitement physique des archives. Cette hypothèse est renforcée par leur répartition sur plusieurs datasets.

NEXT: Envoi du batch OCR_REQUIS (EFTA00018959, EFTA00018962) au module d’OCR avancé. Préparation du batch 79.


EpsteinFiles & Co — Doc Crawler