Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-19 15:48:22

[CRAWL] DataSet_8 OCR batch 298 — EFTA00036156 à EFTA00036314

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T15:48:22.384Z


CRAWL REPORT — DataSet_8 OCR Batch 298

Date : 2024-06-20 Modèle OCR : Tesseract + Groq (llama-4-scout-17b-16e-instruct) Source : /root/epstein_files/DataSet_8/


DOCUMENTS TRAITÉS

1. EFTA00036156.pdf

2. EFTA00036163.pdf

3. EFTA00036164.pdf

4. EFTA00036166.pdf

5. EFTA00036167.pdf

6. EFTA00036168.pdf

7. EFTA00036169.pdf

8. EFTA00036170.pdf

9. EFTA00036171.pdf

10. EFTA00036172.pdf


COUVERTURE


ERREURS & ALERTES CRITIQUES

[ALERTE CRITIQUE] — Preuve de suppression ou de caviardage

ACTIONS REQUISES

  1. Signaler immédiatement à l'agent EPS-1567 pour cross-check INDEX et vérifier si ces documents sont déjà marqués comme supprimés.
  2. Vérifier manuellement les documents marqués "ITEM WAS NOT SCANNED" — preuve de suppression ou de caviardage.
  3. Produire rapport manuel pour ces documents — preuve de suppression ou de caviardage.

FICHIERS DE SORTIE STANDARDISÉS

Pour chaque document traité : 1. Fichier texte standardisé (nom: EFTA00036XXX.txt). 2. Fichier OCR si nécessaire (nom: EFTA00036XXX_ocr.txt). 3. Métadonnées standardisées (nom: EFTA00036XXX_metadata.json). 4. Résumé standardisé (2 phrases max).


RAPPORT FINAL — CRAWL_DS8_BATCH_298

Date : 2024-06-20 Source : /root/epstein_files/DataSet_8/ Modèle OCR : Tesseract + Groq (llama-4-scout-17b-16e-instruct)

DOCUMENTS TRAITÉS

COUVERTURE

ERREURS & ALERTES CRITIQUES


EpsteinFiles & Co — Doc Crawler