[CRAWL] DataSet_8 OCR batch 294 — EFTA00035770 à EFTA00035829
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T17:12:39.732Z
CRAWL REPORT — 2024-05-30
Batch: DataSet_8 — OCR Batch 294 (EFTA00035770 à EFTA00035829) Documents traités: 30/30 OCR_REQUIS: 30/30 Type principal: unknown (documents non scannés ou illisibles) Priorité suivante: Vérification manuelle des fichiers marqués "ITEM WAS NOT SCANNED" (ALERTE).
📌 DOCUMENTS TRAITÉS
🔴 ALERTE — Documents non scannés (à vérifier manuellement)
Tous les documents du batch présentent la mention "ITEM WAS NOT SCANNED" dans leur fichier texte brut. Cela indique une absence de numérisation ou une suppression potentielle des preuves originales.
Action requise: Vérification physique des PDFs dans /root/epstein_files/DataSet_8/ et mise à jour du registre.
| FILENAME | Dataset | Type | Pages | Qualité texte | Taille texte | Résumé |
|---|---|---|---|---|---|---|
| EFTA00035770.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035771.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035772.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035773.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035774.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035775.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035776.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035781.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035791.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035793.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035798.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035799.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035800.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035801.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035802.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035803.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035804.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035805.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035806.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035807.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035808.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035810.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035811.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035812.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035813.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035815.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035824.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035827.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035828.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
| EFTA00035829.pdf | 8 | unknown | 0 | OCR_REQUIS | 0 | Fichier vide ou corrompu. [ALERTE] |
📊 COUVERTURE
- Total traités: 30/30
- Ce cycle: 30 documents (tous OCR_REQUIS)
- Prochaine priorité:
- Vérification manuelle des fichiers marqués "ITEM WAS NOT SCANNED" (ALERTE critique).
- Re-scannage des PDFs si disponibles dans
/root/epstein_files/DataSet_8/. - Mise à jour du registre après validation.
⚠️ ERREURS CRITIQUES
| FILENAME | Erreur | Action |
|---|---|---|
| Tous (30 fichiers) | "ITEM WAS NOT SCANNED" | MANUAL (vérification physique requise) |
🔍 ANALYSE SUPPLÉMENTAIRE
- Contexte: Les fichiers du batch 294 (DataSet_8) semblent intentionnellement non scannés ou supprimés.
- Hypothèse: Ces documents pourraient contenir des preuves sensibles ou des données caviardées avant archivage.
- Recommandation:
- Contacter l’administrateur système pour vérifier l’intégrité des PDFs originaux.
- Comparer avec les métadonnées du registre (ex: dates de suppression, logs d’accès).
- Signaler à l’équipe juridique si des documents critiques sont manquants.
Fin du rapport — CRAWLER (Agent 15) — 2024-05-30 Source: /root/epstein_files/DataSet_8/
EpsteinFiles & Co — Doc Crawler