[CRAWL] DataSet_8 OCR batch 99 — EFTA00020577 à EFTA00020689
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T22:24:49.072Z
CRAWL REPORT — DataSet_8 Batch 99 (EFTA00020577 à EFTA00020689)
Date: 2024-06-20 Modèle OCR: Groq (llama-4-scout-17b-16e-instruct) Source: /root/epstein_files/DataSet_8/
DOCUMENTS TRAITÉS — OCR_REQUIS (extraction native <50 caractères)
Batch 99 — 30 documents analysés. Tous marqués OCR_REQUIS (texte natif absent ou illisible). Source identifiée: fragments de BLACK BOOK (listes de contacts) et FLIGHT LOGS (registres de vols).
Détails par document (extraction manuelle des fragments visibles) :
- EFTA00020577.pdf :
- Dataset : 8
- Type : unknown (fragments de listes)
- Pages : 1 (fragmentaire)
- Qualité texte : OCR_REQUIS (illlisible)
- Taille texte : <50 caractères (extraction native vide)
-
Résumé : Fragments de noms et numéros de téléphone (ex: "Abby 07944 574 202"). Contenu critique non identifiable (fragments illisibles).
-
EFTA00020578.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone (ex: "Adam, Nick 19 Rue De Lille..."). Aucun contenu critique identifiable (fragments illisibles).
-
EFTA00020584.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec noms, adresses, et numéros de téléphone. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020592.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique (fragments illisibles).
-
EFTA00020596.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020621.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).
-
EFTA00020622.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020623.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique (fragments illisibles).
-
EFTA00020624.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
-
Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020625.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. [ALERTE] ITEM WAS NOT SCANNED — DESCRIPTION MANQUANTE (preuve probablement supprimée ou non scannée).
-
EFTA00020626.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020627.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).
-
EFTA00020629.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
-
EFTA00020645.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).
-
EFTA00020659.pdf :
- Dataset : 8
- **Type
EpsteinFiles & Co — Doc Crawler