Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 09:54:52
[CRAWL] DataSet_8 OCR batch 120 — EFTA00022329 à EFTA00022455
Agent: Doc Crawler Modèle: mistral/open-mixtral-8x7b Date: 2026-04-19T09:54:52.203Z
CRAWL REPORT — 15/09/2024
DOCUMENTS TRAITÉS
EFTA00022329.pdf
- Dataset : 8
- Type : unknown (contenu non textuel, images uniquement)
- Pages : 1 (vérification visuelle)
- Qualité texte : OCR_REQUIS (texte inexistant)
- Taille texte : 0 caractères
- Résumé : Document composé uniquement d'images (photos de paysages, nuages, couchers de soleil). Aucune métadonnée exploitable en l'état.
- Détails : Contient des fichiers JPG/DSCF référencés (ex: DSCF00787.JPG). Nécessite OCR ciblé sur les images.
EFTA00022331.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: DSC00787.JPG, DSC00780.JPG). Aucune transcription disponible.
- Détails : Référence à des dossiers comme
pb/lsj clouds/bird. À traiter avec OCR haute résolution.
EFTA00022343.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC02033.JPG à DSC02092.JPG). Contenu visuel uniquement.
- Détails : Intitulé "Jean Luc 2" — probablement des photos personnelles ou professionnelles.
EFTA00022344.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: pics01.JPG à pics55.JPG). Contenu visuel.
- Détails : Référence à "J.L. pics" — pourrait être lié à Jeffrey Epstein ou un collaborateur.
EFTA00022346.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: J.L. pics056.JPG à J.L. pics105.JPG). Contenu visuel.
- Détails : Continuité avec EFTA00022344.pdf — même source probable.
EFTA00022347.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: DSCF0017_1.TIF à DSCF0167_1.TIF). Contenu visuel.
- Détails : Référence à "Chateau Villette" — lieu potentiellement lié à Epstein (propriété en France).
EFTA00022348.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC03611.JPG à DSC03640.JPG). Contenu visuel.
- Détails : Intitulé "Taos skiing" — référence à des vacances ou un événement à Taos (Nouveau-Mexique).
EFTA00022349.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers vidéo (ex: MOV03623.MPG, MOV07237.MPG) et images. Contenu multimédia.
- Détails : Continuité avec EFTA00022348.pdf — même thème (Taos).
EFTA00022351.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: L1010020.JPG). Contenu visuel.
- Détails : Intitulé "LSJ sunsets/Paris 07" — référence à des photos de couchers de soleil à Paris.
EFTA00022356.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec mention "ITEM WAS NOT SCANNED". Preuve de suppression ou d'erreur de traitement.
- Détails : [ALERTE] Document marqué comme non scanné — investigation requise pour vérifier l'intégrité du fichier source.
EFTA00022358.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: DSCF0001_1.TIF à DSCF0166_1.TIF). Contenu visuel.
- Détails : Continuité avec EFTA00022347.pdf — même source probable.
EFTA00022360.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSCF0167_1.TIF à DSCF0195_1.TIF). Contenu visuel.
- Détails : Continuité avec EFTA00022358.pdf.
EFTA00022361.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec mention "ITEM WAS NOT SCANNED". Preuve de suppression ou d'erreur de traitement.
- Détails : [ALERTE] Document marqué comme non scanné — investigation requise.
EFTA00022363.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC07207.JPG à DSC07233.JPG). Contenu visuel.
- Détails : Continuité avec EFTA00022349.pdf — même thème (Taos).
EFTA00022364.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers vidéo (ex: MOV07237.MPG) et images. Contenu multimédia.
- Détails : Continuité avec EFTA00022363.pdf.
EFTA00022365.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC07235.JPG à DSC07236.JPG). Contenu visuel.
- Détails : Continuité avec EFTA00022364.pdf.
EFTA00022366.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec mention "ITEM WAS NOT SCANNED". Preuve de suppression ou d'erreur de traitement.
- Détails : [ALERTE] Document marqué comme non scanné — investigation requise.
EFTA00022367.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC00482.JPG à DSC00483.JPG). Contenu visuel.
- Détails : Intitulé "PB sunset/clouds/misc." — référence à des photos de couchers de soleil.
EFTA00022377.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: DSCF0016_1.TIF à DSCF0028_1.TIF). Contenu visuel.
- Détails : Continuité avec EFTA00022358.pdf.
EFTA00022383.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers JPG (ex: DSC00709.JPG à DSC00779.JPG). Contenu visuel.
- Détails : Continuité avec EFTA00022367.pdf.
EFTA00022391.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de fichiers image (ex: DSCF0008_1.TIF à DSCF0028_1.TIF). Contenu visuel.
- Détails : Continuité avec EFTA00022377.pdf.
EFTA00022399.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document scanné avec mention "ITEM WAS NOT SCANNED". Preuve de suppression ou d'erreur de traitement.
- Détails : [ALERTE] Document marqué comme non scanné — investigation requise.
EFTA00022407.pdf
- Dataset : 8
- Type : unknown (contenu non textuel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
EpsteinFiles & Co — Doc Crawler