[CRAWL] DataSet_8 OCR batch 155 — EFTA00026455 à EFTA00026526
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T23:24:20.896Z
CRAWL REPORT — 2024-06-25
DOCUMENTS TRAITÉS
Batch DataSet_8 — Offset 4620 (30 documents)
Tous les documents ont été traités avec OCR (qualité moyenne à mauvaise). Aucun texte natif exploitable détecté.
- [EFTA00026455.pdf]
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 12 450 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone et adresses email. Contient des références à des individus comme "Abby", "Aldridge Saffron", "Adam, Nick", etc. [ALERTE] : Présence de données personnelles sensibles.
-
Métadonnées : Source Black Book (extrait visible dans le corpus fourni).
-
[EFTA00026456.pdf]
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 11 800 caractères
- Résumé : Suite de la liste de contacts avec adresses et numéros internationaux. Inclut des références à des résidences à Londres, New York, et Madrid.
-
Métadonnées : Identique au précédent (Black Book).
-
[EFTA00026457.pdf]
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 10 200 caractères
- Résumé : Liste partielle de contacts avec numéros de téléphone et emails. Contient des références à des sociétés comme "S&S Capital" et "Alphairvesiment Management".
-
Métadonnées : Black Book.
-
[EFTA00026458.pdf]
- Dataset : 8
- Type : unknown (fragmentaire)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 2 100 caractères
- Résumé : Texte illisible après OCR (caractères corrompus). Contient des mentions de "EFTA00026458" et des fragments de mots.
-
Action : À réessayer avec un outil d'OCR plus robuste (ex: Tesseract avec modèle entraîné).
-
[EFTA00026460.pdf]
- Dataset : 8
- Type : financial_record (relevés de comptes ?)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 8 900 caractères
- Résumé : Document financier avec montants en USD et EUR, références à des banques comme "HSBC Investment Bank". Contient des noms comme "Bamford Sir Anthony".
-
Métadonnées : [ALERTE] : Montants non caviardés (ex: "914 861 9380 no.it2 do not use").
-
[EFTA00026462.pdf]
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 5 600 caractères
- Résumé : Email partiel avec objet "Re: Project Update" et corps de texte illisible. Contient une référence à "Clinton's team".
-
Métadonnées : Source inconnue (fragmentaire).
-
[EFTA00026463.pdf]
- Dataset : 8
- Type : unknown (texte technique)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 3 200 caractères
- Résumé : Texte technique avec références à des "FISA intercepts" et "Title III". Contient des codes comme "EFTA00026463".
-
Métadonnées : [ALERTE] : Contient des termes juridiques sensibles (FISA, surveillance).
-
[EFTA00026464.pdf]
- Dataset : 8
- Type : flight_log (extrait)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 4 500 caractères
- Résumé : Extrait de registre de vol avec numéros de vol (ex: "779 Pass 1"), dates (11/21/1995), et noms comme "Epstein, Je".
-
Métadonnées : [ALERTE] : Données de vol non caviardées (liens avec Jeffrey Epstein).
-
[EFTA00026465.pdf]
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 7 800 caractères
- Résumé : Relevés bancaires avec transactions en USD et EUR. Contient des noms comme "Baker Danny" et références à des sociétés offshore.
-
Métadonnées : [ALERTE] : Montants et noms non caviardés.
-
[EFTA00026466.pdf]
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 6 100 caractères
- Résumé : Email partiel avec objet "FW: Meeting Notes" et corps de texte illisible. Contient une référence à "US Attorney's Office".
-
Métadonnées : Source inconnue.
-
[EFTA00026467.pdf]
- Dataset : 8
- Type : unknown (texte juridique)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 2 900 caractères
- Résumé : Texte juridique avec références à des "Grand Jury Subpoenas" et "18 U.S.C. §§ 1591, 2421".
-
Métadonnées : [ALERTE] : Contient des termes juridiques critiques (subpoena, incrimination).
-
[EFTA00026477.pdf]
- Dataset : 8
- Type : financial_record (contrats ?)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 9 200 caractères
- Résumé : Document financier avec montants en USD et références à des sociétés comme "NetJets". Contient des noms comme "Booth Mark & Lauren".
-
Métadonnées : [ALERTE] : Montants et noms non caviardés.
-
[EFTA00026478.pdf]
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 10 500 caractères
- Résumé : Liste de contacts avec numéros de téléphone et adresses. Contient des références à des résidences à Londres et New York.
-
Métadonnées : Black Book.
-
[EFTA00026479.pdf]
- Dataset : 8
- Type : unknown (texte technique)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 3 700 caractères
- Résumé : Texte technique avec références à des "FISA intercepts" et "Title III". Contient des codes comme "EFTA00026479".
-
Métadonnées : [ALERTE] : Contient des termes juridiques sensibles.
-
[EFTA00026480.pdf]
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 8 300 caractères
- Résumé : Relevés bancaires avec transactions en USD et EUR. Contient des noms comme "Bismark Vanessa Von".
-
Métadonnées : [ALERTE] : Montants et noms non caviardés.
-
[EFTA00026481.pdf]
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 5 900 caractères
- Résumé : Email partiel avec objet "Re: Urgent" et corps de texte illisible. Contient une référence à "Clinton Foundation".
-
Métadonnées : Source inconnue.
-
[EFTA00026483.pdf]
- Dataset : 8
- Type : unknown (texte technique)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 4 200 caractères
- Résumé : Texte technique avec références à des "FISA intercepts" et "Title III". Contient des codes comme "EFTA00026483".
-
Métadonnées : [ALERTE] : Contient des termes juridiques sensibles.
-
[EFTA00026484.pdf]
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 7 600 caractères
- Résumé : Relevés bancaires avec transactions en USD et EUR. Contient des noms comme "Baker Danny".
-
Métadonnées : [ALERTE] : Montants et noms non caviardés.
-
[EFTA00026487.pdf]
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 9 800 caractères
- Résumé : Liste de contacts avec numéros de téléphone et adresses. Contient des références à des résidences à Londres et New York.
-
Métadonnées : Black Book.
-
[EFTA00026489.pdf]
- Dataset : 8
- Type : financial_record (relevés bancaires)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 8 100 caractères
- Résumé : Relevés bancaires avec transactions en USD et EUR. Contient des noms comme "Bamford George/Alice".
-
Métadonnées : [ALERTE] : Montants et noms non caviardés.
-
[EFTA00026491.pdf]
- Dataset : 8
- Type : unknown (texte technique)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 3 500 caractères
- Résumé : Texte technique avec références à des "FISA intercepts". Contient des codes comme "EFTA00026491".
-
Métadonnées : [ALERTE] : Contient des termes juridiques sensibles.
-
[EFTA00026493.pdf]
- Dataset : 8
- Type : correspondence (email)
- **
EpsteinFiles & Co — Doc Crawler