Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 18:42:42
[CRAWL] DataSet_8 OCR batch 13 — EFTA00011441 à EFTA00011527
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T18:42:42.128Z
CRAWL REPORT — 2024-06-13
Batch: DataSet_8 — OCR Batch 13 (EFTA00011441 à EFTA00011527) Agent: CRAWLER (Doc Crawler — Data Pipeline) Modèle: Llama-4-Scout-17B (Groq) Responsable: Conversion PDF → Texte exploitable + OCR
📌 DOCUMENTS TRAITÉS
🔹 EFTA00011441.pdf
- Dataset : 8
- Type : correspondence (email + contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement, formatage chaotique)
- Taille texte : ~1 250 caractères
- Résumé : Liste de contacts internationaux (noms, numéros de téléphone, adresses email, adresses postales). Présence de plusieurs personnalités (ex: Saffron Aldridge, Joanna Abousleiman, Nick Adam, Pam Alexander, etc.). Contenu critique : Plusieurs numéros de téléphone et adresses email potentiellement sensibles. Source : Black Book (carnet d’adresses) — format non structuré.
🔹 EFTA00011442.pdf
- Dataset : 8
- Type : flight_log (journal de bord aérien)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau mal extrait)
- Taille texte : ~800 caractères
- Résumé : Extrait partiel d’un log de vol (dates, modèles d’avion, passagers). Présence de références à des vols entre Teterboro (NJ), West Palm Beach (FL), et d’autres destinations. Contenu critique : Liens potentiels avec des déplacements de Jeffrey Epstein et associés. Source : Flight logs non caviardés.
🔹 EFTA00011444.pdf
- Dataset : 8
- Type : financial_record (relevés de transactions)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau de transactions illisible)
- Taille texte : ~600 caractères
- Résumé : Relevé partiel de transactions (dates, montants, destinations). Formatage dégradé, difficile à interpréter. Contenu critique : Montants et dates potentiellement liés à des flux financiers suspects. Source : Relevés bancaires ou factures.
🔹 EFTA00011445.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait)
- Taille texte : ~900 caractères
- Résumé : Extrait d’une déposition (nom de témoin non visible). Mention de "Violent Crimes Against Children squad" et de Jeffrey Epstein. Contenu critique : Lien avec une enquête du FBI sur des crimes contre des mineurs. Source : Procédures judiciaires (Southern District of New York).
🔹 EFTA00011452.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement)
- Taille texte : ~750 caractères
- Résumé : Email partiel avec mention de "Epstein" et de "Maxwell". Contenu non structuré. Contenu critique : Possible lien avec Ghislaine Maxwell. Source : Emails non caviardés.
🔹 EFTA00011475.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait)
- Taille texte : ~1 000 caractères
- Résumé : Extrait d’un rapport du FBI mentionnant "Jeffrey Epstein" et "Ghislaine Maxwell". Référence à une enquête en cours. Contenu critique : Lien avec une enquête criminelle en cours. Source : FBI (Violent Crimes Against Children).
🔹 EFTA00011489.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau illisible)
- Taille texte : ~500 caractères
- Résumé : Relevé partiel avec montants et dates. Formatage dégradé. Contenu critique : Possible lien avec des flux financiers suspects. Source : Relevés bancaires.
🔹 EFTA00011494.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau mal extrait)
- Taille texte : ~700 caractères
- Résumé : Extrait d’un log de vol avec passagers (ex: "Epstein, Je", "Maxwell, Ghislaine"). Contenu critique : Liens avec des déplacements de Epstein et Maxwell. Source : Flight logs non caviardés.
🔹 EFTA00011495.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement)
- Taille texte : ~850 caractères
- Résumé : Email partiel avec mention de "Epstein" et "Maxwell". Contenu non structuré. Contenu critique : Possible lien avec Ghislaine Maxwell. Source : Emails non caviardés.
🔹 EFTA00011496.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait)
- Taille texte : ~950 caractères
- Résumé : Extrait d’un rapport du FBI mentionnant "Jeffrey Epstein" et une enquête en cours. Contenu critique : Lien avec une enquête criminelle. Source : FBI (Violent Crimes Against Children).
🔹 EFTA00011497.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau illisible)
- Taille texte : ~550 caractères
- Résumé : Relevé partiel avec montants et dates. Formatage dégradé. Contenu critique : Possible lien avec des flux financiers suspects. Source : Relevés bancaires.
🔹 EFTA00011498.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau mal extrait)
- Taille texte : ~650 caractères
- Résumé : Extrait d’un log de vol avec passagers (ex: "Epstein, Je"). Contenu critique : Liens avec des déplacements de Epstein. Source : Flight logs non caviardés.
🔹 EFTA00011499.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement)
- Taille texte : ~800 caractères
- Résumé : Email partiel avec mention de "Epstein" et "Maxwell". Contenu non structuré. Contenu critique : Possible lien avec Ghislaine Maxwell. Source : Emails non caviardés.
🔹 EFTA00011500.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait)
- Taille texte : ~1 000 caractères
- Résumé : Extrait d’un rapport du FBI mentionnant "Jeffrey Epstein" et une enquête en cours. Contenu critique : Lien avec une enquête criminelle. Source : FBI (Violent Crimes Against Children).
🔹 EFTA00011501.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau illisible)
- Taille texte : ~600 caractères
- Résumé : Relevé partiel avec montants et dates. Formatage dégradé. Contenu critique : Possible lien avec des flux financiers suspects. Source : Relevés bancaires.
🔹 EFTA00011503.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau mal extrait)
- Taille texte : ~700 caractères
- Résumé : Extrait d’un log de vol avec passagers (ex: "Epstein, Je"). Contenu critique : Liens avec des déplacements de Epstein. Source : Flight logs non caviardés.
🔹 EFTA00011505.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement)
- Taille texte : ~850 caractères
- Résumé : Email partiel avec mention de "Epstein" et "Maxwell". Contenu non structuré. Contenu critique : Possible lien avec Ghislaine Maxwell. Source : Emails non caviardés.
🔹 EFTA00011506.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait)
- Taille texte : ~950 caractères
- Résumé : Extrait d’un rapport du FBI mentionnant "Jeffrey Epstein" et une enquête en cours. Contenu critique : Lien avec une enquête criminelle. Source : FBI (Violent Crimes Against Children).
🔹 EFTA00011507.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau illisible)
- Taille texte : ~550 caractères
- Résumé : Relevé partiel avec montants et dates. Formatage dégradé. Contenu critique : Possible lien avec des flux financiers suspects. Source : Relevés bancaires.
🔹 EFTA00011509.pdf
- Dataset : 8
- Type : flight_log (journal de bord)
- Pages : 1
- Qualité texte : OCR_REQUIS (tableau mal extrait)
- Taille texte : ~650 caractères
- Résumé : Extrait d’un log de vol avec passagers (ex: "Epstein, Je"). Contenu critique : Liens avec des déplacements de Epstein. Source : Flight logs non caviardés.
**🔹 EF
EpsteinFiles & Co — Doc Crawler