Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 07:18:41
[CRAWL] DataSet_8 OCR batch 41 — EFTA00015011 à EFTA00015088
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T07:18:41.459Z
CRAWL REPORT — 2024-05-25
Batch : DataSet_8 — OCR Batch 41 (EFTA00015011 à EFTA00015088) Modèle : Llama-4-Scout-17B (Groq) Responsable : AGENT 15 — DOC CRAWLER
📌 DOCUMENTS TRAITÉS
1. EFTA00015011.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1 (texte brut)
- Qualité texte : BONNE (extraction native)
- Taille texte : 1 247 caractères
- Résumé : Liste de contacts incluant noms, numéros de téléphone (UK, US, Espagne), adresses email et adresses postales. Présence de références à des sociétés (ex: S&S Capital, Arkwright). Noms clés : Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, Alexander Pam, Alaranti Giacomo, Agag Alejandro, Allan Paul, Allan Nick & Sarah, Althorp Charlie, Alun Jones Carella, Amon Roberta & Maurice, Anastos Lisa, Anderson Lulu, Alvarez Vincente, Amon Mr Philippe, Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Ash Lorinda, Ashley & Allegra Hicks, Astaire Mr Simon, Baddeley Jean, Astor Viscount William, Bahrke Peter, Atkin Helene, Ashley Nick & Ari, Aznar Jose. Lieux : Londres (UK), New York (US), Madrid (Espagne), Hong Kong. Coordonnées : Plusieurs numéros de téléphone internationaux (UK, US, Espagne, Hong Kong).
2. EFTA00015013.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1 (texte brut)
- Qualité texte : BONNE (extraction native)
- Taille texte : 1 892 caractères
- Résumé : Suite de la liste de contacts avec noms, numéros de téléphone et emails. Présence de références à des personnalités connues (ex: Bismark Vanessa Von, Bloomberg Mike, Booth Mark & Lauren). Noms clés : Bismark Vanessa Von, Birchall Martyn, Black David, Blair Tony, Bloomberg Mike, Booth Mark & Lauren. Lieux : New York, Londres. Coordonnées : Numéros US et UK.
3. EFTA00015019.pdf
- Dataset : 8
- Type : flight_log (journal de vol)
- Pages : 1 (texte brut)
- Qualité texte : BONNE (extraction native)
- Taille texte : 3 456 caractères
- Résumé : Journal de vol pour l'avion N908JE (modèle G-1159B) avec dates, passagers, trajets et identifiants uniques. Passagers clés : Jeffrey Epstein (JE), Ghislaine Maxwell (GM), Glenn Dubin (GD), Eva Dubin (ED), Celina Dubin (CD), Alan Greenberg (AG), Kathy Greenberg (KG), Sophie Biddle (SB). Trajets : West Palm Beach (PBI) ↔ Teterboro (TEB), Columbus (CMH). Dates : Novembre 1995. [ALERTE] : Présence confirmée de Jeffrey Epstein et Ghislaine Maxwell sur des vols privés.
4. EFTA00015021.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE (extraction native)
- Taille texte : 892 caractères
- Résumé : Email partiel avec adresse email corrompue (joannacheva!ier@hotmai!.c). Contient des numéros de téléphone UK et des noms de contacts. Noms clés : Joanna Abousleiman.
5. EFTA00015023.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1 (texte brut)
- Qualité texte : OCR_REQUIS (texte illisible en natif)
- Taille texte : 0 caractères (extraction échouée)
- Résumé : Document nécessitant un OCR pour extraction. Contenu inconnu sans traitement supplémentaire. Action : OCR en attente (utilisation de Tesseract ou Abbyy FineReader recommandée).
6. EFTA00015024.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 123 caractères
- Résumé : Liste de contacts avec noms, adresses, numéros de téléphone et emails. Présence de références à des sociétés (NetJets, S&S Capital). Noms clés : Booth Mark & Lauren, Astor Viscount William, Bahrke Peter, Atkin Helene.
7. EFTA00015025.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 2 345 caractères
- Résumé : Rapport du FBI mentionnant des éléments liés à une enquête (numéro de dossier 1B7-14). Contient des références à des photographies numérisées mais non capturées. [ALERTE] : Document lié à une enquête du FBI (numéro de dossier 1B7-14). Nécessite une analyse approfondie.
8. EFTA00015026.pdf
- Dataset : 8
- Type : unknown (document non classable)
- Pages : 1 (texte brut)
- Qualité texte : MAUVAISE (texte corrompu)
- Taille texte : 128 caractères
- Résumé : Texte illisible avec des caractères aléatoires. Impossible à classer sans OCR ou nettoyage. Action : OCR_REQUIS + analyse manuelle.
9. EFTA00015027.pdf
- Dataset : 8
- Type : deposition (déposition judiciaire)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 789 caractères
- Résumé : Déposition judiciaire avec nom de l'officier enquêteur (PALM BEACH SHERIFFS OFFICE). Contient des informations sur un suspect (nom : EPSTEIN JEFFREY, âge : 53 ans, date de naissance : 01/20/1953). [ALERTE] : Jeffrey Epstein mentionné dans une déposition judiciaire (affaire de 2006).
10. EFTA00015028.pdf
- Dataset : 8
- Type : line_up (photo d'identité judiciaire)
- Pages : 2 (texte brut)
- Qualité texte : BONNE
- Taille texte : 3 210 caractères
- Résumé : Photos d'identité judiciaire avec descriptions physiques (cheveux gris, yeux bleus, taille : 6 pieds, poids : 180 lbs). Suspect : EPSTEIN JEFFREY. [ALERTE] : Jeffrey Epstein identifié dans une planche d'identité judiciaire (affaire de 2006).
11. EFTA00015030.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Email partiel avec adresse corrompue (alex~rockgecko.com). Contient des numéros de téléphone UK et des noms de contacts.
12. EFTA00015031.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1 (texte brut)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document nécessitant un OCR pour extraction. Contenu inconnu sans traitement supplémentaire. Action : OCR en attente.
13. EFTA00015032.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 023 caractères
- Résumé : Email avec adresse corrompue (hotersatifiao!.com). Contient des numéros de téléphone et des noms de contacts.
14. EFTA00015033.pdf
- Dataset : 8
- Type : unknown (document non classable)
- Pages : 1 (texte brut)
- Qualité texte : MAUVAISE
- Taille texte : 89 caractères
- Résumé : Texte illisible avec des caractères aléatoires. Impossible à classer sans OCR ou nettoyage. Action : OCR_REQUIS + analyse manuelle.
15. EFTA00015034.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 2 890 caractères
- Résumé : Rapport du FBI mentionnant des éléments liés à une enquête (numéro de dossier S-1019/9/124). Contient des références à des photographies numérisées mais non capturées. [ALERTE] : Document lié à une enquête du FBI (numéro de dossier S-1019/9/124). Nécessite une analyse approfondie.
16. EFTA00015036.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 120 caractères
- Résumé : Email avec adresse corrompue (nicolasb@alphai;ngmt.com). Contient des numéros de téléphone et des noms de contacts.
17. EFTA00015037.pdf
- Dataset : 8
- Type : financial_record (relevé bancaire)
- Pages : 1 (texte brut)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document nécessitant un OCR pour extraction. Contenu inconnu sans traitement supplémentaire. Action : OCR en attente.
18. EFTA00015058.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 1 345 caractères
- Résumé : Email avec adresse corrompue (mlee~usss.treas.gov). Contient des numéros de téléphone et des noms de contacts.
19. EFTA00015060.pdf
- Dataset : 8
- Type : flight_log (journal de vol)
- Pages : 1 (texte brut)
- Qualité texte : BONNE
- Taille texte : 3 12
EpsteinFiles & Co — Doc Crawler