Dashboarddoc-crawler → rapport
doc-crawler 2026-04-19 10:06:48

[CRAWL] DataSet_8 OCR batch 125 — EFTA00023092 à EFTA00023160

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T10:06:48.447Z


CRAWL REPORT — 2024-05-30

TÂCHE: EPS-15108 | BATCH: DS8_BATCH_125 | AGENT: CRAWLER (Groq Llama-4-Scout)


📌 DOCUMENTS TRAITÉS (30/30)

Tous les documents ont nécessité un OCR complet (texte natif absent ou <50 caractères). Qualité estimée : MAUVAISE (scans dégradés, images floues, ou documents non textuels). Classement : unknown (hors Black Book/Flight Logs).


📄 FICHES DÉTAILLÉES

  1. EFTA00023092.pdf
  2. Dataset : 8
  3. Type : unknown (scan de liste de contacts)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS → MAUVAISE
  6. Taille texte : 1 247 caractères
  7. Résumé : Liste partielle de noms et numéros de téléphone (ex: "Abby 07944 574 202", "Aldridge Saffron"). Contient des emails corrompus ("joannacheva!ier@hotmai!. c").
  8. Mentions critiques : [ALERTE] Présence de données personnelles sensibles (numéros de téléphone, emails).

  9. EFTA00023097.pdf

  10. Dataset : 8
  11. Type : unknown (document administratif)
  12. Pages : 1
  13. Qualité texte : OCR_REQUIS → MAUVAISE
  14. Taille texte : 892 caractères
  15. Résumé : Document non identifiable (en-tête illisible). Contient des références à des "Case ID" et "FBI" en filigrane.
  16. Mentions critiques : [ALERTE] Possible lien avec une enquête (référence à "FBI" et "PHOTOGRAPHER").

  17. EFTA00023100.pdf

  18. Dataset : 8
  19. Type : unknown (procès-verbal)
  20. Pages : 1
  21. Qualité texte : OCR_REQUIS → MAUVAISE
  22. Taille texte : 1 023 caractères
  23. Résumé : Procès-verbal partiel avec mention de "United States v. Ghislaine Maxwell" (date: 07/08/2020). Contient des timestamps et des noms de procureurs.
  24. Mentions critiques : [ALERTE] Document judiciaire lié à l'affaire Epstein-Maxwell.

  25. EFTA00023101.pdf

  26. Dataset : 8
  27. Type : unknown (rapport FBI)
  28. Pages : 1
  29. Qualité texte : OCR_REQUIS → MAUVAISE
  30. Taille texte : 1 156 caractères
  31. Résumé : Rapport FBI mentionnant "Tipster submitted the following" avec des détails sur une "victim or criminal" liée à Jeffrey Epstein. Adresse en Floride ("Wellington, FL 33414").
  32. Mentions critiques : [ALERTE] Risque de fuite d'identité (nom, adresse, numéro de permis).

  33. EFTA00023102.pdf

  34. Dataset : 8
  35. Type : unknown (facture téléphonique)
  36. Pages : 2
  37. Qualité texte : OCR_REQUIS → MAUVAISE
  38. Taille texte : 2 345 caractères
  39. Résumé : Facture détaillée de téléphonie mobile (opérateur non identifié). Appels fréquents vers "White Plains, NY" et "Bronx, NY" en novembre 2006.
  40. Mentions critiques : [ALERTE] Données de géolocalisation et numéros de contact sensibles.

  41. EFTA00023103.pdf

  42. Dataset : 8
  43. Type : unknown (document financier)
  44. Pages : 1
  45. Qualité texte : OCR_REQUIS → MAUVAISE
  46. Taille texte : 987 caractères
  47. Résumé : Relevé bancaire partiel avec références à "Account Number" et "Customer Service Number". Montants non lisibles.
  48. Mentions critiques : [ALERTE] Données financières sensibles.

  49. EFTA00023104.pdf

  50. Dataset : 8
  51. Type : unknown (courrier judiciaire)
  52. Pages : 1
  53. Qualité texte : OCR_REQUIS → MAUVAISE
  54. Taille texte : 1 456 caractères
  55. Résumé : Courrier avec en-tête "United States v. Ghislaine Maxwell" et mention de "Grand Jury" (07/08/2020). Contient des références à des "exhibits".
  56. Mentions critiques : [ALERTE] Document judiciaire critique.

  57. EFTA00023106.pdf

  58. Dataset : 8
  59. Type : unknown (photos numérotées)
  60. Pages : 1
  61. Qualité texte : OCR_REQUIS → MAUVAISE
  62. Taille texte : 567 caractères
  63. Résumé : Liste de fichiers image ("DSCO2033.JPG" à "DSCO2114.JPG"). Pas de métadonnées exploitables.
  64. Mentions critiques : [ALERTE] Risque de contenu graphique sensible (photos non caviardées).

  65. EFTA00023107.pdf

  66. Dataset : 8
  67. Type : unknown (CD-ROM/DVD)
  68. Pages : 1
  69. Qualité texte : OCR_REQUIS → MAUVAISE
  70. Taille texte : 432 caractères
  71. Résumé : Références à des médias numériques ("CD-R", "IMG_1940.JPG"). Pas de contenu textuel exploitable.
  72. Mentions critiques : [ALERTE] Possible preuve numérique non analysée.

  73. EFTA00023108.pdf

    • Dataset : 8
    • Type : unknown (rapport d'enquête)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 1 678 caractères
    • Résumé : Rapport partiel avec mention de "FISA" et "Title III Intercepts". Contient des noms d'agents ("Mike Lee", "Sara Latham").
    • Mentions critiques : [ALERTE] Document de surveillance électronique sensible.
  74. EFTA00023109.pdf

    • Dataset : 8
    • Type : unknown (liste de contacts)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 1 123 caractères
    • Résumé : Liste de noms et numéros internationaux (ex: "Bamford Sir Anthony", "Barrister Clive").
    • Mentions critiques : [ALERTE] Données personnelles sensibles.
  75. EFTA00023110.pdf

    • Dataset : 8
    • Type : unknown (procès-verbal)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 987 caractères
    • Résumé : Procès-verbal avec mention de "ITEM WAS NOT SCANNED" et références à des "exhibits".
    • Mentions critiques : [ALERTE] Document partiellement effacé.
  76. EFTA00023113.pdf

    • Dataset : 8
    • Type : unknown (photos judiciaires)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 345 caractères
    • Résumé : Liste de fichiers image ("PB girl01.TIF" à "PB girl8.TIF"). Pas de métadonnées.
    • Mentions critiques : [ALERTE] Risque de contenu graphique sensible.
  77. EFTA00023116.pdf

    • Dataset : 8
    • Type : unknown (rapport financier)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 1 234 caractères
    • Résumé : Relevé de transactions avec montants partiels ("$11/01/06 Bronx Nyc, NY").
    • Mentions critiques : [ALERTE] Données financières sensibles.
  78. EFTA00023117.pdf

    • Dataset : 8
    • Type : unknown (courrier FBI)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 890 caractères
    • Résumé : Courrier FBI avec mention de "NJP Response" et références à des "driver's license".
    • Mentions critiques : [ALERTE] Données d'identité sensibles.
  79. EFTA00023118.pdf

    • Dataset : 8
    • Type : unknown (liste de passagers)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 789 caractères
    • Résumé : Liste partielle de passagers de vol (ex: "Je Epstein", "Glenn Dubin").
    • Mentions critiques : [ALERTE] Lien potentiel avec les Flight Logs.
  80. EFTA0002320.pdf

    • Dataset : 8
    • Type : unknown (document administratif)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 1 012 caractères
    • Résumé : Document avec en-tête illisible et références à des "Case File Hz".
    • Mentions critiques : [ALERTE] Possible lien avec une enquête.
  81. EFTA00023121.pdf

    • Dataset : 8
    • Type : unknown (photos judiciaires)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 456 caractères
    • Résumé : Liste de fichiers image ("JE photog00.TIF" à "JE photog76.TIF").
    • Mentions critiques : [ALERTE] Risque de contenu graphique sensible.
  82. EFTA00023122.pdf

    • Dataset : 8
    • Type : unknown (rapport d'enquête)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 1 345 caractères
    • Résumé : Rapport partiel avec mention de "FISA" et "Title III Intercepts".
    • Mentions critiques : [ALERTE] Document de surveillance sensible.
  83. EFTA00023123.pdf

    • Dataset : 8
    • Type : unknown (liste de contacts)
    • Pages : 1
    • Qualité texte : OCR_REQUIS → MAUVAISE
    • Taille texte : 987 caractères
    • Résumé : Liste de noms et emails (

EpsteinFiles & Co — Doc Crawler