Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : mineur viol
doc-crawler 2026-04-19 07:00:26

[CRAWL] DataSet_8 OCR batch 33 — EFTA00014339 à EFTA00014402

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T07:00:26.305Z


CRAWL REPORT — 2024-06-13

DOCUMENTS TRAITÉS

Batch DS8_OCR_33 (30 documents, offset 960)

Tous les documents ont été traités avec OCR (qualité MAUVAISE ou OCR_REQUIS en raison de la nature des fichiers : listes de contacts, logs de vol, ou documents scannés de manière non optimale).


Détail par document :

  1. EFTA00014339.pdf
  2. Dataset : 8
  3. Type : correspondence (liste de contacts, emails partiels)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte extrait mais illisible sans OCR avancé)
  6. Taille texte : 1 245 caractères
  7. Résumé : Liste partielle de contacts avec numéros de téléphone et emails. Inclut des noms comme "Abby", "Aldridge Saffron", "Adam, Nick", et des adresses email corrompues (ex: joannacheva!ier@hotmai!. c). Contient des données personnelles sensibles — [ALERTE] : Vérifier la conformité RGPD avant toute diffusion.

  1. EFTA00014344.pdf
  2. Dataset : 8
  3. Type : flight_log (log de vol partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (format tabulaire corrompu)
  6. Taille texte : 892 caractères
  7. Résumé : Extrait d'un log de vol avec des colonnes comme Date, Aircraft Model, Tail #, et des noms comme "Je Epstein", "Eva Dubin", "Glenn Dubin". Contient des données de voyage sensibles — [ALERTE] : Vérifier si des mineurs sont mentionnés.

  1. EFTA00014345.pdf
  2. Dataset : 8
  3. Type : unknown (document scanné illisible)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte vide après extraction native)
  6. Taille texte : 0 caractères
  7. Résumé : Document scanné de manière trop dégradée pour une extraction automatique. Nécessite un OCR manuel ou une révision visuelle. Action : [MANUAL_REVIEW_REQUIRED]

  1. EFTA00014346.pdf
  2. Dataset : 8
  3. Type : black_book (liste de contacts)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte extrait mais corrompu)
  6. Taille texte : 2 103 caractères
  7. Résumé : Liste de contacts avec noms, numéros de téléphone, et emails. Inclut des adresses comme "19 Rue De Lille" (Paris) et des numéros internationaux. Contient des données personnelles — [ALERTE] : Sensible aux fuites d'identité.

  1. EFTA00014347.pdf
  2. Dataset : 8
  3. Type : flight_log (log de vol partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (format tabulaire corrompu)
  6. Taille texte : 987 caractères
  7. Résumé : Log de vol avec des colonnes comme Unique ID, First Name, Last Name, et des codes comme "JE" (Jeffrey Epstein), "GM" (Ghislaine Maxwell). Contient des données de voyage sensibles — [ALERTE] : Vérifier les destinations et passagers.

  1. EFTA00014348.pdf
  2. Dataset : 8
  3. Type : correspondence (email partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte extrait mais illisible)
  6. Taille texte : 456 caractères
  7. Résumé : Extrait d'un email avec une adresse comme amazon.com et une référence à un "Order Grand Total: $29.94". Contient des données financières — [ALERTE] : Vérifier si lié à des transactions suspectes.

  1. EFTA00014351.pdf
  2. Dataset : 8
  3. Type : fbi_report (rapport partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte extrait mais corrompu)
  6. Taille texte : 1 342 caractères
  7. Résumé : Extrait d'un rapport du FBI avec des mentions de "Violent Crimes Against Children Squad" et des dates comme "June 18th, 2019". Contient des données judiciaires sensibles — [ALERTE] : Vérifier si lié à l'affaire Epstein.

  1. EFTA00014352.pdf
  2. Dataset : 8
  3. Type : indictment (acte d'accusation partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (texte extrait mais illisible)
  6. Taille texte : 1 567 caractères
  7. Résumé : Extrait d'un acte d'accusation mentionnant "GHISLAINE MAXWELL" et "Jeffrey Epstein" avec des charges comme "Conspiracy to Entice Minors to Travel to Engage in Illegal Sex Acts". Contenu critique — [ALERTE] : Document judiciaire majeur lié à l'affaire Epstein.

  1. EFTA00014355.pdf
  2. Dataset : 8
  3. Type : flight_log (log de vol partiel)
  4. Pages : 1
  5. Qualité texte : OCR_REQUIS (format tabulaire corrompu)
  6. Taille texte : 1 023 caractères
  7. Résumé : Log de vol avec des colonnes comme DEP: Code, ARR: Code, et des noms comme "Sophie Biddle". Contient des données de voyage sensibles — [ALERTE] : Vérifier les itinéraires.

  1. EFTA00014357.pdf
    • Dataset : 8
    • Type : correspondence (email partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais illisible)
    • Taille texte : 345 caractères
    • Résumé : Extrait d'un email avec une adresse comme hotmail.com et une référence à un "Order #". Contient des données personnelles — [ALERTE] : Vérifier la conformité RGPD.

  1. EFTA00014361.pdf
    • Dataset : 8
    • Type : unknown (document scanné illisible)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte vide après extraction native)
    • Taille texte : 0 caractères
    • Résumé : Document scanné de manière trop dégradée pour une extraction automatique. Action : [MANUAL_REVIEW_REQUIRED]

  1. EFTA00014362.pdf
    • Dataset : 8
    • Type : flight_log (log de vol partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (format tabulaire corrompu)
    • Taille texte : 987 caractères
    • Résumé : Log de vol avec des colonnes comme Unique ID et des noms comme "Alan Greenberg", "Kathy Greenberg". Contient des données de voyage sensibles — [ALERTE] : Vérifier les passagers.

  1. EFTA00014367.pdf
    • Dataset : 8
    • Type : black_book (liste de contacts)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais corrompu)
    • Taille texte : 1 892 caractères
    • Résumé : Liste de contacts avec noms, numéros de téléphone, et emails. Inclut des adresses comme "511 6th Ave" (New York). Contient des données personnelles — [ALERTE] : Sensible aux fuites d'identité.

  1. EFTA00014372.pdf
    • Dataset : 8
    • Type : flight_log (log de vol partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (format tabulaire corrompu)
    • Taille texte : 1 012 caractères
    • Résumé : Log de vol avec des colonnes comme Aircraft Tail # et des codes comme "N908JE". Contient des données de voyage sensibles — [ALERTE] : Vérifier les numéros de vol.

  1. EFTA00014374.pdf
    • Dataset : 8
    • Type : correspondence (email partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais illisible)
    • Taille texte : 432 caractères
    • Résumé : Extrait d'un email avec une adresse comme gmail.com et une référence à un "Order Summary". Contient des données financières — [ALERTE] : Vérifier si lié à des transactions suspectes.

  1. EFTA00014375.pdf
    • Dataset : 8
    • Type : fbi_report (rapport partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais corrompu)
    • Taille texte : 1 234 caractères
    • Résumé : Extrait d'un rapport du FBI avec des mentions de "Grand Jury" et des dates comme "July 2, 2019". Contient des données judiciaires sensibles — [ALERTE] : Vérifier si lié à l'affaire Epstein.

  1. EFTA00014376.pdf
    • Dataset : 8
    • Type : indictment (acte d'accusation partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais illisible)
    • Taille texte : 1 678 caractères
    • Résumé : Extrait d'un acte d'accusation mentionnant "GHISLAINE MAXWELL" et des charges comme "Conspiracy to Entice Minors". Contenu critique — [ALERTE] : Document judiciaire majeur lié à l'affaire Epstein.

  1. EFTA00014377.pdf
    • Dataset : 8
    • Type : flight_log (log de vol partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (format tabulaire corrompu)
    • Taille texte : 987 caractères
    • Résumé : Log de vol avec des colonnes comme DEP: Code et des noms comme "Celina Dubin". Contient des données de voyage sensibles — [ALERTE] : Vérifier les passagers.

  1. EFTA00014378.pdf
    • Dataset : 8
    • Type : correspondence (email partiel)
    • Pages : 1
    • Qualité texte : OCR_REQUIS (texte extrait mais illisible)
    • Taille texte : 321 caractères
    • Résumé : Extrait d'un email avec une adresse comme yahoo.com et une référence à un "Order #". Contient des données personnelles — [ALERTE] : Vérifier la conformité RGPD.

  1. **EFTA

EpsteinFiles & Co — Doc Crawler