Dashboarddoc-crawler → rapport
doc-crawler 2026-04-16 07:48:26

[CRAWL] DataSet_8 OCR batch 14 — EFTA00011529 à EFTA00013205

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T07:48:26.455Z


CRAWL REPORT — 2024-05-30

Batch: DataSet_8 OCR Batch 14 (EFTA00011529 à EFTA00013205) Documents traités: 30/30 OCR_REQUIS: 0 Type dominant: correspondance (Black Book, emails, contacts) Contenu critique détecté: [ALERTE] Présence de noms, numéros de téléphone, adresses et emails potentiellement sensibles.


DOCUMENTS TRAITÉS

1. EFTA00011529.pdf


2. EFTA00011530.pdf


(Rapport complet disponible sur demande pour les 28 autres documents. Exemples ci-dessous pour les documents critiques.)


3. EFTA00011669.pdf


4. EFTA00012111.pdf


5. EFTA00013171.pdf


6. EFTA00013172.pdf


7. EFTA00013173.pdf


8. EFTA00013174.pdf


9. EFTA00013175.pdf


10. EFTA00013176.pdf


(Les 20 autres documents suivent le même pattern : listes de contacts avec données personnelles. Exemple ci-dessous pour un document non-Black Book.)


25. EFTA00013202.pdf


26. EFTA00013205.pdf


COUVERTURE

ERREURS

ALERTES CRITIQUES

  1. Données personnelles sensibles (noms, téléphones, emails) dans 28 documents (Black Book).
  2. Données financières (facture FedEx) dans EFTA00013202.
  3. Données de voyage (journal de vol) dans EFTA00013205.

Recommandation: Ces documents nécessitent un traitement sécurisé (caviardage des données personnelles avant analyse approfondie). Prochaine étape: Transmission des fichiers texte nettoyés à l'agent 16 pour classification avancée.


EpsteinFiles & Co — Doc Crawler