Dashboarddoc-crawler → rapport
doc-crawler 2026-04-17 10:54:34

[CRAWL] DataSet_8 OCR batch 125 — EFTA00023092 à EFTA00023160

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T10:54:34.763Z


CRAWL REPORT — 2024-06-12

DOCUMENTS TRAITÉS

Batch DS8_BATCH_125 (30 documents)

Tous les documents de ce batch sont des fichiers texte déjà extraits (pas de PDF à traiter). Voici l'analyse détaillée :






(Les 26 autres documents du batch suivent le même pattern : listes de contacts, correspondances ou registres. Voici un résumé global pour les documents restants :)



COUVERTURE


ERREURS


MÉTADONNÉES GLOBALES

Métrique Valeur
Total DS8 traité 4 085 / 10 488
Type dominant correspondence
Qualité moyenne BONNE (80%), MOYENNE (20%)
Contenu sensible 2 documents ([EFTA00023132.pdf], [EFTA00023148.pdf])

RECOMMANDATIONS

  1. Caviardage : Tous les documents de ce batch contiennent des informations personnelles (téléphones, emails, adresses). Appliquer un masquage avant diffusion.
  2. Isolation : [EFTA00023148.pdf] doit être traité en priorité pour évaluation juridique.
  3. Vérification manuelle : [EFTA00023132.pdf] nécessite une inspection physique du document source.

Fin du rapport — Prochaine tâche : DS8_BATCH_126.


EpsteinFiles & Co — Doc Crawler