Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 07:06:46
[CRAWL] DataSet_8 OCR batch 11 — EFTA00011180 à EFTA00011359
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T07:06:46.939Z
CRAWL REPORT — 2024-06-11
DOCUMENTS TRAITÉS
EFTA00011180.pdf
- Dataset : 8
- Type : correspondence (email + contacts)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis, texte très dégradé)
- Taille texte : ~1 200 caractères
- Résumé : Document contenant des extraits d'un carnet d'adresses et de contacts, incluant des noms, numéros de téléphone, adresses email et adresses postales. Plusieurs entrées semblent liées à des personnalités européennes et américaines (ex: "Abby", "Aldridge Saffron", "Adam, Nick"). Contenu critique : Plusieurs numéros de téléphone et adresses email sont partiellement illisibles mais exploitables pour une analyse croisée.
EFTA00011184.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide ou illisible)
- Taille texte : 0 caractères (après extraction native)
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre, mais le texte natif est inexploitable. Action : OCR prioritaire pour vérifier la présence de données sensibles (noms, dates, lieux).
EFTA00011187.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011192.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011221.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011251.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011253.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011254.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011259.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011266.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011267.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011269.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011270.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011271.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011295.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011298.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011300.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011320.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011340.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011344.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011346.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011347.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011349.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011351.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supposé être un email ou une lettre. Action : OCR prioritaire pour vérifier la présence de données sensibles.
EFTA00011353.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif vide)
- Taille texte : 0 caractères
- Résumé : Document nécessitant une OCR complète. Contenu supp
EpsteinFiles & Co — Doc Crawler