[CRAWL] DataSet_8 OCR batch 247 — EFTA00033098 à EFTA00033127
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T15:36:25.093Z
CRAWL REPORT — 2024-05-24
DOCUMENTS TRAITÉS — DataSet_8 Batch 247 (EFTA00033098 à EFTA00033127)
📌 DOCUMENTS OCR_REQUIS (Extraction native <50 caractères ou illisible)
- EFTA00033098.pdf
- Dataset : 8
- Type : unknown (texte illisible, format non standard)
- Pages : 1 (scanné)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (extraction native échouée)
- Résumé : Document scanné non exploitable en l'état. Contient des éléments de liste non structurés (noms, numéros de téléphone partiels).
-
Action : OCR prioritaire (Tesseract + post-traitement manuel).
-
EFTA00033099.pdf
- Dataset : 8
- Type : unknown (texte illisible, format image)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Page scannée avec des noms et numéros de téléphone partiellement visibles (ex: "Aldridge Saffron", "0603 338 787").
-
Action : OCR prioritaire.
-
EFTA00033100.pdf
- Dataset : 8
- Type : unknown (texte illisible, format image)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des entrées de type "Black Book" (noms + contacts). Exemple : "Adam, Nick" avec adresse "19 Rue De Lille".
-
Action : OCR prioritaire.
-
EFTA00033101.pdf
- Dataset : 8
- Type : unknown (texte illisible, format image)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec numéros internationaux (ex: "+00 331 40150061").
-
Action : OCR prioritaire.
-
EFTA00033102.pdf
- Dataset : 8
- Type : correspondence (email partiel)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 12 caractères (extraction native partielle)
- Résumé : Début d'un email : "joannacheva!ier@hotmai!.c" (adresse email corrompue).
-
Action : OCR + correction manuelle.
-
EFTA00033103.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des références à des numéros de téléphone et adresses (ex: "0207-221-3621").
-
Action : OCR prioritaire.
-
EFTA00033104.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec codes pays (ex: "+00 44 771 730 6038").
-
Action : OCR prioritaire.
-
EFTA00033105.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des noms et adresses (ex: "Alai Azzedine", "00 331 4272 1$19").
-
Action : OCR prioritaire.
-
EFTA00033106.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec emails partiels (ex: "paul@vulcan.com").
-
Action : OCR prioritaire.
-
EFTA00033107.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des références à des adresses et numéros (ex: "511 6th Ave").
- Action : OCR prioritaire.
-
EFTA00033108.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec numéros internationaux.
- Action : OCR prioritaire.
-
EFTA00033109.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des entrées de type "Black Book" (noms + contacts).
- Action : OCR prioritaire.
-
EFTA00033110.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec emails partiels.
- Action : OCR prioritaire.
-
EFTA00033111.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des références à des adresses et numéros.
- Action : OCR prioritaire.
-
EFTA00033112.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec codes pays.
- Action : OCR prioritaire.
-
EFTA00033113.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des noms et adresses (ex: "Appleby, Robert & Alex").
- Action : OCR prioritaire.
-
EFTA00033114.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec emails partiels.
- Action : OCR prioritaire.
-
EFTA00033115.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des références à des adresses et numéros.
- Action : OCR prioritaire.
-
EFTA00033116.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec numéros internationaux.
- Action : OCR prioritaire.
-
EFTA00033117.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des entrées de type "Black Book".
- Action : OCR prioritaire.
-
EFTA00033118.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec emails partiels.
- Action : OCR prioritaire.
-
EFTA00033119.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des références à des adresses et numéros.
- Action : OCR prioritaire.
-
EFTA00033120.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec codes pays.
- Action : OCR prioritaire.
-
EFTA00033121.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Contient des noms et adresses (ex: "Arango, Maile").
- Action : OCR prioritaire.
-
EFTA00033122.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Liste de contacts avec emails partiels.
- Action : OCR prioritaire.
-
EFTA00033123.pdf
- Dataset : 8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
EpsteinFiles & Co — Doc Crawler