Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 15:01:03
[CRAWL] DataSet_8 OCR batch 251 — EFTA00033218 à EFTA00033247
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T15:01:03.529Z
CRAWL REPORT — 2024-05-30
DOCUMENTS TRAITÉS
EFTA00033218.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1
- Qualité texte : MAUVAISE (extraction partielle, caractères corrompus)
- Taille texte : ~500 caractères
- Résumé : Contient des extraits de contacts et emails partiels (ex: "joannacheva!ier@hotmai!. c"). Le document semble être une liste de contacts avec numéros de téléphone et adresses, mais le texte est fortement dégradé. → [ALERTE] Contenu potentiellement sensible (coordonnées personnelles) mais illisible sans OCR.
EFTA00033219.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : ~200 caractères
- Résumé : Liste de noms avec numéros de téléphone (ex: "Abby 07944 574 202", "Aldridge Saffron"). Format similaire au Black Book officiel, mais extraction incomplète. → [ALERTE] Données personnelles non caviardées. Nécessite OCR pour vérification complète.
EFTA00033220.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~100 caractères
- Résumé : Extrait illisible ("Alaranti Giacomo", "Agag Alejandro"). Contient des références à des adresses (ex: "Flat4 83 Duke St") et emails partiels. → Nécessite OCR pour extraction complète.
EFTA00033221.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~150 caractères
- Résumé : Contient des noms ("Allan Paul", "Alai Azzedine") et numéros de téléphone internationaux. Format similaire à une liste de contacts. → Nécessite OCR pour vérification des données.
EFTA00033222.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~300 caractères
- Résumé : Liste de contacts avec noms, adresses et numéros (ex: "Allan, Nick & Sarah", "Albermarle, Rufus & Sally"). Adresses à New York, Londres et Hong Kong. → [ALERTE] Données personnelles sensibles. Nécessite OCR pour extraction complète.
EFTA00033223.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~250 caractères
- Résumé : Contient des noms ("Althorp, Charlie", "Alun Jones, Carella") et numéros de téléphone. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033224.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Amon, Roberta & Maurice"). Adresses à New York et Londres. → Nécessite OCR pour extraction complète.
EFTA00033225.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~180 caractères
- Résumé : Contient des noms ("Anastos Lisa", "Anderson, Lulu") et emails partiels. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033226.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~220 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Appleby, Robert & Alex"). Adresses à Londres et Suisse. → Nécessite OCR pour extraction complète.
EFTA00033227.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~190 caractères
- Résumé : Contient des noms ("Arango, Maile", "Armstrong, Arthur & Cathy") et adresses. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033228.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~240 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Arion Joaquin Fernandez de Cordoba"). Adresses à Madrid et New York. → Nécessite OCR pour extraction complète.
EFTA00033229.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~210 caractères
- Résumé : Contient des noms ("Ash, Lorinda", "Ashley & Allegra Hicks") et adresses à Londres et New York. → Nécessite OCR pour vérification.
EFTA00033230.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~230 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Astaire, Mr Simon"). Adresses à Londres et Malaga. → Nécessite OCR pour extraction complète.
EFTA00033231.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé : Contient des noms ("Bahrke Peter", "Atkin Helene") et emails partiels. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033232.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~250 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Bakhtiar, Shariar"). Adresses à Londres et New York. → Nécessite OCR pour extraction complète.
EFTA00033233.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~180 caractères
- Résumé : Contient des noms ("Baldwin Alec", "Balliol College, Oxford") et références à des institutions. → Nécessite OCR pour vérification.
EFTA00033234.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~220 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Bamford Sir Anthony and Lady C"). Adresses à Londres et Gloucestershire. → Nécessite OCR pour extraction complète.
EFTA00033235.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé : Contient des noms ("Barnes, Peter", "Sanon, Javier") et emails partiels. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033236.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~240 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Barnett, Craig"). Adresses à New York. → Nécessite OCR pour extraction complète.
EFTA00033237.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~190 caractères
- Résumé : Contient des noms ("Bastone, Hillary") et références à des événements ("spkii scheduler"). Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033238.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~230 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Batstone, Tim Natasha"). Adresses à Londres et Pays de Galles. → Nécessite OCR pour extraction complète.
EFTA00033239.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~210 caractères
- Résumé : Contient des noms ("Benson, Steven") et emails partiels. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033240.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~180 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Bentinck, Baron"). Adresses à Londres et Paris. → Nécessite OCR pour extraction complète.
EFTA00033241.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~200 caractères
- Résumé : Contient des noms ("Baumer, Lorenzo") et emails partiels. Format similaire à une liste de contacts. → Nécessite OCR pour vérification.
EFTA00033242.pdf
- Dataset : 8
- Type : unknown (texte brut)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~220 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Beaumont, lord & Lady"). Adresses à Londres. → Nécessite OCR pour extraction complète.
EpsteinFiles & Co — Doc Crawler