Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 14:42:21
[CRAWL] DataSet_8 OCR batch 220 — EFTA00031085 à EFTA00031200
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T14:42:21.937Z
CRAWL REPORT — 2024-06-27
DOCUMENTS TRAITÉS
EFTA00031085.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 245 caractères
- Résumé : Document contenant des extraits de contacts et numéros de téléphone (ex: "Abby 07944 574 202", "Aldridge Saffron"). Contenu similaire à un répertoire téléphonique. Aucune structure claire, probablement issu d'un scan ou d'une capture d'écran. → [ALERTE] Contient des données personnelles (numéros de téléphone). À vérifier pour conformité RGPD.
EFTA00031086.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 892 caractères
- Résumé : Liste de noms et coordonnées (ex: "Adam, Nick 19 Rue De Lille 65~QJf"). Contient des adresses et numéros de téléphone internationaux. Structure désorganisée, probablement issu d'un scan. → [ALERTE] Données personnelles sensibles (adresses, numéros). À anonymiser si diffusion.
EFTA00031087.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 2 103 caractères
- Résumé : Liste de contacts avec noms, adresses et numéros (ex: "Allan, Nick & Sarah Albermarle, Rufus & Sally"). Contient des références à des lieux (Londres, New York) et des codes postaux. → [ALERTE] Données personnelles et géolocalisation. À traiter avec précaution.
EFTA00031088.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 567 caractères
- Résumé : Extraits de contacts avec noms et numéros (ex: "Althorp, Charlie"). Contient des références à des lieux comme "London SW1" et des numéros de téléphone. → [ALERTE] Données personnelles. Vérifier légalité de la diffusion.
EFTA00031089.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 987 caractères
- Résumé : Liste de noms et coordonnées (ex: "Alun..Jones, Carella"). Contient des adresses à Londres et des numéros de téléphone. → [ALERTE] Données personnelles. Risque de violation de la vie privée.
EFTA00031090.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 342 caractères
- Résumé : Contacts avec noms et numéros (ex: "Alun.Jones, Jeremy & Deborah"). Contient des adresses à Londres et des codes postaux. → [ALERTE] Données personnelles. À anonymiser avant analyse.
EFTA00031092.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 789 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Amon, Roberta & Maurice"). Contient des adresses à New York et des numéros de téléphone. → [ALERTE] Données personnelles sensibles.
EFTA00031093.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 123 caractères
- Résumé : Extraits de contacts avec noms et numéros (ex: "Anastos 1 Lisa"). Contient des adresses à New York. → [ALERTE] Données personnelles. Risque de non-conformité légale.
EFTA00031094.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 890 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Anderson, Lulu"). Contient des adresses à Madrid et des numéros de téléphone. → [ALERTE] Données personnelles internationales. Vérifier conformité RGPD/CCPA.
EFTA00031095.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 456 caractères
- Résumé : Contacts avec noms et numéros (ex: "Appleby, Robert & Alex"). Contient des adresses en Suisse et des numéros de téléphone. → [ALERTE] Données personnelles transfrontalières. Risque juridique.
EFTA00031098.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 678 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Arango, Maile"). Contient des adresses en Espagne et des numéros de téléphone. → [ALERTE] Données personnelles. À traiter avec extrême prudence.
EFTA00031099.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 234 caractères
- Résumé : Extraits de contacts avec noms et numéros (ex: "Armstrong, Arthur & Cathy"). Contient des adresses à Londres et New York. → [ALERTE] Données personnelles. Risque de violation de la vie privée.
EFTA00031100.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 987 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Arion Joaquin Fernandez de Cordoba"). Contient des adresses en Espagne et des numéros de téléphone. → [ALERTE] Données personnelles. Vérifier conformité légale.
EFTA00031101.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 567 caractères
- Résumé : Contacts avec noms et numéros (ex: "Ash, Lorinda"). Contient des adresses à New York et des numéros de téléphone. → [ALERTE] Données personnelles sensibles.
EFTA00031102.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 890 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Ashley & Allegra Hicks"). Contient des adresses à Londres et New York. → [ALERTE] Données personnelles de célébrités. Risque médiatique et juridique.
EFTA00031105.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 234 caractères
- Résumé : Extraits de contacts avec noms et numéros (ex: "Astaire, Mr Simon"). Contient des adresses à Londres et des numéros de téléphone. → [ALERTE] Données personnelles. À anonymiser avant diffusion.
EFTA00031107.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 456 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Astor Viscount William"). Contient des adresses en Espagne et des numéros de téléphone. → [ALERTE] Données personnelles internationales. Risque juridique.
EFTA00031108.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 789 caractères
- Résumé : Contacts avec noms et numéros (ex: "Bahrke Peter"). Contient des adresses à Londres et New York. → [ALERTE] Données personnelles. Vérifier conformité RGPD.
EFTA00031109.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte : 1 123 caractères
- Résumé : Liste de contacts avec noms et numéros (ex: "Bakhtiar, Shariar"). Contient des adresses aux États-Unis et des numéros de téléphone. → [ALERTE] Données personnelles. Risque de violation de la vie privée.
EFTA00031111.pdf
- Dataset : 8
- Type : unknown (texte brut non structuré)
- Pages : 1 (extraction partielle)
- Qualité texte : MAUVAISE (texte fragmenté, OCR_REQUIS)
- Taille texte :
EpsteinFiles & Co — Doc Crawler