Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 21:06:26
[CRAWL] DataSet_8 OCR batch 62 — EFTA00017058 à EFTA00017139
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T21:06:26.422Z
CRAWL REPORT — 2024-06-25
DOCUMENTS TRAITÉS
EFTA00017058.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis, texte très dégradé)
- Taille texte : 1 245 caractères
- Résumé :
Document contenant des coordonnées d'individus (noms, numéros de téléphone, adresses email). Plusieurs entrées semblent corrompues (ex:
joannacheva!ier@hotmai!. c). Présence de noms comme Aldridge Saffron, Abousleiman Joanna, Adam Nick, etc. - Noms identifiés : Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, Alexander Pam, Alaranti Giacomo, Agag Alejandro, Allan Paul, Allan Nick & Sarah, Althorp Charlie, Alun Jones Carella, Alun Jones Jeremy & Deborah, Amon Roberta & Maurice, Anastos Lisa, Anderson Lulu, Alvarez Senor Vincente, Amon Mr Philippe, Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Ash Lorinda, Ashley & Allegra Hicks, Astor Viscount William, Bahrke Peter, Atkin Helene, Ashley Nick & Ari, Aznar Jose, etc.
- Dates/Lieux : Adresses à Londres (SW1, SW3), New York (NY 10021), Madrid (Spain), etc.
- Montants : Aucun montant identifié.
- Alerte : OUI — Présence de données personnelles sensibles (numéros de téléphone, adresses) et emails potentiellement corrompus.
EFTA00017061.pdf
- Dataset : 8
- Type : unknown (texte non structuré, OCR requis)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible ou très dégradé)
- Taille texte : 0 caractères (extraction native vide)
- Résumé : Document non exploitable en l'état. Nécessite un traitement OCR pour évaluer son contenu.
- Noms/Données : Aucun identifié.
- Alerte : NON — Document à réessayer en OCR.
EFTA00017063.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou transactions)
- Pages : 3
- Qualité texte : MAUVAISE (OCR requis, format tabulaire illisible)
- Taille texte : 2 187 caractères
- Résumé : Document contenant des données financières (numéros de compte, montants, dates). Les colonnes sont partiellement extraites mais illisibles sans OCR.
- Noms identifiés : Aucun nom clair, mais présence de références comme
Account No:,Transaction Date:,Amount:. - Dates/Lieux : Dates de transactions non lisibles.
- Montants : Montants non identifiables (format corrompu).
- Alerte : OUI — Données financières sensibles potentiellement exposées.
EFTA00017064.pdf
- Dataset : 8
- Type : correspondence (email + coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis, texte dégradé)
- Taille texte : 982 caractères
- Résumé :
Document contenant des coordonnées et emails. Exemple :
Email: saffval@aol.com,0207•221-3621. - Noms identifiés : Saffron Aldridge, Alexander Pam, etc.
- Dates/Lieux : Londres (SW1), New York.
- Montants : Aucun.
- Alerte : OUI — Données personnelles.
EFTA00017066.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (extraction native vide)
- Résumé : Document non exploitable. Nécessite OCR.
- Alerte : NON
EFTA00017067.pdf
- Dataset : 8
- Type : correspondence (coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 012 caractères
- Résumé :
Liste de noms et numéros de téléphone. Exemple :
001 212-879-7653,0207-7271006. - Noms identifiés : Adam Nick, Allan Paul, Allan Nick & Sarah, etc.
- Alerte : OUI — Données personnelles.
EFTA00017068.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 3 456 caractères
- Résumé : Liste détaillée de contacts avec noms, numéros de téléphone, adresses email et adresses postales. Contient des entrées comme :
- Amon Mr Philippe :
16 Grafton Square, London SW...,Email: rili~~e.amon~sicpa.com - Appleby Robert & Alex :
Oomaine de Bougy, 1170 Aubonne, Switzerland - Arango Maile :
Espaller #10, Madrid, Spain 28014 - Noms identifiés : 150+ noms (liste complète disponible dans le fichier extrait).
- Dates/Lieux : Localités internationales (Londres, New York, Madrid, Suisse, etc.).
- Montants : Aucun.
- Alerte : OUI — Base de données de contacts sensibles.
EFTA00017070.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 876 caractères
- Résumé :
Email avec coordonnées. Exemple :
Email: paul@vuIcan.com. - Noms identifiés : Allan Paul, etc.
- Alerte : OUI — Données personnelles.
EFTA00017074.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non exploitable. Nécessite OCR.
- Alerte : NON
EFTA00017084.pdf
- Dataset : 8
- Type : correspondence (coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 123 caractères
- Résumé :
Liste de contacts avec numéros de téléphone et emails. Exemple :
001 212 826 9700 (W). - Noms identifiés : Plusieurs noms non lisibles en entier.
- Alerte : OUI — Données personnelles.
EFTA00017085.pdf
- Dataset : 8
- Type : financial_record (relevés)
- Pages : 2
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 987 caractères
- Résumé : Document financier avec colonnes de transactions. Les montants et dates sont partiellement lisibles mais nécessitent OCR.
- Noms identifiés : Aucun nom clair.
- Montants : Non identifiables.
- Alerte : OUI — Données financières sensibles.
EFTA00017090.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 765 caractères
- Résumé :
Email avec coordonnées. Exemple :
Email: alex~rockgecko.com. - Noms identifiés : Plusieurs noms corrompus.
- Alerte : OUI — Données personnelles.
EFTA00017091.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non exploitable. Nécessite OCR.
- Alerte : NON
EFTA00017092.pdf
- Dataset : 8
- Type : correspondence (coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 987 caractères
- Résumé : Liste de contacts avec numéros de téléphone internationaux.
- Noms identifiés : Plusieurs noms non lisibles.
- Alerte : OUI — Données personnelles.
EFTA00017093.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 2 345 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone, et emails. Exemple :
- Astor Viscount William :
29100 COIN, Mala~a, Spain - Bahrke Peter :
001 206 355 5777 - Noms identifiés : 100+ noms.
- Alerte : OUI — Données sensibles.
EFTA00017094.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 876 caractères
- Résumé :
Email avec coordonnées. Exemple :
Email: pb@arkwrighl.co.uk. - Alerte : OUI — Données personnelles.
EFTA00017095.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non exploitable. Nécessite OCR.
- Alerte : NON
EFTA00017101.pdf
- Dataset : 8
- Type : correspondence (coordonnées)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 1 023 caractères
- Résumé : Liste de contacts avec numéros de téléphone et emails.
- Noms identifiés : Plusieurs noms non lisibles.
- Alerte : OUI — Données personnelles.
EFTA00017102.pdf
- Dataset : 8
- Type : financial_record (relevés)
- Pages : 3
- Qualité texte : MAUVAISE (OCR requis)
- Taille texte : 2 56
EpsteinFiles & Co — Doc Crawler