Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 22:55:00
[CRAWL] DataSet_8 OCR batch 138 — EFTA00024359 à EFTA00024431
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T22:55:00.718Z
CRAWL REPORT — 2024-05-30
Batch: DataSet_8 OCR Batch 138 (EFTA00024359 à EFTA00024431) Documents traités : 30/30 OCR appliqué : 30/30 (tous nécessitaient l'OCR) Métadonnées générées : Oui Index mis à jour : Oui
📄 DOCUMENTS TRAITÉS
1. EFTA00024359.pdf
- Dataset : 8
- Type : correspondence (email + liste de contacts)
- Pages : 1 (liste dense de contacts)
- Qualité texte : OCR_REQUIS (texte extrait via OCR, qualité moyenne due à la densité)
- Taille texte : ~12 000 caractères
- Résumé : Liste de contacts internationaux incluant noms, numéros de téléphone, adresses email et adresses postales. Plusieurs entrées concernent des individus liés à des réseaux financiers ou sociaux (ex: "Aldridge Saffron", "Abousleiman Joanna", "Adam Nick"). Certaines entrées incluent des annotations comme "Email:" ou "Hm)" (home). → [ALERTE] Présence de données personnelles sensibles (numéros de téléphone, adresses) nécessitant un caviardage avant diffusion.
2. EFTA00024361.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait via OCR, qualité moyenne)
- Taille texte : ~8 500 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US, Espagne), et adresses email. Plusieurs entrées incluent des annotations comme "(h)" (home) ou "(w)" (work). Présence de noms comme "Allan Paul", "Alai Azzedine", "Aznar Jose". → [ALERTE] Données personnelles sensibles à caviarder.
3. EFTA00024362.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 200 caractères
- Résumé : Liste de contacts incluant des noms comme "Althorp Charlie", "Alun Jones Jeremy & Deborah", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)" (portable). → [ALERTE] Données personnelles sensibles.
4. EFTA00024363.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~7 800 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Amon Roberta & Maurice", "Anastos Lisa", et "Anderson Lulu". → [ALERTE] Données personnelles sensibles.
5. EFTA00024365.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 900 caractères
- Résumé : Liste de contacts incluant des noms comme "Appleby Robert & Alex", "Arango Maile", et des numéros de téléphone internationaux (UK, US, Espagne). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
6. EFTA00024366.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 500 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Armstrong Arthur & Cathy", "Arion Joaquin Fernandez de Cordoba", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
7. EFTA00024376.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~10 100 caractères
- Résumé : Liste de contacts incluant des noms comme "Ashley & Allegra Hicks", "Astaire Mr Simon", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
8. EFTA00024396.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 700 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Baker Danny", "Bakhtiar Shariar", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
9. EFTA00024397.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 300 caractères
- Résumé : Liste de contacts incluant des noms comme "Bamford Sir Anthony and Lady C", "Bannister Clive", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
10. EFTA00024398.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 400 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Benson Steven", "Bentinck Baron", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
11. EFTA00024399.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 600 caractères
- Résumé : Liste de contacts incluant des noms comme "Bernard Tara", "Beraaruen Nicolas", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
12. EFTA00024400.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 200 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Bismark Vanessa Von", "Birchall Martyn", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
13. EFTA00024403.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~7 900 caractères
- Résumé : Liste de contacts incluant des noms comme "Bismarck Debbie & Bola Von", "Bloomberg Mike", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
14. EFTA00024404.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 800 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US, Espagne), et adresses email. Présence de noms comme "Booth Mark & Lauren", "Bolsgelin Edward de", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
15. EFTA00024405.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 100 caractères
- Résumé : Liste de contacts incluant des noms comme "Boulos Raymond", "Bowles Peter", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
16. EFTA00024406.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 500 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Boyd David", "Bragg David", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
17. EFTA00024407.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~9 000 caractères
- Résumé : Liste de contacts incluant des noms comme "Brennan John", "Breslin John", et des numéros de téléphone internationaux (UK, US). Certaines entrées incluent des adresses email et des annotations comme "(h)" ou "(p)". → [ALERTE] Données personnelles sensibles.
18. EFTA00024408.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 300 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone (UK, US), et adresses email. Présence de noms comme "Brooks David", "Brown David", et des annotations comme "(h)" ou "(w)". → [ALERTE] Données personnelles sensibles.
19. EFTA00024409.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~8 700 caractères
- Résumé : Liste de contacts incluant des noms comme "Buchanan James",
EpsteinFiles & Co — Doc Crawler