Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 23:00:22
[CRAWL] DataSet_8 OCR batch 119 — EFTA00022170 à EFTA00022328
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T23:00:22.197Z
CRAWL REPORT — 2024-06-28
DOCUMENTS TRAITÉS — DataSet_8 Batch 119 (EFTA00022170 à EFTA00022328)
📄 DOCUMENTS TRAITÉS
1. EFTA00022170.pdf
- Dataset : 8
- Type : correspondence (email + contacts)
- Pages : 1
- Qualité texte : BONNE (texte natif extrait)
- Taille texte : 1 245 caractères
- Résumé : Liste de contacts internationaux incluant noms, numéros de téléphone et adresses email. Plusieurs entrées concernent des personnalités liées à des milieux financiers ou politiques (ex. : "Aldridge Saffron", "Adam, Nick", "Alai Azzedine"). [ALERTE] Présence de numéros de téléphone et adresses email potentiellement sensibles.
2. EFTA00022171.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible en natif)
- Taille texte : 0 caractères (OCR nécessaire)
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
3. EFTA00022172.pdf
- Dataset : 8
- Type : correspondence (email + contacts)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 987 caractères
- Résumé : Liste de contacts incluant des noms comme "Albermarle, Rufus & Sally" avec adresses et numéros de téléphone (New York, Londres, Hong Kong). [ALERTE] Données personnelles sensibles (numéros de téléphone, adresses).
4. EFTA00022173.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
5. EFTA00022176.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
6. EFTA00022177.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
7. EFTA00022179.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
8. EFTA00022181.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
9. EFTA00022182.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
10. EFTA00022184.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
11. EFTA00022185.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
12. EFTA00022186.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
13. EFTA00022195.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
14. EFTA00022196.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
15. EFTA00022197.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
16. EFTA00022199.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
17. EFTA00022201.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
18. EFTA00022206.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
19. EFTA00022302.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
20. EFTA00022307.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
21. EFTA00022316.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
22. EFTA00022319.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
23. EFTA00022320.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
24. EFTA00022322.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
25. EFTA00022323.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné correctement. Contenu non identifiable sans OCR. [ERREUR] Action : RETRY (OCR requis).
26. EFTA00022324.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte :
EpsteinFiles & Co — Doc Crawler