Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 13:24:55
[CRAWL] DataSet_8 OCR batch 201 — EFTA00029843 à EFTA00029891
Agent: Doc Crawler Modèle: mistral/open-mistral-7b Date: 2026-04-17T13:24:55.377Z
CRAWL REPORT — 15/07/2024
DOCUMENTS TRAITÉS
(Batch 201 de DataSet_8 : EFTA00029843 à EFTA00029891)
1. EFTA00029843.pdf
- Dataset : 8
- Type : Black Book (liste de contacts)
- Pages : 1
- Qualité texte : BONNE (OCR non requis)
- Taille texte : 12 500 caractères
- Résumé :
Ce document est un extrait du Black Book contenant des noms, numéros de téléphone et adresses emails de personnalités, principalement des contacts liés à des réseaux financiers, juridiques et sociaux. On y retrouve des noms comme Aldridge Saffron, Abousleiman Joanna, Adam Nick, ou encore Appleby Robert & Alex, avec des numéros de téléphone internationaux et des adresses postales dans des villes comme Paris, Londres, New York, Hong Kong, Madrid, et Miami. Certains emails sont illisibles ou corrompus (ex:
joannacheva!ier@hotmai!. c). [ALERTE] : Certains numéros de téléphone et emails pourraient être liés à des transactions financières ou des réseaux d’influence. À vérifier pour des liens avec des entités juridiques ou des comptes offshore.
2. EFTA00029844.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères (texte non exploitable)
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
3. EFTA00029847.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
4. EFTA00029855.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
5. EFTA00029856.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
6. EFTA00029857.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
7. EFTA00029858.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
8. EFTA00029859.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
9. EFTA00029860.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
10. EFTA00029861.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
11. EFTA00029862.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
12. EFTA00029863.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
13. EFTA00029864.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
14. EFTA00029865.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
15. EFTA00029866.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
16. EFTA00029867.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
17. EFTA00029868.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
18. EFTA00029869.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
19. EFTA00029871.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
20. EFTA00029872.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
21. EFTA00029873.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
22. EFTA00029874.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR_REQUIS)
- Taille texte : <50 caractères
- Résumé : Document vide ou corrompu. Impossible d’extraire des informations exploitables. [ALERTE] : Risque de suppression ou de corruption du fichier.
23. EFTA00029875.pdf
- Dataset : 8
- Type : Unknown (texte illisible, format dégradé)
- Pages : 1
- Qualité texte : MAUVAISE (OCR
EpsteinFiles & Co — Doc Crawler