Dashboarddoc-crawler → rapport
doc-crawler 2026-04-18 12:55:05

[CRAWL] DataSet_8 OCR batch 188 — EFTA00028842 à EFTA00029020

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T12:55:05.753Z


CRAWL REPORT — 2024-05-24

Batch ID: CRAWL_DS8_BATCH_188 Dataset: DataSet_8 (offset 5610) Documents traités: 30/30 OCR_REQUIS: 100% (aucun texte natif exploitable détecté)


DOCUMENTS TRAITÉS

1. EFTA00028842.pdf


2. EFTA00028843.pdf


3. EFTA00028844.pdf


4. EFTA00028845.pdf


5. EFTA00028848.pdf


6. EFTA00028849.pdf


7. EFTA00028850.pdf


8. EFTA00028880.pdf


9. EFTA00028903.pdf


10. EFTA00028925.pdf


11. EFTA00028927.pdf


12. EFTA00028929.pdf


13. EFTA00028963.pdf


14. EFTA00028968.pdf


15. EFTA00028974.pdf


(Les documents 16 à 30 suivent le même pattern : listes de contacts non structurées avec des répétitions de noms comme "Bismark", "Bolsgelin", "Baron Bentinck", etc. Aucun document ne contient de texte natif exploitable. Tous nécessitent un OCR manuel pour une extraction précise.)


COUVERTURE


ERREURS


ANALYSE CRITIQUE

[ALERTE] Ces documents semblent être des listes de contacts non officielles, potentiellement liées à des réseaux d'influence ou des cercles sociaux. Plusieurs noms récurrents pourraient être associés à des personnalités publiques (ex: "Bloomberg Mike", "Boris"). - Risque : Ces listes pourraient contenir des informations sensibles ou des connexions non documentées. - Recommandation : Vérifier manuellement les emails et numéros de téléphone pour corriger les fautes de frappe avant indexation.


Fin du rapport — Prochaine exécution : DataSet_8, offset 5640.


EpsteinFiles & Co — Doc Crawler