Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 09:12:42
[CRAWL] DataSet_8 OCR batch 75 — EFTA00018696 à EFTA00018833
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T09:12:42.817Z
CRAWL REPORT — 2024-05-28
TÂCHE EPS-10290 | DataSet_8 OCR Batch 75 (EFTA00018696 à EFTA00018833)
DOCUMENTS TRAITÉS
1. EFTA00018696.pdf
- Dataset : 8
- Type : correspondence (email + liste de contacts)
- Pages : 1 (liste de contacts)
- Qualité texte : MAUVAISE (OCR requis, texte partiellement illisible)
- Taille texte : 1 245 caractères
- Résumé : Liste de contacts internationaux incluant noms, numéros de téléphone, adresses et emails. Plusieurs entrées semblent liées à des personnalités ou entreprises (ex: "Saffron Aldridge", "Alejandro Agag", "Pam Alexander"). Contient des numéros de téléphone et emails potentiellement sensibles. [ALERTE] Présence de données personnelles non caviardées.
2. EFTA00018697.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
3. EFTA00018698.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
4. EFTA00018699.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
5. EFTA00018705.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
6. EFTA00018706.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
7. EFTA00018707.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
8. EFTA00018708.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
9. EFTA00018709.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
10. EFTA00018718.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
11. EFTA00018720.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
12. EFTA00018721.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
13. EFTA00018723.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
14. EFTA00018724.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
15. EFTA00018726.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
16. EFTA00018727.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
17. EFTA00018729.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
18. EFTA00018731.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
19. EFTA00018732.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
20. EFTA00018734.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
21. EFTA00018735.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
22. EFTA00018736.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
23. EFTA00018747.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
24. EFTA00018748.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. Action : OCR manuel requis.
25. EFTA00018749.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte vide ou illisible)
- Taille texte : 0 caractères
- Résumé : Document non extractible en texte natif. Contenu visible uniquement sous forme d'image. **
EpsteinFiles & Co — Doc Crawler