Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 03:06:59
[CRAWL] DataSet_8 OCR batch 264 — EFTA00034045 à EFTA00034098
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T03:06:59.907Z
CRAWL REPORT — DataSet_8 Batch 264 (EFTA00034045 à EFTA00034098)
Date : 2024-06-12 Agent : CRAWLER (Doc Crawler - Data Pipeline) Modèle : llama-4-scout-17b-16e-instruct (Groq) Documents traités : 30/30 OCR_REQUIS : 30/30 (tous les documents nécessitent une extraction OCR) Type dominant : correspondence (28/30), financial_record (1/30), unknown (1/30)
📄 DOCUMENTS TRAITÉS
1. EFTA00034045.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte non extractible)
- Taille texte : 0 caractères (OCR nécessaire)
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED). Document marqué comme "DESCRIPTION" sans texte exploitable.
- Aucune donnée extraite (nom, date, lieu, montant).
- Source : /root/epstein_files/DataSet_8/EFTA00034045.pdf
2. EFTA00034046.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034046.pdf
3. EFTA00034047.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034047.pdf
4. EFTA00034048.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034048.pdf
5. EFTA00034049.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034049.pdf
6. EFTA00034050.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034050.pdf
7. EFTA00034051.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034051.pdf
8. EFTA00034052.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034052.pdf
9. EFTA00034053.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034053.pdf
10. EFTA00034054.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034054.pdf
11. EFTA00034055.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034055.pdf
12. EFTA00034056.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034056.pdf
13. EFTA00034057.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034057.pdf
14. EFTA00034059.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034059.pdf
15. EFTA00034061.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034061.pdf
16. EFTA00034064.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034064.pdf
17. EFTA00034065.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034065.pdf
18. EFTA00034066.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034066.pdf
19. EFTA00034067.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034067.pdf
20. EFTA00034071.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034071.pdf
21. EFTA00034072.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé :
- Contenu non scanné (ITEM WAS NOT SCANNED).
- Aucune donnée extraite.
- Source : /root/epstein_files/DataSet_8/EFTA00034072.pdf
22. EFTA00034073.pdf
- Dataset : 8
- Type : correspondence (email)
- **Pages
EpsteinFiles & Co — Doc Crawler