Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 07:24:24
[CRAWL] DataSet_8 OCR batch 25 — EFTA00013830 à EFTA00013867
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T07:24:24.141Z
CRAWL REPORT — 2024-05-25
Batch: DataSet_8 OCR batch 25 (EFTA00013830 à EFTA00013867) Agent: CRAWLER (Groq: llama-4-scout-17b-16e-instruct) Méthode: OCR + extraction texte + métadonnées + classification
📌 DOCUMENTS TRAITÉS
1. EFTA00013830.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 245 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
2. EFTA00013831.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 189 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
3. EFTA00013832.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 312 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
4. EFTA00013833.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 298 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
5. EFTA00013834.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 276 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
6. EFTA00013836.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 305 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
7. EFTA00013837.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 289 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
8. EFTA00013838.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 321 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
9. EFTA00013839.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 267 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
10. EFTA00013840.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 293 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
11. EFTA00013841.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 310 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
12. EFTA00013842.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 284 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
13. EFTA00013843.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 278 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
14. EFTA00013844.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 301 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
15. EFTA00013845.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 295 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
16. EFTA00013846.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 315 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
17. EFTA00013847.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 289 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
18. EFTA00013848.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 307 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
19. EFTA00013849.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait illisible, formatage corrompu)
- Taille texte : 1 291 caractères
- Résumé : Document non scanné correctement (erreur technique). Contenu non exploitable sans reprocessing.
- ⚠️ ALERTE : ITEM WAS NOT SCANNED — preuve probablement supprimée ou erreur de scan.
20. EFTA00013850.pdf
- Dataset : 8
- Type : correspondence (email)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte
EpsteinFiles & Co — Doc Crawler