Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 18:36:37
[CRAWL] DataSet_8 OCR batch 10 — EFTA00011092 à EFTA00011179
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T18:36:37.553Z
CRAWL REPORT — DataSet_8 Batch 10 (EFTA00011092 à EFTA00011179)
Date: 2024-05-30 Agent: CRAWLER (Doc Crawler — Data Pipeline) Modèle: llama-4-scout-17b-16e-instruct (Groq) Responsabilité: OCR + extraction texte exploitable pour DataSet_8 (offset 270).
📌 DOCUMENTS TRAITÉS
1. EFTA00011092.pdf
- Dataset: 8
- Type: correspondence (email + notes manuscrites)
- Pages: 1 (numérisation partielle)
- Qualité texte: MAUVAISE (texte manuscrit illisible, OCR partiel)
- Taille texte: ~120 caractères
- Résumé:
- Contient des extraits d’emails et des notes manuscrites non déchiffrables.
- Aucun nom, date ou montant identifiable.
- Action: RETRY (OCR manuel recommandé sur scan haute résolution).
2. EFTA00011093.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères (texte natif absent)
- Résumé:
- Email non extractible (format image dégradé).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
3. EFTA00011094.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
4. EFTA00011095.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
5. EFTA00011096.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
6. EFTA00011113.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
7. EFTA00011115.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
8. EFTA00011132.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
9. EFTA00011133.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
10. EFTA00011135.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
11. EFTA00011137.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
12. EFTA00011139.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
13. EFTA00011140.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
14. EFTA00011141.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
15. EFTA00011142.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
16. EFTA00011145.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
17. EFTA00011146.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
18. EFTA00011147.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
19. EFTA00011149.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
20. EFTA00011157.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
21. EFTA00011161.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
22. EFTA00011162.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
23. EFTA00011163.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Contenu non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
24. EFTA00011164.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- Taille texte: 0 caractères
- Résumé:
- Email non extractible (format image).
- Aucun nom ou détail identifiable.
- Action: MANUAL (réimporter en haute résolution).
25. EFTA00011166.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte scanné illisible)
- **Taille texte
EpsteinFiles & Co — Doc Crawler