Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 22:24:36
[CRAWL] DataSet_8 OCR batch 100 — EFTA00020690 à EFTA00020790
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T22:24:36.845Z
CRAWL REPORT — 2024-06-20
Batch: DataSet_8 — OCR Batch 100 (EFTA00020690 à EFTA00020790) Documents traités: 30/30 Total couverture: 10 515/14 600 (~72%)
DOCUMENTS TRAITÉS
1. EFTA00020690.pdf
- Dataset: 8
- Type: correspondence (lettre manuscrite)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel, texte illisible)
- Taille texte: 128 caractères
- Résumé: Document partiellement numérisé, texte manuscrit illisible. Contient des mentions de "54 /te" et "te 1/i/45" sans contexte clair.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: "te 1/i/45" (probablement 1er novembre 1945)
- Lieux: Aucun
- Montants: Aucun
- Action: RETRY (OCR manuel recommandé pour extraction partielle).
2. EFTA00020691.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
3. EFTA00020692.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
4. EFTA00020696.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
5. EFTA00020697.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
6. EFTA00020699.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
7. EFTA00020701.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
8. EFTA00020702.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
9. EFTA00020703.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
10. EFTA00020711.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
11. EFTA00020729.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
12. EFTA00020757.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
13. EFTA00020762.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
14. EFTA00020766.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
15. EFTA00020768.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
16. EFTA00020769.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
17. EFTA00020772.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
18. EFTA00020773.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document non scanné ou corrompu. Aucune donnée extractible.
- Métadonnées:
- Noms identifiés: Aucun
- Dates: Aucune
- Lieux: Aucun
- Montants: Aucun
- Action: SKIP (document probablement vide ou illisible).
19. EFTA00020774.pdf
- Dataset: 8
- Type: correspondence (email)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte vide après extraction native)
- Taille texte: 0 caractères
- Résumé: Document
EpsteinFiles & Co — Doc Crawler