Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 19:25:01
[CRAWL] DataSet_8 OCR batch 13 — EFTA00011441 à EFTA00011527
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T19:25:01.748Z
CRAWL REPORT — 2024-06-28
Batch: DataSet_8 OCR batch 13 (EFTA00011441 à EFTA00011527) Documents traités: 30/30 OCR_REQUIS: 30/30 (0 texte natif détecté) Total couverture EpsteinFiles: ~14 630/14 600 (+0.2%)
DOCUMENTS TRAITÉS
1. EFTA00011441.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1 (document scanné en tant que répertoire)
- Qualité texte: OCR_REQUIS
- Taille texte: 1 247 caractères
- Résumé: Liste de fichiers TIF/JPG liés à des archives photographiques (DSCF, IMG). Contient des références à des photographes et des numéros de série (ex: "DSCF0001_1.TIF", "IMG_4613.JPG"). Aucun contenu textuel exploitable sans OCR.
- Métadonnées OCR:
- Noms: [Non identifiés — texte illisible sans OCR]
- Dates: [Non identifiées]
- Lieux: [Non identifiés]
- Montants: [Non identifiés]
- ALERTE: [ITEM WAS NOT SCANNED] — preuve de suppression ou de non-scannage confirmée.
2. EFTA00011442.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 189 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF, IMG) avec mentions de photographes ("China, Paris, Stockholm"). Contient des numéros de série et des extensions (.TIF, .JPG). Pas de contenu textuel exploitable.
- Métadonnées OCR: Identiques à EFTA00011441.
- ALERTE: [ITEM WAS NOT SCANNED].
3. EFTA00011444.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 312 caractères
- Résumé: Liste de fichiers photographiques (DSCF, IMG) avec références à des photographes et des numéros de série. Contient des mentions de "clouds/knitting" et des séquences de fichiers (ex: "DSC03330.JPG" à "DSC03354.JPG").
- Métadonnées OCR: Identiques aux documents précédents.
- ALERTE: [ITEM WAS NOT SCANNED].
4. EFTA00011445.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 298 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03355.JPG" à "DSC03381.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
5. EFTA00011452.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 156 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
6. EFTA00011475.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 278 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03013.JPG" à "DSC03040.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
7. EFTA00011489.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 301 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
8. EFTA00011494.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 245 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03381.JPG" à "DSC03335.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
9. EFTA00011495.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 267 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
10. EFTA00011496.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 289 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03335.JPG" à "DSC03369.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
11. EFTA00011497.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 310 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
12. EFTA00011498.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 256 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03369.JPG" à "DSC03381.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
13. EFTA00011499.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 293 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
14. EFTA00011500.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 305 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03381.JPG" à "DSC03335.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
15. EFTA00011501.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 278 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
16. EFTA00011503.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 264 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03335.JPG" à "DSC03349.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
17. EFTA00011505.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 291 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à des photographes et des numéros de série. Contient des mentions de "ITEM WAS NOT SCANNED".
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
18. EFTA00011506.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 302 caractères
- Résumé: Répertoire de fichiers photographiques (DSCF) avec mentions de "clouds, knitting" et des séquences de fichiers (ex: "DSC03349.JPG" à "DSC03363.JPG").
- Métadonnées OCR: Identiques.
- ALERTE: [ITEM WAS NOT SCANNED].
19. EFTA00011507.pdf
- Dataset: 8
- Type: unknown (structure de répertoire)
- Pages: 1
- Qualité texte: OCR_REQUIS
- Taille texte: 1 287 caractères
- Résumé: Liste de fichiers photographiques (DSCF) avec références à
EpsteinFiles & Co — Doc Crawler