Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 15:24:24
[CRAWL] DataSet_8 OCR batch 261 — EFTA00033715 à EFTA00033892
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T15:24:24.193Z
CRAWL REPORT — 2024-03-15
DOCUMENTS TRAITÉS
Batch DS8_BATCH_261 — 30 documents traités (offset 7800)
(OCR requis pour tous les documents, extraction de texte natif impossible ou <50 caractères)
- [EFTA00033715.pdf]
- Dataset : DS8
- Type : unknown (texte illisible, OCR_REQUIS)
- Pages : 1 (extraction impossible)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (texte natif vide)
- Résumé : Document non scanné ou corrompu. Contenu non extractible sans OCR.
- Action : OCR nécessaire. [ALERTE] : ITEM WAS NOT SCANNED (preuve probablement supprimée).
- [EFTA00033743.pdf]
- Dataset : DS8
- Type : financial_record (extrait partiel de relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement illisible)
- Taille texte : ~150 caractères (extrait)
- Résumé : Relevé bancaire partiel (BOA NY) avec mention de "Request ID 11" et "WD1003F". Montant non lisible.
- Métadonnées extraites :
- Banque : BOA NY
- Date : 08/12/2011
- Montant : Non lisible (chiffres corrompus)
- Action : OCR à appliquer pour récupération complète.
- [EFTA00033744.pdf]
- Dataset : DS8
- Type : financial_record (relevé bancaire)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement illisible)
- Taille texte : ~200 caractères (extrait)
- Résumé : Relevé bancaire (NYCO25654) avec mention de "Digital" et "mow n. VV D2500". Détails incomplets.
- Action : OCR nécessaire pour extraction complète.
- [EFTA00033745.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu. Contenu non extractible.
- Action : OCR requis. [ALERTE] : ITEM WAS NOT SCANNED.
- [EFTA00033746.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033747.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033775.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033781.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033782.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033784.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033785.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033786.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033799.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033803.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033804.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033825.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033843.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033860.pdf]
- Dataset : DS8
- Type : photo (contenu visuel explicite)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte minimal)
- Taille texte : ~50 caractères
- Résumé : Image promotionnelle pour un produit érotique ("Lather-Up Pussy"). Marque "California Exotic Novelties". Date de copyright 1997.
- Métadonnées extraites :
- Marque : California Exotic Novelties
- Date : 1997
- Type : Produit érotique
- Action : OCR requis pour métadonnées. Contenu à archiver sous "photo" avec avertissement de contenu explicite.
- [EFTA00033861.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033862.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033864.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033865.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033866.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033867.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033873.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033874.pdf]
- Dataset : DS8
- Type : unknown (texte illisible)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères
- Résumé : Document non scanné ou corrompu.
- Action : OCR requis.
- [EFTA00033875.pdf]
- Dataset : DS8
- Type : unknown (texte illisible
EpsteinFiles & Co — Doc Crawler