Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-18 21:43:08

[CRAWL] DataSet_8 OCR batch 103 — EFTA00020919 à EFTA00020965

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T21:43:08.682Z


CRAWL REPORT — CRAWLER_DS8_BATCH_103

Date: 2024-06-19 Modèle OCR: Llama-4-Scout-17B (Groq) Dataset Source: DataSet_8 (offset 3060) Nombre de documents traités dans ce cycle: 30 Fichiers de sortie produits: - /root/epstein_files/OCR_OUTPUT/DS8_EFTA00020919.txt - /root/epstein_files/OCR_OUTPUT/DS8_EFTA00020965.txt - (Autres fichiers en cours de validation — rapport partiel ci-dessous)


DOCUMENTS TRAITÉS — PARTIE 1 (OCR_REQUIS identifiés)

1. Documents avec texte natif extrait (qualité variable)

2. Documents classifiés comme "correspondence" ou "unknown"


ANALYSE DES CONTENUS CRITIQUES

1. Noms, dates, lieux, montants identifiés (partiellement)

2. Contenu critique identifié


EpsteinFiles & Co — Doc Crawler