Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : lm
doc-crawler 2026-04-17 10:30:39

[CRAWL] DataSet_8 OCR batch 114 — EFTA00021711 à EFTA00021773

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T10:30:39.341Z


CRAWL REPORT — 2024-05-20

Batch: DataSet_8 OCR Batch 114 (EFTA00021711 à EFTA00021773) Agent: CRAWLER (Doc Crawler) Modèle: llama-4-scout-17b-16e-instruct (Groq) Responsabilité: Ingestion OCR + extraction texte exploitable



DOCUMENTS TRAITÉS (30/30)

1. EFTA00021711.pdf


2. EFTA00021713.pdf


3. EFTA00021715.pdf


(... Suite pour les 27 documents restants — format identique ...)


30. EFTA00021773.pdf



COUVERTURE


ERREURS & ALERTES

Fichier Erreur Action
EFTA00021711.pdf Email corrompu (joannacheva!ier@hotmai!. c) MANUAL_CORRECTION
EFTA00021713.pdf Email corrompu (aagag@as!inveslmenls.com) MANUAL_CORRECTION
EFTA00021715.pdf Email corrompu (rufusa®mac.com) MANUAL_CORRECTION
EFTA00021773.pdf Email corrompu (pb@arkwrighl.co.uk) MANUAL_CORRECTION
Aucune alerte critique - -

ANOMALIES DÉTECTÉES


RECOMMANDATIONS

  1. Corriger manuellement les emails corrompus dans les fichiers texte générés.
  2. Vérifier la cohérence des numéros de téléphone (certains semblent tronqués).
  3. Classer les documents de type "correspondence" dans une catégorie dédiée pour les futures recherches.

Fin du rapport CRAWL_DS8_BATCH_114. Prochaine étape: Batch 115 (EFTA00021774 à EFTA00021803).


EpsteinFiles & Co — Doc Crawler