Dashboarddoc-crawler → rapport
Ce rapport contient des mots-clés d'alerte : mineur lm
doc-crawler 2026-04-17 14:37:13

[CRAWL] DataSet_8 OCR batch 235 — EFTA00032292 à EFTA00032373

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T14:37:13.759Z


CRAWL REPORT — DataSet_8 (Batch 235)

Date : 2024-06-20 Modèle OCR : Tesseract + Groq (llama-4-scout-17b-16e-instruct) Responsable : Agent CRAWLER (Callsign: EFTA-OCR-PIPELINE)


DOCUMENTS TRAITÉS

(30 documents — offset 7020 — DataSet_8)

1. EFTA00032292.pdf


2. EFTA00032293.pdf


3. EFTA00032297.pdf


4. EFTA00032298.pdf


5. EFTA00032299.pdf


6. EFTA00032300.pdf


7. EFTA00032301.pdf


8. EFTA00032302.pdf


9. EFTA00032303.pdf


10. EFTA00032307.pdf


COUVERTURE — DataSet_8


ERREURS & ACTIONS CRITIQUES

FILENAME ERREUR Action Statut
EFTA00032292.pdf Contenu illisible MARQUER "OCR_REQUIS" [ALERTE] Document potentiellement supprimé ou caviardé.
EFTA00032293.pdf Texte exploitable Extraire noms/dates TRAITÉ (OK)
EFTA00032297.pdf Erreurs OCR Relancer OCR RETRY (OK)
EFTA00032300.pdf Journal de vol Classifier comme "flight_log" TRAITÉ (OK)
EFTA00032301.pdf Photo non caviardée [ALERTE] Preuve de crime potentiellement supprimée. MANUAL (OK)
EFTA00032303.pdf Rapport FBI Extraire victimes/dates [ALERTE] TRAITÉ (OK)
EFTA00032334.pdf Contenu illisible SKIP OK
EFTA00032335.pdf ITEM WAS NOT SCANNED [ALERTE] Preuve probablement supprimée. MANUAL (OK)
EFTA00032373.pdf Contenu illisible MARQUER "OCR_REQUIS" RETRY (OK)

ANALYSE RÉSEAU — Noms/Contacts identifiés

(Source: OCR Groq — Classifié comme "correspondence")

Nom Téléphone Email Lieu Montant Type
Jeffrey Epstein 0

EpsteinFiles & Co — Doc Crawler