Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 06:48:20
[CRAWL] DataSet_8 OCR batch 27 — EFTA00013921 à EFTA00013989
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T06:48:20.179Z
CRAWL REPORT — DataSet_8 OCR Batch 27
Date: 2024-06-20 Opérateur: CRAWLER (Groq, mod: llama-4-scout-17b-16e-instruct) Batch: EFTA00013921 → EFTA00013989 (offset 780, 30 docs) Source: /root/epstein_files/DataSet_8/ Méthode: OCR natif (Tesseract + Groq OCR) → Extraction texte → Métadonnées → Classification → Production fichiers texte standardisés.
DOCUMENTS TRAITÉS
1. EFTA00013921.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1 (extraction partielle)
- Qualité texte: OCR_REQUIS (texte illisible, extraction partielle via Groq OCR)
- Taille texte: 1 245 caractères
- Résumé: Document partiel avec mentions de "Palm Beach Sheriff's Office" et références à des "Line Up Information". Contenu non exploitable en l'état. [HYPOTHÈSE] : Document lié à une procédure judiciaire (Jeffrey Epstein ?).
2. EFTA00013922.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu, extraction partielle)
- Taille texte: 987 caractères
- Résumé: Mentions de "Case Number", "Jacket #", et références à des "Booking Id". Contenu non exploitable. [ALERTE] : Document marqué "ITEM WAS NOT SCANNED" dans DS3 (preuve probablement supprimée ou caviardée).
3. EFTA00013923.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 120 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up", et références à des "Booking Id". Contenu non exploitable. [HYPOTHÈSE] : Document lié à une procédure de mise en ligne (line-up) pour une enquête.
4. EFTA00013926.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable. [ALERTE] : Document marqué "ITEM WAS NOT SCANNED" dans DS3.
5. EFTA00013942.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Mentions de "Case Number", "Line Up Information", et références à des "Booking Id". Contenu non exploitable. [HYPOTHÈSE] : Document lié à une procédure judiciaire (procédure de line-up).
6. EFTA00013943.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
7. EFTA00013944.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
8. EFTA00013946.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Mentions de "Case Number", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
9. EFTA00013947.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
10. EFTA00013949.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
11. EFTA00013951.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Mentions de "Case Number", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
12. EFTA00013952.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
13. EFTA00013954.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
14. EFTA00013955.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Mentions de "Case Number", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
15. EFTA00013958.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
16. EFTA00013959.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
17. EFTA00013961.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Document lié à des "Line Up Information" avec références à des "Booking Id". Contenu non exploitable.
18. EFTA00013963.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up", et références à des "Booking Id". Contenu non exploitable.
19. EFTA00013964.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
20. EFTA00013965.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Document lié à des "Line Up Information" avec références à des "Booking Id". Contenu non exploitable.
21. EFTA00013967.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up Information", et références à des "Booking Id". Contenu non exploitable.
22. EFTA00013968.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
23. EFTA00013969.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Document lié à des "Line Up Information" avec références à des "Booking Id". Contenu non exploitable.
24. EFTA00013971.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 987 caractères
- Résumé: Mentions de "Palm Beach Sheriff's Office", "Line Up", et références à des "Booking Id". Contenu non exploitable.
25. EFTA00013974.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 892 caractères
- Résumé: Mentions de "Case Number", "Investigating Officer", et références à des "Palm Beach Sheriff's Office". Contenu non exploitable.
26. EFTA00013975.pdf
- Dataset: DS8
- Type: unknown (fragmentaire)
- Pages: 1
- Qualité texte: OCR_REQUIS (texte corrompu)
- Taille texte: 1 045 caractères
- Résumé: Document lié à des "Line Up Information" avec références à des "Booking Id". Contenu non exploitable.
EpsteinFiles & Co — Doc Crawler