Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 04:36:19
[CRAWL] DataSet_8 OCR batch 268 — EFTA00034352 à EFTA00034435
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T04:36:19.654Z
CRAWL REPORT — 2024-06-18
Batch: DataSet_8 OCR batch 268 (EFTA00034352 à EFTA00034435)
Documents traités: 30/30
OCR_REQUIS: 30/30 (100%)
Modèle utilisé: llama-4-scout-17b-16e-instruct (Groq)
DOCUMENTS TRAITÉS
1. EFTA00034352.pdf
- Dataset: 8
- Type: unknown (texte non structuré, références à des photos)
- Pages: 1 (texte minimal)
- Qualité texte: MAUVAISE (texte illisible, OCR requis)
- Taille texte: 128 caractères
- Résumé:
Document mentionne des références à des fichiers image (
DSCO2033.JPGàDSCO2092.JPG) et un item non scanné (ITEM WAS NOT SCANNED). Contenu non exploitable sans OCR. - Noms identifiés: Aucun (références à "Jean Luc 2")
- Dates/Lieux/Montants: Aucun
- Alerte: NON (document public, mais inutilisable en l'état)
2. EFTA00034353.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 156 caractères
- Résumé:
Liste de fichiers image (
EFTA00004763.txtàEFTA00004770.txt) avec mentions de "Jean Luc 2" et des références à des photos (DSCO2093.JPGàDSCO2114.JPG). - Noms identifiés: "Jean Luc 2"
- Dates/Lieux/Montants: Aucun
- Alerte: NON
3. EFTA00034354.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 142 caractères
- Résumé:
Document mentionne
ITEM WAS NOT SCANNEDet des références à des fichiers image (EFTA00003933.txtàEFTA00003935.txt). - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
4. EFTA00034355.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 168 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00004064.txtàEFTA00004065.txt) et un item non scanné. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
5. EFTA00034356.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 134 caractères
- Résumé:
Document avec référence à une photo (
EFTA00004012.txt) et mention de "Gustavia, 97133 SAINT-BARTHELEMY F.W.I". - Noms identifiés: Aucun
- Dates/Lieux/Montants: "Gustavia, 97133 SAINT-BARTHELEMY F.W.I"
- Alerte: NON (lieu potentiellement pertinent pour investigations)
6. EFTA00034357.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 150 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00003921.txtàEFTA00003922.txt) et un item non scanné. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
7. EFTA00034358.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 178 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00007550.txtàEFTA00007552.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
8. EFTA00034359.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 145 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00007753.txtàEFTA00007754.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
9. EFTA00034362.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 162 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00007755.txtàEFTA00007762.txt) et un item non scanné. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
10. EFTA00034363.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 158 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00007087.txtàEFTA00007089.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
11. EFTA00034365.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 149 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00007576.txtàEFTA00007581.txt) et un item non scanné. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
12. EFTA00034366.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 165 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00006371.txtàEFTA00006373.txt) et des données non structurées. - Noms identifiés: "Jeffrey E. E"
- Dates/Lieux/Montants: Aucun
- Alerte: NON
13. EFTA00034367.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 152 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00008484.txtàEFTA00008484.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
14. EFTA00034370.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 171 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00008413.txtàEFTA00008461.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
15. EFTA00034371.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 160 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00008461.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
16. EFTA00034372.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 155 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00008716.txtàEFTA00008725.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
17. EFTA00034374.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 147 caractères
- Résumé:
Document avec références à des fichiers image (
EFTA00008892.txtàEFTA00008901.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
18. EFTA00034375.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: MAUVAISE (OCR requis)
- Taille texte: 163 caractères
- Résumé:
Contient des références à des fichiers image (
EFTA00008631.txtàEFTA00008633.txt) et des données non structurées. - Noms identifiés: Aucun
- Dates/Lieux/Montants: Aucun
- Alerte: NON
19. EFTA00034376.pdf
- Dataset: 8
- Type: unknown (texte non structuré)
- Pages: 1
- Qualité texte: **MAUVAISE
EpsteinFiles & Co — Doc Crawler