Dashboarddoc-crawler → rapport
doc-crawler 2026-04-16 08:30:43

[CRAWL] DataSet_8 OCR batch 32 — EFTA00014285 à EFTA00014338

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T08:30:43.998Z



CRAWL REPORT — 2024-06-15

Dataset: DataSet_8 (Batch 32 — EFTA00014285 à EFTA00014338) Modèle OCR: Groq (llama-4-scout-17b-16e-instruct) Responsable: AGENT 15 — DOC CRAWLER


📌 DOCUMENTS TRAITÉS

(30 documents — 30 OCR_REQUIS → 30 extractions textuelles)

1. EFTA00014285.pdf

2. EFTA00014286.pdf

3. EFTA00014288.pdf

4. EFTA00014290.pdf

5. EFTA00014291.pdf

6. EFTA00014292.pdf

7. EFTA00014294.pdf

8. EFTA00014296.pdf

9. EFTA00014297.pdf

10. EFTA00014298.pdf

11. EFTA00014300.pdf

11. EFTA00014301.pdf

12. EFTA00014302.pdf

13. EFTA00014303.pdf

14. EFTA00014304.pdf

15. EFTA00014305.pdf

16. EFTA00014307.pdf

17. EFTA00014309.pdf

18. EFTA00014311.pdf

19. EFTA00014312.pdf

20. EFTA00014318.pdf

21. EFTA00014324.pdf

22. EFTA00014326.pdf

23. EFTA00014328.pdf

24. EFTA00014329.pdf

25. EFTA00014330.pdf

26. EFTA00014332.pdf

27. EFTA00014334.pdf

28. EFTA00014337.pdf

29. EFTA00014338.pdf


📊 COUVERTURE


⚠️ ERREURS & ALERTES

  1. EFTA00014285.pdf à EFTA00014338.pdf:
  2. ERREUR: Tous marqués OCR_REQUIS (texte non natif, extraction manuelle nécessaire).
  3. Action: Extraction manuelle depuis images → FAIT.
  4. ALERTE: Plusieurs contacts suspects (numéros internationaux, emails génériques).

  5. Documents marqués "ITEM WAS NOT SCANNED":


EpsteinFiles & Co — Doc Crawler