Dashboarddoc-crawler → rapport
doc-crawler 2026-04-16 22:24:49

[CRAWL] DataSet_8 OCR batch 99 — EFTA00020577 à EFTA00020689

Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T22:24:49.072Z


CRAWL REPORT — DataSet_8 Batch 99 (EFTA00020577 à EFTA00020689)

Date: 2024-06-20 Modèle OCR: Groq (llama-4-scout-17b-16e-instruct) Source: /root/epstein_files/DataSet_8/


DOCUMENTS TRAITÉS — OCR_REQUIS (extraction native <50 caractères)

Batch 99 — 30 documents analysés. Tous marqués OCR_REQUIS (texte natif absent ou illisible). Source identifiée: fragments de BLACK BOOK (listes de contacts) et FLIGHT LOGS (registres de vols).

Détails par document (extraction manuelle des fragments visibles) :

  1. EFTA00020577.pdf :
  2. Dataset : 8
  3. Type : unknown (fragments de listes)
  4. Pages : 1 (fragmentaire)
  5. Qualité texte : OCR_REQUIS (illlisible)
  6. Taille texte : <50 caractères (extraction native vide)
  7. Résumé : Fragments de noms et numéros de téléphone (ex: "Abby 07944 574 202"). Contenu critique non identifiable (fragments illisibles).

  8. EFTA00020578.pdf :

  9. Dataset : 8
  10. Type : unknown
  11. Pages : 1
  12. Qualité texte : OCR_REQUIS
  13. Taille texte : <50 caractères
  14. Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone (ex: "Adam, Nick 19 Rue De Lille..."). Aucun contenu critique identifiable (fragments illisibles).

  15. EFTA00020584.pdf :

  16. Dataset : 8
  17. Type : unknown
  18. Pages : 1
  19. Qualité texte : OCR_REQUIS
  20. Taille texte : <50 caractères
  21. Résumé : Fragments de listes de contacts avec noms, adresses, et numéros de téléphone. Aucune donnée exploitable (fragments illisibles).

  22. EFTA00020592.pdf :

  23. Dataset : 8
  24. Type : unknown
  25. Pages : 1
  26. Qualité texte : OCR_REQUIS
  27. Taille texte : <50 caractères
  28. Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique (fragments illisibles).

  29. EFTA00020596.pdf :

  30. Dataset : 8
  31. Type : unknown
  32. Pages : 1
  33. Qualité texte : OCR_REQUIS
  34. Taille texte : <50 caractères
  35. Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).

  36. EFTA00020621.pdf :

  37. Dataset : 8
  38. Type : unknown
  39. Pages : 1
  40. Qualité texte : OCR_REQUIS
  41. Taille texte : <50 caractères
  42. Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).

  43. EFTA00020622.pdf :

  44. Dataset : 8
  45. Type : unknown
  46. Pages : 1
  47. Qualité texte : OCR_REQUIS
  48. Taille texte : <50 caractères
  49. Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).

  50. EFTA00020623.pdf :

  51. Dataset : 8
  52. Type : unknown
  53. Pages : 1
  54. Qualité texte : OCR_REQUIS
  55. Taille texte : <50 caractères
  56. Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique (fragments illisibles).

  57. EFTA00020624.pdf :

  58. Dataset : 8
  59. Type : unknown
  60. Pages : 1
  61. Qualité texte : OCR_REQUIS
  62. Taille texte : <50 caractères
  63. Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).

  64. EFTA00020625.pdf :

    • Dataset : 8
    • Type : unknown
    • Pages : 1
    • Qualité texte : OCR_REQUIS
    • Taille texte : <50 caractères
    • Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. [ALERTE] ITEM WAS NOT SCANNED — DESCRIPTION MANQUANTE (preuve probablement supprimée ou non scannée).
  65. EFTA00020626.pdf :

    • Dataset : 8
    • Type : unknown
    • Pages : 1
    • Qualité texte : OCR_REQUIS
    • Taille texte : <50 caractères
    • Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
  66. EFTA00020627.pdf :

    • Dataset : 8
    • Type : unknown
    • Pages : 1
    • Qualité texte : OCR_REQUIS
    • Taille texte : <50 caractères
    • Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).
  67. EFTA00020629.pdf :

    • Dataset : 8
    • Type : unknown
    • Pages : 1
    • Qualité texte : OCR_REQUIS
    • Taille texte : <50 caractères
    • Résumé : Fragments de listes de contacts avec noms et adresses. Aucune donnée exploitable (fragments illisibles).
  68. EFTA00020645.pdf :

    • Dataset : 8
    • Type : unknown
    • Pages : 1
    • Qualité texte : OCR_REQUIS
    • Taille texte : <50 caractères
    • Résumé : Fragments de listes de contacts avec adresses et numéros de téléphone. Aucun contenu critique identifiable (fragments illisibles).
  69. EFTA00020659.pdf :

    • Dataset : 8
    • **Type

EpsteinFiles & Co — Doc Crawler