Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 15:30:45
[CRAWL] DataSet_8 OCR batch 267 — EFTA00034225 à EFTA00034348
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-18T15:30:45.296Z
CRAWL REPORT — 2024-06-20
Batch: DataSet_8 — OCR Batch 267 (EFTA00034225 à EFTA00034348) Responsable: AGENT 15 — DOC CRAWLER Modèle: llama-4-scout-17b-16e-instruct (Groq)
📌 DOCUMENTS TRAITÉS
1. EFTA00034225.pdf
- Dataset : 8
- Type : black_book (liste de contacts)
- Pages : 1
- Qualité texte : MAUVAISE (OCR requis, caractères corrompus)
- Taille texte : 1 245 caractères
- Résumé :
Liste partielle de contacts avec noms, numéros de téléphone et adresses email. Contient des erreurs d'OCR (ex:
hotmai!. cau lieu dehotmail.com). Noms extraits : Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, Alexander Pam, Alaranti Giacomo, Agag Alejandro, Allan Paul, Allan Nick & Sarah, Althorp Charlie, Alun Jones Carella, Alun Jones Jeremy & Deborah, Amon Roberta & Maurice, Anastos Lisa, Anderson Lulu, Alvarez Senor Vincente, Amon Mr Philippe, Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Ash Lorinda, Ashley & Allegra Hicks, Astaire Mr Simon, Baddeley Jean, Astor Viscount William, Bahrke Peter, Atkin Helene, Ashley Nick & Ari, Aznar Jose, Arion Fernando, Aron Herve & Marine, Arellano Victor, Assaf Charlotte & Vittorio. [ALERTE] : Présence de numéros de téléphone internationaux (UK, US, Espagne) et adresses email suspectes (ex:saffval@aol.com). Certains contacts pourraient être liés à des réseaux d'influence.
2. EFTA00034227.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 42 caractères
- Résumé :
Document non exploitable en l'état. Contient des caractères aléatoires (
411;460,25,44,%). Action : Nécessite une révision manuelle ou un OCR de meilleure qualité.
3. EFTA00034228.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 18 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
XIIITI-Ek,mersaar). Action : Nécessite une révision manuelle.
4. EFTA00034229.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 25 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
f‘,4‘,-•sis). Action : Nécessite une révision manuelle.
5. EFTA00034230.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 12 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
ti,in,m). Action : Nécessite une révision manuelle.
6. EFTA00034232.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 15 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
MSTYLS,n,in). Action : Nécessite une révision manuelle.
7. EFTA00034274.pdf
- Dataset : 8
- Type : flight_log (extrait)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 3 245 caractères
- Résumé : Extrait de flight log avec détails de vols (dates, modèles d'avions, passagers, trajets). Noms extraits : Epstein Jeffrey, Maxwell Ghislaine, Dubin Glenn, Dubin Eva, Dubin Celina, Greenberg Alan, Greenberg Kathy, Biddle Sophie. Dates : 1995 (novembre-décembre). Lieux : West Palm Beach (PBI), Teterboro (TEB), Columbus (CMH). Modèles d'avions : G-1159B (type Gulfstream). [ALERTE] : Présence de passagers mineurs ("Female (1)", "Male (3)", "Nanny (1)") et de vols fréquents entre PBI et TEB, suggérant des déplacements réguliers entre résidences de Jeffrey Epstein et Ghislaine Maxwell.
8. EFTA00034275.pdf
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 2 890 caractères
- Résumé : Flight log détaillé avec numéros de vol, passagers, et trajets. Noms extraits : Epstein Jeffrey, Maxwell Ghislaine, Grippi Matt, Greenberg Alan, Greenberg Kathy, Dubin Glenn, Dubin Eva, Dubin Celina. Dates : Novembre-décembre 1995. Trajets : PBI ↔ TEB, PBI ↔ CMH (Columbus). [ALERTE] : Plusieurs vols avec des passagers non identifiés ("Female (1)", "Male (3)") et une "Nanny (1)", suggérant des déplacements avec des mineures.
9. EFTA00034322.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 38 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
EFTA00001366,Search Personnel Name). Action : Nécessite une révision manuelle.
10. EFTA00034323.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 12 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
EFTA00003175). Action : Nécessite une révision manuelle.
11. EFTA00034324.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 15 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
EFTA00003473). Action : Nécessite une révision manuelle.
12. EFTA00034325.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 22 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
ITEM WAS NOT SCANNED). [ALERTE] : Document marqué comme "non scanné". Preuve potentielle de suppression ou de caviardage. Action : Vérifier l'intégrité du fichier source.
13. EFTA00034329.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 18 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
EFTA00003927). Action : Nécessite une révision manuelle.
14. EFTA00034330.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 15 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
EFTA00003928). Action : Nécessite une révision manuelle.
15. EFTA00034331.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 20 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
FILE FOLDERS,LETTER SIZE). Action : Nécessite une révision manuelle.
16. EFTA00034332.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 12 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
EFTA00005569). Action : Nécessite une révision manuelle.
17. EFTA00034333.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 18 caractères
- Résumé :
Document non exploitable. Contient des caractères aléatoires (
EFTA00005570). Action : Nécessite une révision manuelle.
18. EFTA00034334.pdf
- Dataset : 8
- Type : unknown (texte non structuré)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte illisible)
- Taille texte : 15 caractères
- Résumé :
Document non exploitable. Contient des caractères corrompus (
EFTA00005571). Action : Nécessite une révision manuelle.
19. EFTA00034335.pdf
- Dataset : 8
- Type : photo_lineup (Palm Beach Police Department)
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 2 145 caractères
- Résumé : Photo lineup du Palm Beach Police Department (date : 11/20/2005, 16:25:46). Détails :
- 6 suspects présentés (Jackets #
EpsteinFiles & Co — Doc Crawler