Dashboard → doc-crawler → rapport
doc-crawler
2026-04-18 15:48:22
[CRAWL] DataSet_8 OCR batch 277 — EFTA00034878 à EFTA00034939
Agent: Doc Crawler Modèle: mistral/open-mixtral-8x7b Date: 2026-04-18T15:48:22.344Z
CRAWL REPORT — 2024-06-20
Batch: DataSet_8 OCR Batch 277 (EFTA00034878 à EFTA00034939) Documents traités: 30/30 OCR appliqué: Oui (qualité variable) Source: Groq (llama-4-scout-17b-16e-instruct)
DOCUMENTS TRAITÉS
1. EFTA00034878.pdf
- Dataset: 8
- Type: correspondence (liste de contacts, emails, numéros de téléphone)
- Pages: 1 (liste dense)
- Qualité texte: MAUVAISE (OCR partiel, caractères corrompus)
- Taille texte: ~12 000 caractères
- Résumé:
Liste de contacts internationaux avec noms, adresses, numéros de téléphone et emails. Présence de plusieurs personnalités (ex: Abby, Adam Nick, Aldridge Saffron).
ALERTE: Plusieurs entrées semblent incomplètes ou corrompues (ex:
joannacheva!ier@hotmai!. c). - Noms identifiés: Abby, Adam Nick, Aldridge Saffron, Agag Alejandro, Alai Azzedine, Allan Paul, Amon Mr Philippe, Arango Maile, Armstrong Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, Ash Lorinda, Ashley & Allegra Hicks, Astor Viscount William, Bahrke Peter, Baker Danny, Bamford Sir Anthony, Bannister Clive, Baldwin Alec, Barnes Peter, Barnett Craig, Bastone Hillary, Batstone Tim & Natasha, Benson Steven, Bentinck Baron, Beaumont lord & Lady, Belzberg Lisa, Bernard Tara, Beraaruen Nicolas, Bismark Vanessa Von, Birchall Martyn, Bismarck Debbie & Bola Von, Bisson Jean Marc, Blair Tony, Bloomberg Mike, Bolsgelin Edward de, Booth Mark & Lauren.
- Lieux: Londres (SW1, SW3, SW10), New York (NY 10021, 10022), Madrid, Malaga, Sydney, Hong Kong.
- Dates: Non détectées.
- Montants: Non détectés.
2. EFTA00034882.pdf
- Dataset: 8
- Type: unknown (liste de fichiers image/photo)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel, références à des fichiers image)
- Taille texte: ~500 caractères
- Résumé:
Liste de fichiers image (ex:
DSCF0004_1.TIF,DSC00787.JPG). Contient des références à des photos de "PB girl" et "LSJ". ALERTE: Possible lien avec des preuves photographiques (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
3. EFTA00034883.pdf
- Dataset: 8
- Type: flight_log (extrait de logs de vol)
- Pages: 1
- Qualité texte: BONNE
- Taille texte: ~3 000 caractères
- Résumé: Extrait des logs de vol de l'avion N908JE (Epstein) avec dates, passagers (ex: Epstein Je, Dubin Eva, Maxwell Ghislaine), et trajets (ex: West Palm Beach → Teterboro). ALERTE: Présence de passagers non identifiés ("Female (1)", "Nanny (1)").
- Noms identifiés: Epstein Je, Dubin Eva, Maxwell Ghislaine, Greenberg Alan & Kathy, Grippi Matt, Biddle Sophie.
- Lieux: West Palm Beach (FL), Teterboro (NJ), Columbus (OH).
- Dates: 11/21/1995 à 11/30/1995.
- Montants: Non détectés.
4. EFTA00034884.pdf
- Dataset: 8
- Type: fbi_report (rapport FBI)
- Pages: 2
- Qualité texte: BONNE
- Taille texte: ~4 500 caractères
- Résumé: Rapport FBI daté du 03/22/2011 concernant une enquête sur Jeffrey Epstein et Ghislaine Maxwell ("WSTA - CHILD PROSTITUTION"). Mentionne une victime en Australie et une interview à Sydney. ALERTE: Document critique — lien avec des allégations de trafic sexuel.
- Noms identifiés: Jeffrey Epstein, Ghislaine Maxwell, (PROTECT IDENTITY) [victime], (PROTECT IDENTITY) [agent FBI].
- Lieux: Sydney (Australie), West Palm Beach (FL), Miami (FL).
- Dates: 03/12/2011, 03/14/2011, 03/16/2011, 03/17/2011.
- Montants: Non détectés.
5. EFTA00034885.pdf
- Dataset: 8
- Type: financial_record (relevés téléphoniques)
- Pages: 2
- Qualité texte: BONNE
- Taille texte: ~6 000 caractères
- Résumé: Relevés d'appels téléphoniques détaillés (numéros, durées, coûts) pour un compte basé à New York. Plusieurs appels vers White Plains (NY) et Bronx (NY). ALERTE: Possible lien avec des contacts suspects (à analyser avec d'autres documents).
- Noms identifiés: Aucun.
- Lieux: New York (NY), White Plains (NY), Bronx (NY).
- Dates: 10/31/2006, 11/01/2006.
- Montants: Coûts d'appels non spécifiés (mentionnés comme "$").
6. EFTA00034888.pdf
- Dataset: 8
- Type: unknown (liste de produits)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~1 000 caractères
- Résumé: Liste de produits avec prix (ex: "$549.95", "$49.95"). Contient des références à des chaussures et accessoires. ALERTE: Aucun lien évident avec Epstein — possible erreur de classification.
- Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: $549.95, $49.95.
7. EFTA00034892.pdf
- Dataset: 8
- Type: correspondence (email ou lettre)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel, texte corrompu)
- Taille texte: ~800 caractères
- Résumé: Contient des fragments de texte comme "ITEM WAS NOT SCANNED" et des références à des fichiers image. ALERTE: Document incomplet — possible preuve supprimée.
- Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
8. EFTA00034893.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~600 caractères
- Résumé:
Liste de fichiers image (ex:
DSC00923.JPG,veins0.JPG). Contient des références à des photos médicales ou personnelles. ALERTE: Possible lien avec des preuves visuelles (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
9. EFTA00034896.pdf
- Dataset: 8
- Type: unknown (liste de fichiers divers)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~500 caractères
- Résumé:
Liste de fichiers (ex:
model-20.jpg,grapes2 copy.jpg). Contient des références à des images et des documents non scannés. ALERTE: Document incomplet — possible preuve supprimée. - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
10. EFTA00034901.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~1 200 caractères
- Résumé:
Liste de fichiers image (ex:
DSCF0079_1.TIF,DSCF0080_1.TIF). Contient des références à des photos de "PB sunset/clouds/bird". ALERTE: Possible lien avec des preuves visuelles (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
11. EFTA00034902.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~1 000 caractères
- Résumé:
Liste de fichiers image (ex:
DSC00721.JPG,DSC00718.JPG). Contient des références à des photos de "maya pb/Isi clouds/bird". ALERTE: Possible lien avec des preuves visuelles (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
12. EFTA00034907.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~1 500 caractères
- Résumé:
Liste de fichiers image (ex:
DSC00737.JPG,DSC00736.JPG). Contient des références à des photos de "pb/Isj clouds/bird". ALERTE: Possible lien avec des preuves visuelles (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
13. EFTA00034908.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~1 200 caractères
- Résumé:
Liste de fichiers image (ex:
DSC00721.JPG,DSC00718.JPG). Contient des références à des photos de "maya pb/Isi clouds/bird". ALERTE: Possible lien avec des preuves visuelles (à croiser avec d'autres documents). - Noms identifiés: Aucun.
- Lieux: Non détectés.
- Dates: Non détectées.
- Montants: Non détectés.
14. EFTA00034911.pdf
- Dataset: 8
- Type: photo (liste de fichiers image)
- Pages: 1
- Qualité texte: MAUVAISE (OCR partiel)
- Taille texte: ~800 caractères
- Résumé: Liste de fichiers image (
EpsteinFiles & Co — Doc Crawler