Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 12:36:48
[CRAWL] DataSet_8 OCR batch 176 — EFTA00028030 à EFTA00028079
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T12:36:48.676Z
CRAWL REPORT — 2024-06-21
DOCUMENTS TRAITÉS
EFTA00028030.pdf
- Dataset : 8
- Type : correspondence
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 12 caractères
- Résumé : Document illisible nécessitant un OCR avancé. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract ou Adobe Scan.
EFTA00028032.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 2 456 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone et adresses email. Inclut des individus comme Abby, Aldridge Saffron, Adam Nick, Alaranti Giacomo, etc.
- Noms identifiés :
- Abby (07944 574 202)
- Aldridge Saffron
- Abousleiman, Joanna (0603 338 787, joannacheva!ier@hotmai!.c)
- Adam, Nick (19 Rue De Lille, 00 331 40150061)
- Alaranti Giacomo
- Agag Alejandro (83 Duke St, London)
- Allan Paul (paul@vulcan.com)
- Allan, Nick & Sarah
- Albermarle, Rufus & Sally
- Althorp, Charlie
- Alun Jones, Carella
- Amon, Roberta & Maurice
- Anastos, Lisa
- Anderson, Lulu
- Alvarez, Senor Vincente
- Amon, Mr Philippe
- Dates/Lieux :
- Adresses : Londres (SW1, SW3, SW1Y), New York (NY 10021), Madrid, Suisse (Aubonne), Hong Kong.
- Montants : Aucun
- Action : TRAITÉ — Fichier texte généré (
EFTA00028032.txt).
EFTA00028033.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 48 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028034.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 15 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028035.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028036.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028038.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 3 124 caractères
- Résumé : Liste de contacts avec noms, numéros de téléphone, adresses et emails. Inclut des individus comme Appleby, Robert & Alex, Arango, Maile, Armstrong, Arthur & Cathy, Arion Joaquin Fernandez de Cordoba, etc.
- Noms identifiés :
- Appleby, Robert & Alex (Oomaine de Bougy, Suisse)
- Arango, Maile (Madrid)
- Armstrong, Arthur & Cathy (Londres)
- Arion Joaquin Fernandez de Cordoba (Madrid)
- Ash, Lorinda (New York)
- Ashley & Allegra Hicks (Londres, New York)
- Astor Viscount William (Malaga, Espagne)
- Bahrke Peter
- Atkin Helene
- Ashley, Nick & Ari (Londres)
- Aznar Jose (S&S Capital, Londres)
- Arion Fernando
- Aron Herve & Marine
- Arellano Victor
- Assaf Charlotte & Vittorio
- Dates/Lieux :
- Adresses : Londres (SW1, SW3), New York (NY 10021), Madrid, Suisse (Aubonne), Malaga.
- Montants : Aucun
- Action : TRAITÉ — Fichier texte généré (
EFTA00028038.txt).
EFTA00028039.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 25 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028040.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 30 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028041.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028044.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 28 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028045.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028047.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 15 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028048.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 20 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028049.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028050.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 24 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028051.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 32 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028052.pdf
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : 26 caractères
- Résumé : Document scanné avec texte illisible. Contient des fragments de texte non structuré.
- Noms identifiés : Aucun
- Dates/Lieux/Montants : Aucun
- Action : OCR_REQUIS — Nécessite une reprocessing avec Tesseract.
EFTA00028055.pdf
- Dataset : 8
- **
EpsteinFiles & Co — Doc Crawler