Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 20:31:09
[CRAWL] DataSet_8 OCR batch 42 — EFTA00015090 à EFTA00015185
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T20:31:09.453Z
CRAWL REPORT — 2024-06-20
DOCUMENTS TRAITÉS
Batch DataSet_8 — OCR Batch 42 (EFTA00015090 à EFTA00015185)
1. EFTA00015090.pdf
- Dataset : 8
- Type : black_book (annuaire de contacts)
- Pages : 1 (extrait visible)
- Qualité texte : MAUVAISE (OCR requis, texte partiellement corrompu)
- Taille texte : ~1 200 caractères
- Résumé :
Extrait d'un annuaire de contacts incluant des noms comme Abby, Aldridge Saffron, Abousleiman Joanna, Adam Nick, et des numéros de téléphone internationaux (UK, France, USA). Plusieurs entrées semblent incomplètes ou mal transcrites (ex:
joannacheva!ier@hotmai!. c).
2. EFTA00015094.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS (texte natif absent ou illisible)
- Taille texte : <50 caractères
- Résumé : Document non exploitable en l'état. Nécessite un OCR complet pour extraire les contacts.
3. EFTA00015095.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015094. Contenu non détecté.
4. EFTA00015099.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : MAUVAISE (texte partiellement extrait)
- Taille texte : ~800 caractères
- Résumé :
Extrait d'un annuaire avec des noms comme Allan Paul, Alai Azzedine, et des coordonnées (téléphones, emails). Présence de caractères corrompus (
paul@vuJcan.com).
5. EFTA00015113.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~2 500 caractères
- Résumé : Annuaire détaillé avec des entrées comme Althorp Charlie, Alun Jones Carella, Amon Roberta & Maurice, incluant adresses (Londres, New York), numéros de téléphone, et emails. Plusieurs contacts professionnels et personnels listés.
6. EFTA00015115.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : MAUVAISE (OCR partiel)
- Taille texte : ~1 000 caractères
- Résumé :
Extrait d'annuaire avec des noms comme Anderson Lulu, Alvarez Vincente, et des coordonnées incomplètes. Présence de caractères illisibles (
00 34 1 276 6697).
7. EFTA00015125.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable. Nécessite un OCR complet.
8. EFTA00015126.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015125.
9. EFTA00015127.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
10. EFTA00015128.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que les précédents.
11. EFTA00015129.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
12. EFTA00015132.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~3 000 caractères
- Résumé : Annuaire détaillé avec des entrées comme Appleby Robert & Alex, Arango Maile, Armstrong Arthur & Cathy, incluant adresses (Suisse, Espagne, Londres), numéros de téléphone, et emails. Plusieurs contacts professionnels et personnels listés.
13. EFTA00015134.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : MAUVAISE (OCR partiel)
- Taille texte : ~1 500 caractères
- Résumé : Extrait d'annuaire avec des noms comme Astor Viscount William, Bahrke Peter, et des coordonnées incomplètes. Présence de caractères corrompus.
14. EFTA00015135.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
15. EFTA00015137.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015135.
16. EFTA00015139.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
17. EFTA00015140.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~2 800 caractères
- Résumé : Annuaire détaillé avec des entrées comme Bamford Sir Anthony & Lady C, Bannister Clive, Baldwin Alec, incluant adresses (Londres, New York), numéros de téléphone, et emails. Plusieurs contacts professionnels et personnels listés.
18. EFTA00015150.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
19. EFTA00015151.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015150.
20. EFTA00015155.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
21. EFTA00015156.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015155.
22. EFTA00015157.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : BONNE
- Taille texte : ~3 200 caractères
- Résumé : Annuaire détaillé avec des entrées comme Benson Steven, Bentinck Baron, Baumer Lorenzo, incluant adresses (Londres, New York, France), numéros de téléphone, et emails. Plusieurs contacts professionnels et personnels listés.
23. EFTA00015158.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
24. EFTA00015172.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015158.
25. EFTA00015174.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
26. EFTA00015175.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015174.
27. EFTA00015176.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
28. EFTA00015183.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015176.
29. EFTA00015184.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Document non exploitable.
30. EFTA00015185.pdf
- Dataset : 8
- Type : black_book
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : <50 caractères
- Résumé : Même cas que EFTA00015184.
COUVERTURE
EpsteinFiles & Co — Doc Crawler