Dashboard → doc-crawler → rapport
doc-crawler
2026-04-19 04:30:40
[CRAWL] DataSet_8 OCR batch 307 — EFTA00036743 à EFTA00036836
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-19T04:30:40.407Z
CRAWL REPORT — 2024-05-25
Batch : DataSet_8 — OCR Batch 307 (EFTA00036743 à EFTA00036836) Documents traités : 30/30 OCR_REQUIS : 30/30 Qualité globale : MAUVAISE (documents scannés ou images non textuelles)
DOCUMENTS TRAITÉS
1. EFTA00036743.pdf
- Dataset : 8
- Type : unknown (texte illisible, structure non identifiable)
- Pages : 1 (scannée)
- Qualité texte : OCR_REQUIS
- Taille texte : 0 caractères (image brute)
- Résumé : Document scanné sans texte extractible. Contient des numéros de téléphone et noms partiels (ex: "Abby 07944 574 202"), mais illisible en l'état.
- Action : OCR_REQUIS — Nécessite une reconnaissance optique de caractères avancée.
2. EFTA00036744.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~500 caractères (extraction partielle)
- Résumé : Liste de noms et numéros de téléphone (ex: "Aldridge Saffron", "Abousleiman, Joanna 0603 338 787"). Contient des emails corrompus ("joannacheva!ier@hotmai!. c").
- Noms identifiés :
- Aldridge Saffron
- Abousleiman, Joanna
- Adam, Nick
- Alexander, Pam
- Alaranti, Giacomo
- Agag, Alejandro
- Numéros : UK (+44), US (+1), Espagne (+34), Hong Kong (+852).
- Action : OCR_REQUIS — Texte partiellement extractible mais avec erreurs de OCR.
3. EFTA00036745.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~600 caractères
- Résumé : Liste de contacts internationaux avec adresses et numéros (ex: "Allan, Nick & Sarah", "Albermarle, Rufus & Sally"). Contient des emails ("rufus@mac.com").
- Noms identifiés :
- Allan, Nick & Sarah
- Albermarle, Rufus & Sally
- Althorp, Charlie
- Alun-Jones, Carella
- Amon, Roberta & Maurice
- Lieux : Londres (SW1, SW3), New York (NY 10021), Hong Kong.
- Action : OCR_REQUIS — Texte extractible mais avec fautes de frappe.
4. EFTA00036747.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~700 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Anastos, Lisa", "Anderson, Lulu"). Contient des emails corrompus ("betlacharlotfe@aol.com").
- Noms identifiés :
- Anastos, Lisa
- Anderson, Lulu
- Alvarez, Senor Vincente
- Amon, Mr Philippe
- Appleby, Robert & Alex
- Lieux : Madrid (Espagne), Londres (SW1), New York.
- Action : OCR_REQUIS — Texte partiellement extractible.
5. EFTA00036748.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~550 caractères
- Résumé : Liste de contacts avec numéros et emails (ex: "Arango, Maile", "Armstrong, Arthur & Cathy"). Contient des emails corrompus ("maraooo@mail.vips.es").
- Noms identifiés :
- Arango, Maile
- Armstrong, Arthur & Cathy
- Arion, Joaquin Fernandez de Cordoba
- Ash, Lorinda
- Ashley & Allegra Hicks
- Lieux : Madrid (Espagne), Londres (SW3), New York (NY 10021).
- Action : OCR_REQUIS — Texte extractible mais avec erreurs.
6. EFTA00036750.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~650 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Astaire, Mr Simon", "Baddeley, Jean"). Contient des emails corrompus ("hotersatifiao!.com").
- Noms identifiés :
- Astaire, Mr Simon
- Baddeley, Jean
- Astor, Viscount William
- Bahrke, Peter
- Atkin, Helene
- Lieux : Londres (SW10), Malaga (Espagne).
- Action : OCR_REQUIS — Texte partiellement extractible.
7. EFTA00036751.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~700 caractères
- Résumé : Liste de contacts avec numéros et emails (ex: "Ashley, Nick & Ari", "Aznar, Jose"). Contient des emails corrompus ("alexanderrogil").
- Noms identifiés :
- Ashley, Nick & Ari
- Aznar, Jose
- Arion, Fernando
- Aron, Herve & Marine
- Assaf, Charlotte & Vittorio
- Lieux : Londres (W11), New York.
- Action : OCR_REQUIS — Texte extractible mais avec fautes.
8. EFTA00036754.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~600 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Baker, Danny", "Bakhtiar, Shariar"). Contient des emails corrompus ("paul@vulcan.com").
- Noms identifiés :
- Baker, Danny
- Bakhtiar, Shariar
- Baldwin, Alec
- Balliol College, Oxford
- Barnes, Peter
- Lieux : Londres (SW3), New York, San Francisco.
- Action : OCR_REQUIS — Texte partiellement extractible.
9. EFTA00036755.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~550 caractères
- Résumé : Liste de contacts avec numéros et emails (ex: "Barnet, Craig", "Bastone, Hillary"). Contient des emails corrompus ("nbarham@arfinglongroup.co").
- Noms identifiés :
- Barnett, Craig
- Bastone, Hillary
- Bamford, Sir Anthony and Lady C
- Bannister, Clive
- Baldwin, Alec
- Lieux : Londres (SW1), New York.
- Action : OCR_REQUIS — Texte extractible mais avec erreurs.
10. EFTA00036756.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~650 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Benson, Steven", "Bentinck, Baron"). Contient des emails corrompus ("Steven.Bentinck@msn.com").
- Noms identifiés :
- Benson, Steven
- Bentinck, Baron
- Baumer, Lorenzo
- Beaumont, Lord & Lady
- Beckwith, Tamara
- Lieux : Londres (SW1), New York.
- Action : OCR_REQUIS — Texte partiellement extractible.
11. EFTA00036757.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~700 caractères
- Résumé : Liste de contacts avec numéros et emails (ex: "Belzberg, Lisa", "Bernard, Tara"). Contient des emails corrompus ("bis-...").
- Noms identifiés :
- Belzberg, Lisa
- Bernard, Tara
- Beraaruen, Nicolas
- Bismark, Vanessa Von
- Birchall, Martyn
- Lieux : New York (NY 10021), Londres (SW1).
- Action : OCR_REQUIS — Texte extractible mais avec fautes.
12. EFTA00036760.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~600 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Bismarck, Debbie & Bola Von", "Bloomberg, Mike"). Contient des emails corrompus ("pb@arkwright.co.uk").
- Noms identifiés :
- Bismarck, Debbie & Bola Von
- Bloomberg, Mike
- Bolsgelin, Edward de
- Booth, Mark & Lauren
- Bisson, Jean Marc
- Lieux : Londres (SW1), New York, Suisse.
- Action : OCR_REQUIS — Texte partiellement extractible.
13. EFTA00036761.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~550 caractères
- Résumé : Liste de contacts avec numéros et emails (ex: "Bjork, Conrad & Barbara", "Black, David"). Contient des emails corrompus ("mlee@usss.treas.gov").
- Noms identifiés :
- Bjork, Conrad & Barbara
- Black, David
- Blaine, David
- Blair, Tony
- Bloomberg, Mike
- Lieux : Londres (SW1), New York.
- Action : OCR_REQUIS — Texte extractible mais avec erreurs.
14. EFTA00036762.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : OCR_REQUIS
- Taille texte : ~650 caractères
- Résumé : Liste de contacts avec adresses et numéros (ex: "Bamford, George/Alice", "Bands, Doug"). Contain des emails corrompus ("alice@scbpartners.com").
- Noms identifiés :
- Bamford, George/Alice
- Bands, Doug
- Barnes, Peter
- Barnett, Craig
- Bastone, Hillary
- Lieux : Londres (SW1), New York, Australie.
- Action : **OCR_RE
EpsteinFiles & Co — Doc Crawler