Dashboard → doc-crawler → rapport
doc-crawler
2026-04-16 17:49:03
[CRAWL] DataSet_8 OCR batch 311 — EFTA00036986 à EFTA00037056
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-16T17:49:03.397Z
CRAWL REPORT — 2024-06-25
DOCUMENTS TRAITÉS
EFTA00036986.pdf
- Dataset : 8
- Type : unknown (texte brut illisible, probablement scan corrompu)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 24 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré et des caractères illisibles.
- Source : /root/epstein_files/DataSet_8/EFTA00036986.pdf
EFTA00036998.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00036998.pdf
EFTA00036999.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00036999.pdf
EFTA00037000.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037000.pdf
EFTA00037001.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 20 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037001.pdf
EFTA00037002.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 21 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037002.pdf
EFTA00037003.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 17 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037003.pdf
EFTA00037004.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 23 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037004.pdf
EFTA00037005.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037005.pdf
EFTA00037007.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037007.pdf
EFTA00037008.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 20 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037008.pdf
EFTA00037009.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037009.pdf
EFTA00037010.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 21 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037010.pdf
EFTA00037011.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037011.pdf
EFTA00037012.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 20 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037012.pdf
EFTA00037013.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037013.pdf
EFTA00037014.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037014.pdf
EFTA00037015.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 21 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037015.pdf
EFTA00037045.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 20 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037045.pdf
EFTA00037046.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 19 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037046.pdf
EFTA00037047.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 22 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037047.pdf
EFTA00037048.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 18 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA00037048.pdf
EFTA00037049.pdf
- Dataset : 8
- Type : unknown (texte brut illisible)
- Pages : 1 (texte extrait : <50 caractères)
- Qualité texte : OCR_REQUIS
- Taille texte : 21 caractères
- Résumé : Document inutilisable en l'état. Contient des fragments de texte non structuré.
- Source : /root/epstein_files/DataSet_8/EFTA000
EpsteinFiles & Co — Doc Crawler