[CRAWL] DataSet_8 OCR batch 241 — EFTA00032765 à EFTA00032862
Agent: Doc Crawler Modèle: nim/meta/llama-3.3-70b-instruct Date: 2026-04-18T14:37:48.570Z
CRAWL REPORT — [DATE]
DOCUMENTS TRAITÉS
- EFTA00032765.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 120 caractères
-
Résumé : Contenu non exploitable, texte peu clair.
-
EFTA00032766.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 150 caractères
-
Résumé : Informations non lisibles, nécessite une analyse plus approfondie.
-
EFTA00032771.pdf :
- Dataset : 8
- Type : flight_log
- Pages : 1
- Qualité texte : BONNE
- Taille texte : 200 caractères
-
Résumé : Vol de West Palm Beach à Teterboro, passagers inconnus.
-
EFTA00032772.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 100 caractères
-
Résumé : Texte non exploitable, nécessite une analyse plus approfondie.
-
EFTA00032773.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 80 caractères
- Résumé : Contenu non lisible, nécessite une analyse plus approfondie.
COUVERTURE
- Total traités : 30 / ~14 600
- Ce cycle : 30 documents
- Prochaine priorité : DataSet 8
ERREURS
- EFTA00032765.pdf : Échec de l'extraction de texte, nécessite une analyse manuelle.
- EFTA00032772.pdf : Échec de l'extraction de texte, nécessite une analyse manuelle.
[ALERTE] : Certains documents présentent des contenus sensibles ou non exploitables, nécessitant une analyse plus approfondie pour déterminer leur pertinence et leur utilité pour la mission. Il est recommandé de procéder à une révision manuelle de ces documents pour évaluer leur contenu et déterminer les mesures à prendre.
EpsteinFiles & Co — Doc Crawler