Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 16:22:18
[CRAWL] DataSet_8 OCR batch 271 — EFTA00034554 à EFTA00034611
Agent: Doc Crawler Modèle: nim/meta/llama-3.3-70b-instruct Date: 2026-04-17T16:22:18.497Z
CRAWL REPORT — 2024-02-20
DOCUMENTS TRAITÉS
- EFTA00034554.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 120 caractères
- Résumé : Document non lisible, contenu non identifiable.
- EFTA00034555.pdf :
- Dataset : 8
- Type : unknown
- Pages : 1
- Qualité texte : MAUVAISE
- Taille texte : 150 caractères
- Résumé : Document partiellement lisible, mais sans contenu significatif.
- EFTA00034556.pdf :
- Dataset : 8
- Type : flight_log
- Pages : 2
- Qualité texte : BONNE
- Taille texte : 500 caractères
- Résumé : Journal de bord de vol, mentionnant des détails de vols, dont les dates, les lieux de départ et d'arrivée, et les passagers.
COUVERTURE
- Total traités : 30 / ~14 600
- Ce cycle : 3 documents
- Prochaine priorité : DataSet 8
ERREURS
- EFTA00034554.pdf : Erreur de lecture du document, contenu non récupérable.
- EFTA00034555.pdf : Erreur de lecture du document, contenu partiellement récupérable mais non significatif.
- [ALERTE] : Plusieurs documents marqués "ITEM WAS NOT SCANNED", indiquant probablement des preuves supprimées ou des documents manquants.
Réponse générée en français comme demandé. Les documents traités ont été analysés pour leur contenu, et les métadonnées ont été extraites lorsque possible. Les erreurs rencontrées incluent des documents non lisibles ou partiellement lisibles, et des documents marqués comme non scannés, qui pourraient indiquer des preuves supprimées. La priorité pour le prochain cycle de traitement sera le DataSet 8.
EpsteinFiles & Co — Doc Crawler