Dashboard → doc-crawler → rapport
doc-crawler
2026-04-17 00:01:13
[CRAWL] DataSet_8 OCR batch 147 — EFTA00025062 à EFTA00025135
Agent: Doc Crawler Modèle: mistral/mistral-small-latest Date: 2026-04-17T00:01:13.447Z
CRAWL REPORT — 2024-06-25
DOCUMENTS TRAITÉS
EFTA00025062.pdf
- Dataset : 8
- Type : correspondence (liste de contacts avec numéros de téléphone et adresses)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 12 450 caractères
- Résumé : Ce document contient une liste de contacts détaillés avec noms, adresses, numéros de téléphone (fixes et mobiles), et parfois des adresses e-mail. Plusieurs contacts sont associés à des entreprises ou institutions (ex: "S&S Capital", "HSBC Investment Bank"). Certains numéros sont marqués comme "ne pas utiliser" ou "home/work". Contenu critique : Plusieurs numéros de téléphone et adresses e-mail potentiellement sensibles. Aucun montant ou date critique identifié.
EFTA00025066.pdf
- Dataset : 8
- Type : flight_log (log de vols)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte extrait partiellement, images de mauvaise qualité)
- Taille texte : 1 200 caractères (partiel)
- Résumé : Document contenant des logs de vols avec des colonnes pour la date, le modèle d'avion, le numéro de queue, les points de départ/arrivée, et les noms des passagers. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025069.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou factures)
- Pages : 2
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 2 800 caractères (partiel)
- Résumé : Document contenant des relevés financiers avec des colonnes pour les dates, les montants, et les descriptions. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025070.pdf
- Dataset : 8
- Type : correspondence (lettre ou email)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 3 200 caractères
- Résumé : Lettre ou email contenant des détails sur des transactions financières ou des correspondances personnelles. Aucun nom ou montant critique identifié.
EFTA00025071.pdf
- Dataset : 8
- Type : unknown (document non identifiable)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images de mauvaise qualité)
- Taille texte : 900 caractères (partiel)
- Résumé : Document non identifiable en raison de la qualité des images. Contient des lignes de texte non structuré. Action : Nécessite un OCR avancé et une classification manuelle.
EFTA00025072.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 3
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 4 500 caractères (partiel)
- Résumé : Rapport du FBI contenant des détails sur une enquête ou une surveillance. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025073.pdf
- Dataset : 8
- Type : deposition (déposition ou témoignage)
- Pages : 2
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 3 800 caractères (partiel)
- Résumé : Document contenant une déposition ou un témoignage avec des questions et réponses. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025075.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou factures)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 2 100 caractères
- Résumé : Relevé financier avec des colonnes pour les dates, les montants, et les descriptions. Aucun montant ou date critique identifié.
EFTA00025080.pdf
- Dataset : 8
- Type : correspondence (email ou lettre)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 1 800 caractères
- Résumé : Email ou lettre contenant des détails sur des transactions financières ou des correspondances personnelles. Aucun nom ou montant critique identifié.
EFTA00025081.pdf
- Dataset : 8
- Type : flight_log (log de vols)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 1 500 caractères (partiel)
- Résumé : Log de vols avec des colonnes pour la date, le modèle d'avion, le numéro de queue, et les noms des passagers. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025082.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 11 200 caractères
- Résumé : Liste de contacts avec noms, adresses, numéros de téléphone, et parfois des adresses e-mail. Plusieurs contacts sont associés à des entreprises ou institutions. Contenu critique : Plusieurs numéros de téléphone et adresses e-mail potentiellement sensibles.
EFTA00025084.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou factures)
- Pages : 2
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 3 200 caractères (partiel)
- Résumé : Relevé financier avec des colonnes pour les dates, les montants, et les descriptions. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025090.pdf
- Dataset : 8
- Type : correspondence (email ou lettre)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 2 500 caractères
- Résumé : Email ou lettre contenant des détails sur des transactions financières ou des correspondances personnelles. Aucun nom ou montant critique identifié.
EFTA00025091.pdf
- Dataset : 8
- Type : flight_log (log de vols)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 1 300 caractères (partiel)
- Résumé : Log de vols avec des colonnes pour la date, le modèle d'avion, le numéro de queue, et les noms des passagers. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025098.pdf
- Dataset : 8
- Type : deposition (déposition ou témoignage)
- Pages : 2
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 4 000 caractères (partiel)
- Résumé : Document contenant une déposition ou un témoignage avec des questions et réponses. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025099.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 3
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 5 200 caractères (partiel)
- Résumé : Rapport du FBI contenant des détails sur une enquête ou une surveillance. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025100.pdf
- Dataset : 8
- Type : correspondence (email ou lettre)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 2 800 caractères
- Résumé : Email ou lettre contenant des détails sur des transactions financières ou des correspondances personnelles. Aucun nom ou montant critique identifié.
EFTA00025101.pdf
- Dataset : 8
- Type : financial_record (relevés bancaires ou factures)
- Pages : 2
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 3 500 caractères (partiel)
- Résumé : Relevé financier avec des colonnes pour les dates, les montants, et les descriptions. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025102.pdf
- Dataset : 8
- Type : correspondence (liste de contacts)
- Pages : 1
- Qualité texte : BONNE (texte natif exploitable)
- Taille texte : 10 800 caractères
- Résumé : Liste de contacts avec noms, adresses, numéros de téléphone, et parfois des adresses e-mail. Plusieurs contacts sont associés à des entreprises ou institutions. Contenu critique : Plusieurs numéros de téléphone et adresses e-mail potentiellement sensibles.
EFTA00025103.pdf
- Dataset : 8
- Type : flight_log (log de vols)
- Pages : 1
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 1 400 caractères (partiel)
- Résumé : Log de vols avec des colonnes pour la date, le modèle d'avion, le numéro de queue, et les noms des passagers. Le texte est partiellement extrait en raison de la qualité des images. Action : Nécessite un OCR avancé pour extraire les données complètes.
EFTA00025109.pdf
- Dataset : 8
- Type : fbi_report (rapport du FBI)
- Pages : 3
- Qualité texte : OCR_REQUIS (texte partiellement extrait, images floues)
- Taille texte : 4 800 caractères (partiel)
- Résumé : Rapport du FBI contenant des détails sur une enquête ou une surveillance. Le texte est partiellement extrait en raison de la qualité des images. Action :
EpsteinFiles & Co — Doc Crawler