Extraction des lignes de manuscrit arabes anciens mutli-orientées - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Document Associé À Des Manifestations Scientifiques Année : 2009

Extraction des lignes de manuscrit arabes anciens mutli-orientées

Nazih Ouwayed
  • Fonction : Auteur
  • PersonId : 871683

Résumé

Dans ce travail, nous présentons une nouvelle approche pour l'extraction de lignes des documents Arabes anciens multi-orientés. En raison de la multi-orientation de lignes et de leur dispersion dans l'image, nous utilisons un maillage automatique de l'image qui nous permet de déterminer progressivement et localement les lignes. Le maillage est initialisé avec une petite fenêtre où sa taille est corrigée par extension jusqu'à ce que suffisamment de lignes et de composantes connexes ont été trouvées. Nous utilisons le Snake pour l'extraction de lignes. Une fois le document est divisé en fenêtres, l'orientation est déterminée en utilisant la distribution de Wigner Ville (DWV) sur l'histogramme de projection. Ensuite, cette orientation locale est élargie pour limiter l'orientation dans les fenêtres voisines. Ensuite, les lignes de texte sont extraites localement dans chaque zone en se basant sur le suivi des lignes de base et la proximité des composantes connexes. Enfin, les composantes connexes qui se chevauchent et se connectent dans les lignes adjacentes sont séparées en considérant la morphologie des lettres terminales des mots Arabes. L'approche proposée a été expérimentée sur 100 documents atteignant une précision d'environ 97.6%.
Fichier principal
Vignette du fichier
ouwayed2009.pdf (3.96 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

inria-00507778 , version 1 (31-07-2010)

Identifiants

  • HAL Id : inria-00507778 , version 1

Citer

Nazih Ouwayed. Extraction des lignes de manuscrit arabes anciens mutli-orientées. Journée thématique du GRCE et du GDR - I3 2009, Jun 2009, Paris, France. 2009. ⟨inria-00507778⟩
55 Consultations
39 Téléchargements

Partager

Gmail Facebook X LinkedIn More