Extraction de formules chimiques dans des documents manuscrits composites - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Extraction de formules chimiques dans des documents manuscrits composites

Résumé

Nous abordons dans ces travaux, le problème de la segmentation de documents de cahiers de la chimie en zones homogènes. Les documents à traiter sont manuscrits sans contraintes composés de zones de textes, de tableaux et de graphiques, représentant l'expression graphique de l'expérience réalisée. L'objectif de ce premier travail est d'extraire, dans chaque document, le bloc contenant le schéma graphique. Nous proposons une méthode d'extraction et de classification des structures élémentaires du document sur lesquels s'appuiera une technique de séparation verticale des blocs. Des descripteurs spécifiques tenant compte de la texture du texte et du graphique sont pris en compte. Des connaissances a priori sur la structure du document sont ensuite utilisées pour délimiter le bloc graphique. Les résultats expérimentaux obtenus sur une variété de documents de chimie sont de l'ordre de 92% de bonne extraction de graphique
Fichier principal
Vignette du fichier
CIFED2014_version_editeur.pdf (1.18 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01070831 , version 1 (02-10-2014)

Identifiants

  • HAL Id : hal-01070831 , version 1

Citer

Nabil Ghanmi, Belaïd Abdel. Extraction de formules chimiques dans des documents manuscrits composites. Colloque International Francophone sur l'Écrit et le Document, Mar 2014, Nancy, France. pp.185-197. ⟨hal-01070831⟩
177 Consultations
138 Téléchargements

Partager

Gmail Facebook X LinkedIn More