Analyse de document : de l'image à la représentation par les normes de codage - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 1997

Analyse de document : de l'image à la représentation par les normes de codage

Abdel Belaïd
  • Fonction : Auteur
  • PersonId : 830137

Résumé

The aim of this paper is to give a short view on automatic document analysis and recognition area. It will describe the methodology used in this area by defining the main important steps of analysis and recognition. Concerned essentially with structured document, the paper focusses on the definition of generic structure models in relation with standards used in electronic publishing. We will show how such models can represent the semantic of documents and allow elaborated treatments on them. Two analysis schemes are proposed: perceptual and conceptual. An example will illustrate every point of view: macro-structure extraction of scientific papers and conversion of notices catalogues
Le but de cet article est d'apporter un éclairage rapide sur le domaine de la reconnaissance automatique de documents. Il s'attachera à préciser les objectifs de base et à décrire les principales étapes d'analyse et de reconnaissance. S'agissant essentiellement de documents structurés, une attention particulière sera réservée à la définition de modèles de structures génériques en rapport avec les normes d'échange. Nous verrons comment ces modèles peuvent représenter la sémantique des documents et autoriser sur eux des traitements très élaborés. Deux schémas de modélisation et d'analyse sont proposés correspondant à deux vues différentes des documents : perceptuelle et conceptuelle. Un exemple d'application sera donné pour illustrer chaque point de vue : Segmentation d'articles scientifiques et catalogage de notices bibliographiques.
Fichier non déposé

Dates et versions

inria-00537330 , version 1 (18-11-2010)

Identifiants

  • HAL Id : inria-00537330 , version 1

Citer

Abdel Belaïd. Analyse de document : de l'image à la représentation par les normes de codage. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 1997, 1 (1), pp.21-37. ⟨inria-00537330⟩
82 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More