Codage et classification non supervisée d'un corpus maya : extraire des contextes pour situer l'inconnu par rapport au connu - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Codage et classification non supervisée d'un corpus maya : extraire des contextes pour situer l'inconnu par rapport au connu

Résumé

L'écriture logosyllabique des anciens Mayas comprend plus de 500 signes et est en bonne partie déchiffrée, avec des degrés de certitude divers. Nous avons appliqué au codex de Dresde, l'un des trois seuls manuscrits qui nous soient parvenus, codé sous LATEX avec le système mayaTEX, notre méthode de représentation graduée, par apprentissage non supervisé hybride entre clustering et analyse factorielle oblique, sous la métrique de Hellinger, afin d'obtenir une image nuancée des thèmes traités : les individus statistiques sont les 212 segments de folio du codex, et leurs attributs sont les 1687 bigrammes de signes extraits. Pour comparaison, nous avons introduit dans cette approche endogène un élément exogène, la décomposition en éléments des signes composites, pour préciser plus finement les contenus. La rétro-visualisation dans le texte original des résultats et expressions dégagées éclaire la signification de certains glyphes peu compris, en les situant dans des contextes clairement interprétables.
Fichier principal
Vignette du fichier
EGC2010paper_76.pdf (190.76 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00435233 , version 1 (23-11-2011)
hal-00435233 , version 2 (23-11-2011)

Identifiants

  • HAL Id : hal-00435233 , version 2

Citer

Mohamed Hallab, Bruno Delprat, Alain Lelu. Codage et classification non supervisée d'un corpus maya : extraire des contextes pour situer l'inconnu par rapport au connu. Extraction et Gestion de Connaissances - EGC 2010, Jan 2010, Sousse, Tunisie. pp.573-584. ⟨hal-00435233v2⟩
332 Consultations
451 Téléchargements

Partager

Gmail Facebook X LinkedIn More