Scalable and efficient video coding using 3D modeling

Raphaèle Balter; Patrick Gioia; Luce Morin

doi:10.1109/TMM.2006.879873

Article Dans Une Revue IEEE Transactions on Multimedia Année : 2006

Scalable and efficient video coding using 3D modeling

(1, 2) , (2) , (1)

1
2

Raphaèle Balter

Fonction : Auteur

Digital image processing, modeling and communication

France Télécom Recherche & Développement

Patrick Gioia

Fonction : Auteur
PersonId : 755558
ORCID : 0000-0001-5963-6706

France Télécom Recherche & Développement

Luce Morin

Fonction : Auteur
PersonId : 18813
IdHAL : luce-morin
ORCID : 0000-0001-8241-1425
IdRef : 059851171

Digital image processing, modeling and communication

Résumé

In this document we present a 3D model-based video coding scheme for streaming static scene video in a compact way but also enabling time and spatial scalability according to network or terminal capability and providing 3D functionalities. The proposed format is based on encoding the sequence of reconstructed models using second generation wavelets, and efficiently multiplexing the resulting geometric, topological, texture and camera motion binary representations. The wavelets decomposition can be adaptive in order to fit to images and scene contents. To ensure time scalability, this representation is based on a common connectivity for all 3D models, which also allows straightforward morphing between successive models ensuring visual continuity at no additional cost. The method proves to be better than previous methods for video encoding of static scenes, even better than state-of-the-art video coders such as H264 (also known as MPEG AVC). Another application of our approach is the fast transmission and real-time visualization of virtual environments obtained by video capture, for virtual or augmented reality, free walk-through in photo-realistic 3D environments, and numerous other image-base applications. / Nous présentons dans ce document un schéma de codage vidéo basé sur des modèles 3D qui permet de compresser efficacement des vidéos de scènes statiques tout en garantissant une scalabilité temporelle et spatiale afin de s'adapter aux capacités du réseau et des terminaux. Le passage par des modèles 3D permettent d'ajouter des fonctionnalités à la vidéo. Le format proposé se base sur l'encodage d'une séquence de modèles 3D extraits à partir de la vidéo en utilisant des ondelettes de seconde génération, et en multiplexant efficacement les représentations binaires résultaants pour la géométrie, la connectivité, la texture et les positions de caméra. La décomposition par ondelettes peut être aadptative afin de s'adapter au contenu des images et de la scène. Afin d'assurer la scalabilité temporelle, cette représentation et basée sur une connectivité commune pour tous les modèles qui permet de plus uu morphing implicite entre les modèles successifs assurant une continuité visuelle. La méthode a permis d'obtenir de meilleurs résultats pour le codage de vidéos de scènes statiques que le codeur vidéo référence de l'état de l'art H264 (également connu sous le nom de MPEG/AVC). Une autre application de notre approche est la transmission rapide et la visualisation temps réel d'environnements virtuels obtenus partir de vidéos pour les réalités augmentée et virtuelle, la navigation photoréalistique dans des environnements 3D et de nombreuses autres applications basées sur les images.

Mots clés

3D Model-based Coding Second Generation Wavelets Ondelettes de Seconde Génération Wavelets Reconstruction 3D 3D Reconstruction Codage basé Modèles 3D

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV] Synthèse d'image et réalité virtuelle [cs.GR]

Fichier principal

BalterGioiaMorin.pdf (1.89 Mo)

Anne Jaigu : Connectez-vous pour contacter le contributeur

https://inria.hal.science/inria-00000062

Soumis le : jeudi 26 mai 2005-09:49:25

Dernière modification le : vendredi 24 mars 2023-14:52:47

Archivage à long terme le : jeudi 1 avril 2010-21:32:30

Dates et versions

inria-00000062 , version 1 (26-05-2005)

Identifiants

HAL Id : inria-00000062 , version 1
DOI : 10.1109/TMM.2006.879873

Citer

Raphaèle Balter, Patrick Gioia, Luce Morin. Scalable and efficient video coding using 3D modeling. IEEE Transactions on Multimedia, 2006, 8 (6), pp.1147-1155. ⟨10.1109/TMM.2006.879873⟩. ⟨inria-00000062⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA IRISA-D5 INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

94 Consultations

247 Téléchargements

Scalable and efficient video coding using 3D modeling

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager