Progressive Perceptual Audio Rendering of Complex Scenes - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Communication Dans Un Congrès Année : 2007

Progressive Perceptual Audio Rendering of Complex Scenes

Résumé

Despite recent advances, including sound source clustering and perceptual auditory masking, high quality rendering of complex virtual scenes with thousands of sound sources remains a challenge. Two major bottlenecks appear as the scene complexity increases: the cost of clustering itself, and the cost of pre-mixing source signals within each cluster. In this paper, we first propose an improved hierarchical clustering algorithm that remains efficient for large numbers of sources and clusters while providing progressive refinement capabilities. We then present a lossy pre-mixing method based on a progressive representation of the input audio signals and the perceptual importance of each sound source. Our quality evaluation user tests indicate that the recently introduced audio saliency map is inappropriate for this task. Consequently we propose a "pinnacle", loudness-based metric, which gives the best results for a variety of target computing budgets. We also performed a perceptual pilot study which indicates that in audio-visual environments, it is better to allocate more clusters to visible sound sources. We propose a new clustering metric using this result. As a result of these three solutions, our system can provide high quality rendering of thousands of 3D-sound sources on a "gamer-style" PC.
Fichier principal
Vignette du fichier
MBTDVA07.pdf (5.68 Mo) Télécharger le fichier
Vignette du fichier
streettest_1.jpg (335.36 Ko) Télécharger le fichier
MBTDVA07.avi (40.51 Mo) Télécharger le fichier
Vignette du fichier
streettest_2.jpg (307.39 Ko) Télécharger le fichier
Vignette du fichier
streettest_newmetric.jpg (287.23 Ko) Télécharger le fichier
Vignette du fichier
streettest_oldmetric.jpg (287.34 Ko) Télécharger le fichier
Vignette du fichier
teaser_highway.jpg (358.54 Ko) Télécharger le fichier
Vignette du fichier
teaser_street.jpg (459.94 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Figure, Image
Format : Autre
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Format : Figure, Image
Loading...

Dates et versions

inria-00606801 , version 1 (19-07-2011)

Identifiants

Citer

Thomas Moeck, Nicolas Bonneel, Nicolas Tsingos, George Drettakis, Isabelle Viaud-Delmon, et al.. Progressive Perceptual Audio Rendering of Complex Scenes. Symposium on Interactive 3D graphics and games (I3D 2007), ACM SIGGRAPH, Apr 2007, Seattle, United States. pp.189-196, ⟨10.1145/1230100.1230133⟩. ⟨inria-00606801⟩
342 Consultations
447 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More