Optimización del modelamiento de la Función de Transferencia Relativa a la Cabeza desde el esquema de representación en Armónicos Esféricos.
Date
2021-03-13Authors
Mora Parga, Christian RafaelDirectors
Florez Lozano, Johana MaríaEvaluators
Vizcaya Guarín, Pedro RaúlPublisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Program
Maestría en Ingeniería Electrónica
Obtained title
Magíster en Ingeniería Electrónica
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
English Title
Optimization of the modeling of the Head Related Transfer Function from the representation scheme in Spherical Harmonics.Resumen
El presente trabajo de investigación aborda la exploración sobre la capacidad de la interpolación como método para reducir la cantidad de datos medidos para una HRTF, esto con el fin de optimizar la metodología ardua del escenario empírico de medición en el laboratorio. Se hizo uso de la base de datos de CIPIC, que son Respuestas al Impulso muestreadas sobre una rejilla equiangular de 1250 coordenadas y medidas sobre un sujeto de prueba con un par de micrófonos en cada oreja. Asimismo, se implementó una rejilla sintética uniformemente muestreada en la esfera elaborada a partir del algoritmo de clasificación no supervisado de K-Medias. Se evaluó la interpolación utilizando los signos binaurales de ITD e ILD, y se evaluó especialmente cada etapa del sistema en términos de los coeficientes de correlación de Pearson, comparando los datos originales con una emulación de estos mismos a partir de interpolación. La transformación en armónicos esféricos toma lugar al final del procesamiento del modelo del sistema presentado aquí; esta también fue evaluada como método de representación de las HRTF en términos de correlación de Pearson, energía espectral y de signos binaurales, esto gracias a que es un método que se ha ido popularizando durante la última década para el procesamiento de las HRTF y que parece tomarse en cuenta y como canon en la comunidad. Se concluyó que la interpolación para sintetizar sobremuestreando es un método efectivo sobre la esfera, sin embargo, está fuertemente supeditado al tipo de rejilla donde se haya medido y a donde se desee llevar, por eso se evaluaron y compararon los efectos de la interpolación sobre la rejilla uniforme contra la rejilla equiangular. Se llegó a la conclusión de que una representación abierta de la esfera es deficiente a la hora de hacerse una representación en armónicos esféricos, por lo que el nivel de representabilidad interaural sintética se compromete. Lo anterior se comprobó utilizando los datos de la Technical University Berlin a parte de los de CIPIC. Este trabajo pretende aportar al conocimiento del campo del DSP (Procesamiento digital de señales) sobre aplicaciones en realidad aumentada y al énfasis de investigación de Procesamiento de Señales e IA de la PUJ, observando los efectos de la interpolación y la transformación en SH para la representación truncada de la HRTF, principalmente utilizando el grado de corrupción o semejanza en términos de los coeficientes de correlación entre las señales generadas por varios métodos de interpolación, representación en dos distintas rejillas de muestreo esféricas y la transformación en SH de los datos originales.
Abstract
The present research work addresses the exploration of the capacity of interpolation as a method to reduce the amount of data measured for a HRTF, this in order to optimize the arduous methodology of the empirical measurement scenario in the laboratory. CIPIC's database was use for this, which are Impulse Responses sampled on an equiangular grid of 1250 coordinates and measured on a test subject with a pair of microphones in each ear. Likewise, a uniformly sampled synthetic grid was implemented in the sphere elaborated from the unsupervised classification algorithm of K-Means. Interpolation was evaluated using the ITD and ILD binaural signs, and each stage of the system was specially evaluated in terms of Pearson's coefficients of correlation, comparing the original data with an emulation of the same from the interpolation. The transformation into spherical harmonics takes place at the end of the processing of the system model presented here; this was also evaluated as a method of representing the HRTF in terms of Pearson conduction, spectral energy and binaural signs, thanks to the fact that it is a method that has become popular over the last decade for the processing of the HRTF and that seems take a form of canon in the community. It was concluded that interpolation to synthesize oversampling is an effective method on the sphere, however it is surely subject to the type of grid where it has been measured and where it is desired to take it, for this reason the effects of interpolation on the uniform grid were evaluated and compared against the equiangular grid. It was concluded that an open representation of the sphere is deficient when making a representation in spherical harmonics, therefore the level of synthetic interaural representability is compromised. This was verified using data from the Technical University Berlin in addition to those from CIPIC. This work aims to contribute to the knowledge of the field of DSP (Digital Signal Processing) on augmented reality applications and to the PUJ's research emphasis on Signal Processing and AI, observing the effects of interpolation and transformation in SH domain for the truncated representation of the HRTF, mainly using the degree of corruption or similarity in terms of the correlation coefficients between the signals generated by various interpolation methods, representation on two different spherical evidence gratings, and transformation into SH from the original data.
Keywords
Función de Transferencia Relativa a la CabezaInterpolación
Armónicos Esféricos
HRTF
HRIR
ITD
ILD
Themes
Maestría en ingeniería electrónica - Tesis y disertaciones académicasProcesamiento de señales
Algoritmos (Computadores)
Interpolación
Google Analytics Statistics