Identificación del hablante empleando cepstro y curva melódica
Ver / Descargar
Fecha
2015Autor(es)
García Gómez, Carlos ArturoDirector(es)
Vizcaya Guarín, Pedro RaúlPublicador
Pontificia Universidad Javeriana
Facultad
Facultad de Ingeniería
Programa
Maestría en Ingeniería Electrónica
Título obtenido
Magíster en Ingeniería Electrónica
Tipo
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaCompartir este registro
Citación
Documentos PDF
Resumen
En literatura, se define la curva melódica como el resultado acústico de los cambios en la frecuencia de vibración de las cuerdas vocales, es decir, la variación de la frecuencia del fundamental (fO) en el tiempo. Para el desarrollo de este trabajo, partiremos de la premisa o hipótesis que todas las personas no tienen la misma curva melódica, es decir, tanto la variación como la frecuencia fundamental fO es diferente en cada hablante, por tanto nos valdremos de la extracción de esta característica para adicionarla al sistema de identificación del hablante y de esta manera mejorar la tasa de error. El presente trabajo consiste en Diseñar, implementar y evaluar un sistema de identificación automática del hablante (ASI), empleando para ello la combinación de las características de la curva melódica y del cepstro en escala mel .
Abstract
"In literature, the pitch contour is defined as the acoustic result of changes in the vibration ffequency of the vocal cords, that is, the variation of the fundamental frequency (fo) at the time. To develop this work, we start from the premise or assumption that all people have the same pitch contour curve, that is, both the fundamental frequency (fo) as the change of fo is different for each speaker, so we will use the extraction of this feature to append those to the speaker identification system and thus improve the error rate. This job is to design, implement and evalúate an automatic speaker identification (ASI), employing the combination of the characteristics of ""the pitch curve"" and ""cepstrum in mel scale."" "
Palabras clave
Curva melódicaIdentificación del habla
Verificación del habla
Mezcla de gaussianas
Cepstro
Estadísticas Google Analytics