La fase en los modelos armónicos de la señal de voz: estrategias de representación, tratamiento y aplicaciones

2012 
En esta tesis hemos desarrollado, en el marco de los modelos armonicos de la voz, una nueva representacion de la informacion de fase denominada RPS (Relative Phase Shift). Esta transformacion permite obtener una magnitud directamente relacionada con la forma de onda de la senal, independiente del instante de analisis y, sobre todo, muestra de forma evidente la estructura de fases de la senal.Una vez desarrollada la representacion RPS, se estudian las caracteristicas de la misma, la influencia de la senal de excitacion y del tracto vocal sobre los RPSs, y su relacion con la polaridad de la senal. La polaridad influye notablemente sobre los RPSs y esta propiedad se utiliza con exito para implementar un algoritmo de deteccion de polaridad.Una parte de la tesis se dedica a buscar un modelado adecuado de la estructura de fase que muestran los RPSs. Asi se define primero una parametrizacion de los RPSs apropiada para su modelado estadistico, lo que nos permite usar los RPSs en aplicaciones de reconocimiento de habla y de locutor. Ademas, utilizamos los RPSs para afrontar el problema de los impostores sinteticos: senales de voz generadas por sintesis imitando la voz de un locutor con el fin de burlar a un sistema de verificacion.Finalmente, estudiamos la importancia perceptual de las fases, para responder a la pregunta de si merece la pena incluir la fase, en forma de RPSs, en los sistemas de sintesis de voz. Asi, evaluamos perceptualmente las distorsiones de diferentes senales resintetizadas con fase modificada aprovechando las posibilidades de manipulacion de las RPSs. Con todo esto, la tesis pone de manifiesto la utilidad de esta nueva representacion de las fases para su aplicacion en diferentes ambitos del procesado de la voz.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []