¿Qué son los súper vectores (y los súper vectores gaussianos) en el contexto del reconocimiento del hablante? Educación te da un futuro mejor

¿Qué son los súper vectores (y los súper vectores gaussianos) en el contexto del reconocimiento del hablante?

Supongamos que modela el habla con una mezcla gaussiana. Para cuantificar a cada persona en particular, adapte los parámetros del modelo de mezcla gaussiana para que se ajuste a esta persona, desplazando efectivamente los medios a alguna dirección. La dirección de adaptación es un vector valorado real que caracteriza a la persona. Esto se llama supervector. Supervector tiene buenas propiedades, por ejemplo, puede comparar supervectores con la distancia del coseno para identificar a la persona o reconocerla.

Desafortunadamente, el supervector sí incluye otra información como la información del canal, por lo que la extensión de los supervectores sería factorizar la información del canal. Luego obtienes i-vector, que es una representación más corta de un supervector.

Para más detalles ver:

Representación de voz de baja dimensión basada en Factor Analysis y sus aplicaciones Najim Dehak y Stephen Shum http://people.csail.mit.edu/sshu…