¿Qué son los súper vectores (y los súper vectores gaussianos) en el contexto del reconocimiento del hablante?

Supongamos que modela el habla con una mezcla gaussiana. Para cuantificar a cada persona en particular, adapte los parámetros del modelo de mezcla gaussiana para que se ajuste a esta persona, desplazando efectivamente los medios a alguna dirección. La dirección de adaptación es un vector valorado real que caracteriza a la persona. Esto se llama supervector. Supervector tiene buenas propiedades, por ejemplo, puede comparar supervectores con la distancia del coseno para identificar a la persona o reconocerla.

Desafortunadamente, el supervector sí incluye otra información como la información del canal, por lo que la extensión de los supervectores sería factorizar la información del canal. Luego obtienes i-vector, que es una representación más corta de un supervector.

Para más detalles ver:

Representación de voz de baja dimensión basada en Factor Analysis y sus aplicaciones Najim Dehak y Stephen Shum http://people.csail.mit.edu/sshu…