Supongamos que modela el habla con una mezcla gaussiana. Para cuantificar a cada persona en particular, adapte los parámetros del modelo de mezcla gaussiana para que se ajuste a esta persona, desplazando efectivamente los medios a alguna dirección. La dirección de adaptación es un vector valorado real que caracteriza a la persona. Esto se llama supervector. Supervector tiene buenas propiedades, por ejemplo, puede comparar supervectores con la distancia del coseno para identificar a la persona o reconocerla.
Desafortunadamente, el supervector sí incluye otra información como la información del canal, por lo que la extensión de los supervectores sería factorizar la información del canal. Luego obtienes i-vector, que es una representación más corta de un supervector.
Para más detalles ver:
Representación de voz de baja dimensión basada en Factor Analysis y sus aplicaciones Najim Dehak y Stephen Shum http://people.csail.mit.edu/sshu…
- ¿Qué da exactamente el producto de puntos y qué da el producto cruzado? ¿La respuesta del producto escalar se limita a dos dimensiones, o puede dar la magnitud de un vector que está en la tercera dimensión sin dar su dirección?
- ¿Por qué la magnitud de un vector nulo es cero?
- ¿Qué es un vector?
- ¿Cuáles son las fórmulas básicas en vectores y geometría?
- ¿Es el desplazamiento angular grande escalar o vectorial?