Expectativa-maximización hace agrupación suave. Tome un punto [math] x [/ math] y considere los centros de clúster actuales [math] y_1, \ ldots, y_n [/ math]. Cluster [math] y_i [/ math] calcula [math] w_i \ sim \ exp (- (x-y_i) ^ T \ Sigma ^ {- 1} (x-y_i)) [/ math], donde [math] \ Sigma [/ math] es la matriz de covarianza, y la línea ondulada se refiere a mí ignorando constantes.
Con los términos [math] w_1, \ ldots, w_n [/ math], el grupo i obtiene peso [math] \ frac {w_i} {\ sum_j w_j} [/ math].
Ahora, imagine lo que sucede cuando [math] \ Sigma [/ math] es diagonal y sus entradas se vuelven pequeñas. Entonces [math] \ Sigma ^ {- 1} [/ math] se hace más grande, y así comienza la expresión [math] – (x-y_i) ^ T \ Sigma ^ {- 1} (x-y_i) [/ math] preocuparse mucho por el término [matemáticas] x- y_i [/ matemáticas]. En particular, la expresión es cuadrática en este término. Sea [math] y_i ^ * [/ math] el centro más cercano a x, lo que minimiza el término [math] || x-y_i || [/ matemáticas] sobre todo i. Entonces, como [math] \ Sigma \ rightarrow 0 [/ math], [math] w_ {i ^ *} [/ math] comienza a dominar el resto de [math] w_i [/ math], lo que significa que [math] \ frac {w_ {i ^ *}} {\ sum_j w_j} \ rightarrow 1 [/ math] y alguna otra [math] \ frac {w_i} {\ sum_j w_j} \ rightarrow 0. [/ math] Por lo tanto, los puntos se asignan básicamente peso completo al grupo más cercano, que es K-means.
- ¿Qué se entiende por matriz de covarianza y por qué la usamos?
- ¿Por qué el número de vectores de columna linealmente independientes de una matriz es igual al número de vectores de fila linealmente independientes?
- Deje que [math] V [/ math] sea un espacio vectorial sobre algún campo [math] F [/ math], y que [math] W \ subseteq V [/ math] no esté vacío y tenga la propiedad de que [math] x, y \ en W [/ matemática] implica [matemática] x – y \ en W [/ matemática]. ¿Qué otras condiciones en [matemáticas] V [/ matemáticas] son necesarias para que [matemáticas] W [/ matemáticas] sea un subespacio de [matemáticas] V [/ matemáticas]?
- ¿Por qué no puedes multiplicar una matriz de 2 × 2 con una matriz de 3 × 2?
- ¿Cuál es el propósito de la factorización matricial?