Intuitivamente? En el contexto de PCA, piense que una matriz M x N representa M puntos en el espacio N-dimensional (uno por fila). Por ejemplo, el diagrama de dispersión en la entrada de Wikipedia para el análisis de componentes principales muestra muchos puntos (M grande) en el espacio 2D (N = 2):
Las coordenadas (x, y) de estos puntos expresan los puntos como combinaciones lineales de los vectores base (1,0) y (0,1): x * (1,0) + y * (0,1 ) Pero podría representar los puntos como una combinación lineal de dos vectores 2D (linealmente independientes).
Es mejor si los vectores base que elegimos son ortogonales (ángulo de 90 grados).
Y, en la imagen de arriba, creo que puedes ver claramente que la distribución de los datos tiene este eje largo natural. Esa parece ser una buena opción para uno de los vectores de base, ya que la mayor parte de la variación está en este eje y de alguna manera es la dimensión que ‘explica’ más sobre los datos, por sí misma, que cualquier otro eje.
Ese es el primer componente principal. Elimina la varianza completamente explicada por este eje y repite para encontrar el siguiente vector base más importante que es ortogonal al primero. Y así.
- ¿Cuál es el registro de calcular un SVD de una matriz dispersa grande?
- ¿Cómo calculo la matriz de proyección que endereza un plátano?
- ¿Cuál es una explicación intuitiva para el significado de los vectores propios y los valores propios del laplaciano de un gráfico?
- Suponga que [math] \ mathbb {M} (n, R) [/ math] representa una clase de matrices cuadradas. Entonces el subconjunto S de [math] \ mathbb {M} (n, R) [/ math] tal que el valor absoluto de los valores propios de las matrices es menor o igual a 2. ¿S forma un espacio conectado?
- ¿Qué es un “isomorfismo canónico”?
Por lo tanto, los componentes principales son nuevos vectores base. PCA le permite descubrir la transformación del espacio original al nuevo espacio también. La transformación es ortogonal, por eso conserva la distancia / ángulo, por lo que puede pensar en ella como una rotación. Si eso es lo que quiere decir con ‘simetría’, entonces esa es la razón por la cual PCA le da ‘simetría’.