¿Cuál es la aplicación de los valores propios en estadística?

Las técnicas de transformación lineal (como la descomposición del valor singular) le permiten rotar conjuntos de datos apropiados que contienen variables correlacionadas (aquellas que exhiben covarianza estadística) a un nuevo conjunto de variables donde los términos de covarianza son cero, y la diagonal de la matriz de covarianza contiene lo que ahora puede se denominarán valores propios iguales a la varianza estadística de las nuevas variables.

Estas nuevas variables son independientes entre sí, lo que facilita hacer (por ejemplo) una simulación de Monte Carlo; Muestree independientemente cada nueva variable y gire el resultado de nuevo a la base original, lo que le proporciona una estimación aleatoria completa con las covarianzas originales observadas en los datos.

Tenga en cuenta mi uso del término conjunto de datos “apropiado”; Estas son transformaciones lineales que pueden modelar o no sus datos originales de manera satisfactoria (dadas varias relaciones no lineales que también pueden estar presentes en sus datos y que ignora bajo su propio riesgo)

Si calcula los vectores propios de una matriz de covarianza, el primer vector propio es el eje de mayor varianza en los datos. El siguiente vector propio es el eje de la siguiente mayor varianza, y así sucesivamente. Hay más discusión en el análisis de componentes principales.

Las técnicas de reducción de dimensionalidad, como PCA y LE, se basan en estos. Ver https://www.slideshare.net/Colle … para una revisión.

Reducción de dimensionalidad, ingeniería de características