El análisis de componentes principales (PCA) reorienta los datos a lo largo de los vectores propios (flechas) de los datos y luego deja caer las dimensiones con los vectores propios más cortos. Si desea asignar datos 2D a 1D, suelte la dimensión con el vector propio más corto (dirección y en la imagen) y retenga solo el valor x reorientado de los datos. Puede hacer lo mismo para reducir los datos de 100 dimensiones a dos dimensiones.
PCA es entonces una representación distribuida, lo que significa que dos elementos distintos pueden tener el mismo valor en una dimensión, porque solo necesitan diferir en otra dimensión para ser distintos. También artículos similares están más juntos que artículos diferentes. Por ejemplo:
manzana pequeña = -0.2 -0.2 0.0 0.1
manzana grande = -0.1 -0.2 0.0 0.1
naranja = -0.1 0.5 0.0 0.3
fresa = -0.3 0.1 0.0 0.5
coche = 0.0 0.0 0.5 0.1
camión = 0.1 -0.1 0.5 0.2
Es una representación distribuida en 4 dimensiones. Reducir datos a 2D con PCA y luego trazar los datos para encontrar grupos es una técnica estándar y muestra que las representaciones distribuidas están funcionando.
- ¿Cuáles son las matrices con determinante 1?
- ¿Qué son las bases duales y los espacios duales?
- Cómo encontrar un valor propio y un vector propio usando C ++ o php
- ¿Cómo explicar intuitivamente las normas matriciales? Además, ¿cómo son útiles en la práctica?
- ¿Cuál es el significado intuitivo de rango de una matriz? ¿Cómo interpreto realmente cuál es el rango de una matriz?