¿Cómo se usan los vectores propios y los valores propios en el procesamiento de imágenes?

Existen múltiples lugares donde los vectores propios y los valores propios son útiles, en el procesamiento de imágenes y la visión por computadora:

Como mencionó Sravan Kumar en su respuesta, puede usar PCA para hacer compresión de imágenes. PCA implica encontrar los vectores propios de la matriz de covarianza y proyectar los datos en los vectores propios con los valores propios más grandes (análisis de componentes principales). Básicamente, PCA proporciona una compresión óptima (en cierto sentido). Sin embargo, los estándares modernos de compresión de imágenes como JPEG realmente no usan PCA y en su lugar usan un tipo diferente de transformación (Transformación discreta del coseno).
Una de las primeras técnicas para el reconocimiento facial se basó en PCA (Eigenface). La idea era que si encuentra los componentes principales de las imágenes faciales y proyecta las imágenes faciales sobre estos componentes principales, entonces se eliminarán cosas como las expresiones faciales y el ruido aleatorio de píxeles y será más fácil identificar la cara. Sin embargo, esta técnica se desempeña bastante mal y ha sido reemplazada en gran medida por mejores técnicas.
Un proceso que está muy relacionado con PCA es el blanqueamiento (transformación de blanqueamiento). La idea detrás del blanqueamiento es la misma que la idea detrás de PCA: hay mucha correlación entre los píxeles de una imagen. En PCA desea explotar estas correlaciones; En el blanqueamiento, considera estas correlaciones como una molestia y desea eliminarlas. Casi todos los algoritmos que intentan aprender las características de los parches de imagen blanquean los parches de imagen de forma natural. Una forma de blanquear una imagen es multiplicar por [matemática] U ^ T (S + \ lambda I) ^ {- 0.5} U [/ matemática] donde [matemática] U [/ matemática] son los vectores propios de la matriz de covarianza, [ matemática] S [/ matemática] es una matriz diagonal que contiene los valores propios y [matemática] \ lambda I [/ matemática] es regularización para evitar que las cosas exploten.
Finalmente, los vectores propios y los valores propios se muestran con bastante frecuencia en la segmentación de imágenes. Una clase de técnicas para la segmentación de imágenes representa la imagen como un gráfico con los píxeles como nodos, y los vectores propios / valores propios de la matriz laplaciana del gráfico resultante pueden usarse para agrupar píxeles que pertenecen juntos. (Ver: cortes normalizados, una explicación aquí: Página en Sunysb.edu) (Más generalmente, ver Teoría de grafos espectrales).

He mantenido esto breve, en la medida de lo posible, por lo que puede parecer denso; En resumen, los vectores propios y los valores propios se muestran casi constantemente.

¿Cuál es el registro de calcular un SVD de una matriz dispersa grande?

¿Cómo calculo la matriz de proyección que endereza un plátano?

¿Cuál es una explicación intuitiva para el significado de los vectores propios y los valores propios del laplaciano de un gráfico?

Suponga que [math] \ mathbb {M} (n, R) [/ math] representa una clase de matrices cuadradas. Entonces el subconjunto S de [math] \ mathbb {M} (n, R) [/ math] tal que el valor absoluto de los valores propios de las matrices es menor o igual a 2. ¿S forma un espacio conectado?

¿Por qué necesitamos encontrar el inverso de una matriz?

¿Existen aplicaciones industriales o de ingeniería de la regularización de Tikhonov-Phillips?

Los valores propios juegan un papel importante en las aplicaciones de procesamiento de imágenes. Hay varios métodos disponibles para el procesamiento de imágenes. El procesamiento, como la medición de la nitidez de la imagen, se puede realizar utilizando el concepto de valores propios. En caso de segmentación del rostro humano con forma elíptica, el valor propio más grande y más pequeño de la matriz de covarianza representa la forma elíptica. Por supuesto, puedes entender cómo funcionará esto solo después de estudiar las matemáticas detrás de esto.

Una de las aplicaciones que es bastante fácil de entender es la compresión de imágenes (también llamada reducción de dimensiones). La compresión de imágenes ha sido el medio de reducir el tamaño de un archivo de gráficos para una mejor comodidad de almacenamiento. También es una forma útil de reducir el requisito de tiempo para enviar archivos grandes a través de la Web mediante un método de compresión de imágenes: análisis de componentes principales (PCA). Esta técnica utiliza la idea de que cualquier imagen se puede representar como una superposición de imágenes base ponderadas.

Toma esta imagen como ejemplo

Dividimos la imagen en bloques de 10 × 10 dimensiones y los concatenamos. Estos subbloques están dispuestos en una matriz n x p , donde n es el número de bloques y p el número de elementos en cada bloque. Aplicamos PCA en la matriz que devuelve un conjunto de valores propios, vectores propios y componentes principales.

Esto produce imágenes propias que serían elementos esenciales para la imagen comprimida.

Los valores propios indican cuán esencial es un conjunto particular de vectores propios para completar la imagen. En base a estos valores expresados en porcentajes, elegimos los vectores propios más importantes y reconstruimos la imagen a partir de estos, que es esencialmente el proceso inverso de PCA.

Reconstrucciones comprimidas de la imagen en diferentes números de vectores propios. 1, 3, 5 y 10 respectivamente.

Girly Mallya

Otra aplicación de valores propios es la extracción de características locales de una imagen.

Los valores propios de la matriz de Hesse describen la superficie de la imagen y se pueden usar para verificar si un píxel pertenece a la estructura que se está buscando.

Por ejemplo, en el caso 2D, si los dos valores propios de la matriz de Hesse en un punto particular son números positivos altos, significa que la superficie es cóncava hacia abajo en ese punto e indica la presencia de una gota oscura.

Ver Matriz de Hesse de la imagen y http://homepages.inf.ed.ac.uk/rb… .

Girly Mallya

More Interesting

¿Qué es un “isomorfismo canónico”?

Álgebra lineal: ¿Cuál es la intuición detrás de calcular el inverso de una matriz?

¿Cómo visito todos los de una matriz cuadrada (0,1)?

¿Qué es una transformación de Lorentz en términos simples?

¿Qué técnicas utiliza el marco petsc para la multiplicación de matriz dispersa?

¿Hay alguna familia de ecuaciones de parámetros bajos que pueda aproximarse a una ecuación polinómica de alto grado?

¿Cómo puede la multiplicidad geométrica superar la multiplicidad algebraica?

¿Podemos comparar matrices? Si AB> 0 es positivo definido, ¿podemos decir A> B?

¿Cuál es la explicación conceptualmente más clara de un producto Scalar / Inner / Dot?

¿Cómo resuelvo (aproximadamente) una matriz tridiagonal donde las 3 diagonales son unas?