Cómo minimizar el costo de calcular una multiplicación de matrices cuando las matrices tienen muchos ceros

Gracias por a2a

Esta es un área de investigación activa. Los métodos para minimizar el costo dependen en gran medida de la estructura de la matriz. Hay soluciones de computación cuántica que se han desarrollado recientemente y que no cubro aquí, pero sí en otras respuestas de Quora, como otras. Sigue una sinopsis rápida, para formar C = AB:

A, B: matriz cuadrada triangular inferior (o superior). Tal matriz tiene ceros arriba (abajo) de la diagonal. El costo de la multiplicación es [matemática] n ^ 3/6 [/ matemática] en lugar de [matemática] n ^ 3. [/ Matemática]
A, B: matriz cuadrada bidiagonal. Tal matriz tiene entradas distintas de cero solo en la diagonal y una adyacente fuera de la diagonal directamente arriba o abajo. El costo de la multiplicación es [matemática] 3n [/ matemática] [matemática] [/ matemática] en lugar de [matemática] n ^ 3. [/ Matemática]
Una matriz de Fourier: [matemáticas] n ^ 2 log n [/ matemáticas]
A Circulante: [matemática] n ^ 2 log n [/ matemática]
A y B ambos o circulante: [matemática] 3n log (n) [/ matemática]
A o B o ambas matrices cercanas a las formas anteriores: Encuentre una descomposición de la forma [math] A = W + \ epsilon [/ math] de manera que W esté estructurada y [math] \ epsilon [/ math] sea muy escasa.

Hay 6! combinaciones de todo lo anterior (ok, no del todo, ya que 4,5 no son disjuntas). También hay infinitos otros casos especiales menos completos.

Deje [math] W = \ left \ {(x_1, x_2, x_3) \ mid {3x_1 + \ frac {1} {2} x_2 + 7x_3 = 0} \ right \} [/ math]. ¿Cómo encuentro la base y la dimensión de [math] W [/ math]?

(Soy un estudiante de sexto grado) Nunca he sido tan bueno en matemáticas y no sé cómo adaptarme al álgebra … ¿Cómo me adapto rápidamente al álgebra?

¿Qué es más importante para el aprendizaje automático: teoría de la probabilidad o álgebra lineal?

¿Cuáles son las cosas comunes en las clases de Álgebra 1 que los estudiantes no entienden?

¿Qué representan las matrices en las siguientes imágenes?

Cómo desarrollar un ensayo para un examen principal de UPSC CSE sobre cualquier tema

Una matriz con ‘muchos ceros’ se llama matriz dispersa .

No soy un experto en la implementación rápida de evaluar el producto de dos matrices dispersas o, de hecho, en el tema de las matrices dispersas en general, pero una simple búsqueda en Google me proporcionó una buena cantidad de enlaces para su lectura.

Google: producto eficiente de matrices dispersas

Uno de los papeles que me llamó la atención es

http://cs.tau.ac.il/~zwick/paper …

que compara varios algoritmos de multiplicación de matrices antes de introducir su propio algoritmo.

Espero que encuentres el algoritmo que se adapte a tus necesidades.

Mingjie Zhan

ATA Una de las formas más fáciles de optimizar es aprovechar las filas y columnas que son completamente cero. En una representación escasa indexada por fila o columna, estas ni siquiera están representadas. En [matemáticas] A = BC [/ matemáticas] una fila de todo cero en B produce una fila de todo cero en A. Lo mismo con columnas en C y columnas en A. Usando un índice basado en filas y columnas para B y C respectivamente hace que sea trivial aprovechar esto. Esta es una optimización valiosa en la medida en que las matrices B y C son tan escasas que muchas filas y columnas son cero.

Mingjie Zhan

Hay buenas noticias y malas noticias. La mala noticia es que la cantidad de cómputo en términos del número de operaciones sigue siendo la misma, incluso si la matriz tiene muchos ceros.

La cantidad de almacenamiento (memoria) puede reducirse drásticamente si uno elige aplicar matrices dispersas para lidiar con la situación.

Mingjie Zhan

More Interesting

¿Cuál es la interpretación geométrica de la traza de una matriz?

Si la suma de dos vectores unitarios es también un vector unitario, ¿cuál es la magnitud de su diferencia y ángulo entre los dos vectores unitarios dados?

Cómo calcular [matemáticas] \ left [\ vec {x} \ right] _b [/ math] a partir de [math] \ left [\ vec {x} \ right] _E [/ math]. Tenga cuidado de que [matemáticas] \ left [\ vec {x} \ right] _E = \ vec {x} [/ math]

Cómo demostrar que [matemáticas] \ det A_ {n + 2} = a \ det A_ {n + 1} + b \ det A_n [/ matemáticas] para la matriz A

¿Cómo se pueden aplicar las matrices en informática?

Cómo representar la suma de 2 vectores como un vector algebraicamente

¿Qué es un vector de características?

¿El uso de la combinación lineal de vector propio da el mismo resultado?

Cómo encontrar determinantes de Vandermonde

Cómo determinar la matriz de reflexión sobre una línea a través del origen con el vector de dirección [math] \ vec {v} = \ left (a, b \ right) ^ {T} [/ math]