¿Qué técnicas utiliza el marco petsc para la multiplicación de matriz dispersa?

PETSc es una buena biblioteca si desea mejorar el rendimiento de SpMV en serie o en paralelo sin ajustar manualmente su propio código o usar instrucciones SSE o una serie de bibliotecas sintonizadas más pequeñas. PETSc se optimiza para SpMV directamente desde la carga de la matriz en un formato binario (leer el archivo .mtx es una gran sobrecarga) para ofrecer una variedad de estructuras de datos de matriz apropiadas (en serie y en paralelo) para proporcionar varias configuraciones de tiempo de ejecución para ajustar el rendimiento , como el tamaño del bloque.

PETSc implementa diferentes algoritmos de SpMV para diferentes tipos de matriz, a saber, casos simétricos y no simétricos. El diseño de datos y los accesos vectoriales se planifican cuidadosamente para maximizar la reutilización de datos durante el cálculo, particularmente para los tamaños de bloque 1-7 u 8. Desde mi experiencia, la asignación previa para la matriz (dependiendo de la estructura de dispersión de la matriz) y la elección de la estructura de datos + bloque apropiado El tamaño de su matriz dispersa son perillas críticas que desea ajustar para mejorar el rendimiento de su SpMV.

Related Content

¿Qué significan realmente los productos de puntos y vectores cruzados?

¿Qué tiene de especial la forma de multiplicación de matriz w’Aw en la optimización y el punto de vista del aprendizaje automático?

Si pensara que el álgebra lineal (18.06) era una clase profunda, ¿qué otras clases de matemáticas encontraré inmediatamente agradables en el MIT?

¿Por qué está bien definida la dimensión de un espacio vectorial? ¿Cómo sé que todas esas bases deben tener el mismo número de elementos?

Álgebra lineal: ¿Cuál es la motivación detrás de la definición del complemento Schur de una matriz?

¿Hay alguna familia de ecuaciones de parámetros bajos que pueda aproximarse a una ecuación polinómica de alto grado?

¿Solicitar un programa ‘Master’s + PhD’ sobre un programa Master puro aumenta mis posibilidades de obtener ayuda financiera?

PETSc tiene varios formatos de matriz, pero el formato disperso principal es una variante en el almacenamiento de filas comprimidas. Si ejecuta en un solo procesador, es exactamente CRS. Para hacer un producto paralelo, hicieron algo bastante ingenioso.

Primero debe saber que se distribuye una matriz dispersa paralela (formato MPIAIJ) con cada procesador que tiene un blockrow: un número consecutivo de filas. Esto podría almacenarse como una matriz dispersa única, con alguna anotación sobre qué subconjunto de la matriz global es.

En su lugar, almacenan la parte en cada procesador como * dos * matrices, una parte que contiene el bloque diagonal cuadrado (es decir, aquellos elementos cuyos índices de columna están en el rango de filas que almacena el procesador) y una para todo lo demás. Esto le permite implementar el producto de matriz dispersa de la siguiente manera:

Publique un montón de solicitudes de Isend e Irecv para los datos de otros procesadores
Multiplica por la parte diagonal de la matriz
Espere a que se completen las llamadas Isend / Irecv
Multiplica por la parte fuera de la diagonal.

Almacenar la parte en el procesador como dos matrices CRS es bastante elegante.

Steena Monteiro

More Interesting

¿Qué conceptos de álgebra lineal debería dominar uno para ser un buen científico de datos? ¿Qué recursos proporcionan una lista completa de conceptos de álgebra lineal utilizados para el aprendizaje automático?

¿Cuáles son las ventajas de la notación de brackets de Dirac?

Álgebra lineal: ¿Por qué, para invertir o transponer un producto de matrices, uno tiene que invertir el orden de multiplicación?

¿Cómo se puede modificar el juego de 3 × 3 tic-tac-toe para eliminar las estrategias ganadoras definitivas?

¿Cómo puede demostrar que este espacio vectorial es linealmente independiente?

¿Cuál es la mejor [matemática] X [/ matemática] que minimiza [matemática] \ left \ Vert S ^ {- 1} y \ right \ Vert _ {2} [/ math] para cualquier vector real [matemática] y [ / math] donde [math] S = AA ^ {T} + XX ^ {T} -AB ^ {T} \ left (BB ^ {T} \ right) ^ {- 1} BA ^ {T} [/ math ]?

¿Cuál es la importancia de la desigualdad triangular?

¿Qué es una explicación intuitiva de la matriz DFT W?

¿Cuáles son algunas aplicaciones geniales de vectores propios?

Álgebra lineal: ¿Cómo se escribe un programa en C para reducir una matriz a una forma escalonada o una forma escalonada reducida?

Web Analytics Made Easy -
StatCounter