¿Qué significa cuando las personas dicen que la multiplicación de matrices es la composición de funciones y cómo es útil pensar en ellas de esta manera?

Supongamos que tengo dos funciones lineales: [math] B [/ math] asigna [math] \ mathbb {R} ^ p [/ math] a [math] \ mathbb {R} ^ n [/ math] y [math] A [/ math] asigna [math] \ mathbb {R} ^ n [/ math] a [math] \ mathbb {R} ^ m [/ math]. Luego, dado un vector [math] x [/ math] en [math] \ mathbb {R} ^ p [/ math], puedo pasar por la primera función para obtener un vector [math] Bx [/ math] en [math ] \ mathbb {R} ^ n [/ math], que luego puedo pasar por [math] A [/ math] para obtener un vector [math] A (Bx) [/ math] en [math] \ mathbb {R } ^ m [/ matemáticas]. Pero en realidad hay una única función lineal que envía cualquier [matemática] x [/ matemática] en [matemática] \ mathbb {R} ^ p [/ matemática] al vector [matemática] A (Bx) [/ matemática] en [matemática ] \ mathbb {R} ^ m [/ math], y esa función es la composición [math] AB [/ math]. Dadas las representaciones matriciales de [math] B [/ math] y [math] A [/ math], la representación matricial de la composición [math] AB [/ math] se obtiene por multiplicación matricial.

¿Por qué es útil esto? Aquí hay dos ejemplos (uno práctico y otro teórico):

  1. Supongamos que su jefe le da matrices [matemáticas] B [/ matemáticas] y [matemáticas] A [/ matemáticas], y luego un montón de [matemáticas] x [/ matemáticas] ‘s, con la tarea de calcular [matemáticas] A ( Bx) [/ math] para cada [math] x [/ math]. Puede molestarse en calcular [matemáticas] Bx [/ matemáticas] y luego [matemáticas] A (Bx) [/ matemáticas] para cada [matemáticas] x [/ matemáticas], pero eso sería mucho más lento que calcular [matemáticas] AB [ / math] antes de mirar cualquiera de [math] x [/ math] ‘s, y luego calcular cada [math] (AB) x [/ math].
  2. Al igual que la multiplicación de números reales, la multiplicación matricial es asociativa. Esto significa que los paréntesis no importan al multiplicar: [matemática] (AB) C = A (BC) [/ matemática]. Es bastante tedioso demostrar esta identidad a partir de la definición de multiplicación de matrices, pero se deduce directamente de la asociatividad (más intuitiva) de la composición de funciones.