¿Por qué multiplicamos matrices de la manera que lo hacemos?

Algo de eso es histórico. Sin embargo, parte de esto tiene que ver con cómo surge naturalmente de la aplicación de transformaciones lineales.

Digamos que tenemos un vector, dado por

[math] \ mathbf {u} = \ sum \ limits_ {i = 1} ^ na_i \ mathbf {e} ^ i [/ math]

donde cada [math] \ mathbf {e} ^ i [/ math] es un vector base, con el coeficiente correspondiente [math] a_i [/ ​​math].

y queremos transformarlo con una transformación lineal, L. Recordemos que un operador lineal, L, satisface la ecuación

[matemática] L \ left (\ alpha \ mathbf {u} + \ beta \ mathbf {v} \ right) = \ alpha L \ left (\ mathbf {u} \ right) + \ beta L \ left (\ mathbf { v} \ right) [/ math]

Luego, cuando te transformamos con L, obtenemos

[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {i = 1} ^ na_iL \ left (\ mathbf {e} ^ i \ right) [/ math]

Entonces, el valor de L aplicado a todos depende de L aplicado a cada vector base.

Ahora desde

[matemáticas] \ left \ {\ mathbf {e} ^ i \ right \} [/ math]

forma una base, entonces cada [matemática] L \ left (\ mathbf {e} ^ i \ right) [/ math]

se puede escribir como una combinación lineal de vectores básicos. Sin embargo, tenga en cuenta que es posible que no utilicemos todos los vectores básicos. Por ejemplo, supongamos que L representa la proyección de cada vector en el plano XY. Entonces la transformación resultante nunca tendrá un componente en la dirección Z. Sin pérdida de generalidad, supongamos que solo necesitamos los primeros vectores básicos [math] m \ leq n [/ math] para representar la transformación, L, de cualquier vector base.

Entonces nosotros tenemos

[matemática] L \ left (\ mathbf {e} ^ i \ right) = \ sum \ limits_ {j = 1} ^ mb_ {ij} \ mathbf {e ^ j} [/ math]

Entonces,

[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {i = 1} ^ na_i \ left (\ sum \ limits_ {j = 1} ^ mb_ {ij} \ mathbf {e ^ j } \ right) [/ math]

que puede reescribirse como

[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {j = 1} ^ m \ left (\ sum \ limits_ {i = 1} ^ na_ib_ {ij} \ right) \ mathbf { e ^ j} [/ matemáticas]

Entonces, ahora, considere cuál es el coeficiente, [math] c_i [/ ​​math], de [math] \ mathbf {e} ^ i [/ math] después de la transformación.

Está

[matemática] c_i = \ sum \ limites_ {i = 1} ^ n b_ {ji} a_j [/ matemática]

Observe que [math] b_ {ji} [/ math] es solo [math] b_ {ij} [/ math] transpuesta.

Ahora, [math] b_ {ij} [/ math] puede escribirse como una tabla, y si queremos mantener la coherencia, ya que usamos el índice i para representar filas, entonces deberíamos continuar haciendo eso para nuestra tabla. Eso significa que j representa columnas.

Escrito, nuestra mesa se ve como

[matemáticas] \ begin {pmatrix} b_ {11} \ b_ {12} \ \ cdots \ b_ {1n} \\ b_ {21} \ b_ {22} \ \ cdots \ b_ {2n} \\ \ vdots \\ b_ {m1} \ b_ {m2} \ \ cdots \ b_ {mn} \ end {pmatrix} [/ math]

Ahora, como L es lineal, podemos decir que se puede representar como una especie de elemento: una matriz, que se muestra arriba, que multiplica un vector de columna para producir otro vector de columna.

[matemáticas] L \ begin {pmatrix} a_1 \\ a_2 \\ \ vdots \\ a_n \ end {pmatrix} = \ begin {pmatrix} b_ {11} \ b_ {12} \ \ cdots \ b_ {1n} \\ b_ {21} \ b_ {22} \ \ cdots \ b_ {2n} \\ \ vdots \\ b_ {m1} \ b_ {m2} \ \ cdots \ b_ {mn} \ end {pmatrix} \ begin {pmatrix} a_1 \\ a_2 \\ \ vdots \\ a_n \ end {pmatrix} [/ math]

Por lo tanto, resulta que la multiplicación de matrices se produce de forma natural simplemente considerando cuál debe ser la estructura de una transformación lineal.

Una matriz es una forma resumida de expresar una función lineal que toma múltiples entradas y devuelve múltiples salidas. Supongamos que tenemos una empresa de muebles que fabrica escritorios, sillas y estanterías: una matriz podría enumerar cuántos de cada artículo de suministro bruto (láminas planas de madera, varillas de madera, tornillos de metal, etc.) van a cada escritorio, cada silla , cada estantería, y multiplicaríamos esa matriz por un vector de columna que contiene el número de escritorios, sillas y estanterías en un orden para encontrar cuántos de cada tipo de suministro se necesitarían para completar ese orden; entonces otra matriz podría enumerar para cada uno de esos artículos de suministro cuánto dinero cuesta y cuánto espacio ocupa en el camión, y el producto de las dos matrices daría el resultado de aplicar las funciones una tras otra, para ir desde el número de cada tipo de muebles ordenados según el costo y el tamaño de los artículos necesarios.

Las matrices y las formas en que hacemos los cálculos están diseñadas en torno a la idea de operaciones lineales. Una matriz que actúa sobre un objeto siempre producirá una transformación lineal. Decidimos multiplicarlos de la forma en que lo hacemos para mantener las propiedades de linealidad.