Algo de eso es histórico. Sin embargo, parte de esto tiene que ver con cómo surge naturalmente de la aplicación de transformaciones lineales.
Digamos que tenemos un vector, dado por
[math] \ mathbf {u} = \ sum \ limits_ {i = 1} ^ na_i \ mathbf {e} ^ i [/ math]
donde cada [math] \ mathbf {e} ^ i [/ math] es un vector base, con el coeficiente correspondiente [math] a_i [/ math].
- ¿Qué significa el valor propio? ¿Puede haber valores propios infinitos para un vector propio?
- Cómo resolver [matemáticas] \ left \ {\ begin {matrix} 2x ^ 2 + 3y ^ 2 = 21 & \\ 6x ^ 2 + 9y ^ 2 = 21x \ end {matrix} \ right. [/ Math]
- ¿Qué es el álgebra lineal y cuáles son sus aplicaciones?
- Para la multiplicación de matrices n * n, ¿cuál es el código C?
- ¿Por qué no hay convoluciones generales ‘no lineales’ disponibles en el aprendizaje automático?
y queremos transformarlo con una transformación lineal, L. Recordemos que un operador lineal, L, satisface la ecuación
[matemática] L \ left (\ alpha \ mathbf {u} + \ beta \ mathbf {v} \ right) = \ alpha L \ left (\ mathbf {u} \ right) + \ beta L \ left (\ mathbf { v} \ right) [/ math]
Luego, cuando te transformamos con L, obtenemos
[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {i = 1} ^ na_iL \ left (\ mathbf {e} ^ i \ right) [/ math]
Entonces, el valor de L aplicado a todos depende de L aplicado a cada vector base.
Ahora desde
[matemáticas] \ left \ {\ mathbf {e} ^ i \ right \} [/ math]
forma una base, entonces cada [matemática] L \ left (\ mathbf {e} ^ i \ right) [/ math]
se puede escribir como una combinación lineal de vectores básicos. Sin embargo, tenga en cuenta que es posible que no utilicemos todos los vectores básicos. Por ejemplo, supongamos que L representa la proyección de cada vector en el plano XY. Entonces la transformación resultante nunca tendrá un componente en la dirección Z. Sin pérdida de generalidad, supongamos que solo necesitamos los primeros vectores básicos [math] m \ leq n [/ math] para representar la transformación, L, de cualquier vector base.
Entonces nosotros tenemos
[matemática] L \ left (\ mathbf {e} ^ i \ right) = \ sum \ limits_ {j = 1} ^ mb_ {ij} \ mathbf {e ^ j} [/ math]
Entonces,
[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {i = 1} ^ na_i \ left (\ sum \ limits_ {j = 1} ^ mb_ {ij} \ mathbf {e ^ j } \ right) [/ math]
que puede reescribirse como
[matemática] L \ left (\ mathbf {u} \ right) = \ sum \ limits_ {j = 1} ^ m \ left (\ sum \ limits_ {i = 1} ^ na_ib_ {ij} \ right) \ mathbf { e ^ j} [/ matemáticas]
Entonces, ahora, considere cuál es el coeficiente, [math] c_i [/ math], de [math] \ mathbf {e} ^ i [/ math] después de la transformación.
Está
[matemática] c_i = \ sum \ limites_ {i = 1} ^ n b_ {ji} a_j [/ matemática]
Observe que [math] b_ {ji} [/ math] es solo [math] b_ {ij} [/ math] transpuesta.
Ahora, [math] b_ {ij} [/ math] puede escribirse como una tabla, y si queremos mantener la coherencia, ya que usamos el índice i para representar filas, entonces deberíamos continuar haciendo eso para nuestra tabla. Eso significa que j representa columnas.
Escrito, nuestra mesa se ve como
[matemáticas] \ begin {pmatrix} b_ {11} \ b_ {12} \ \ cdots \ b_ {1n} \\ b_ {21} \ b_ {22} \ \ cdots \ b_ {2n} \\ \ vdots \\ b_ {m1} \ b_ {m2} \ \ cdots \ b_ {mn} \ end {pmatrix} [/ math]
Ahora, como L es lineal, podemos decir que se puede representar como una especie de elemento: una matriz, que se muestra arriba, que multiplica un vector de columna para producir otro vector de columna.
[matemáticas] L \ begin {pmatrix} a_1 \\ a_2 \\ \ vdots \\ a_n \ end {pmatrix} = \ begin {pmatrix} b_ {11} \ b_ {12} \ \ cdots \ b_ {1n} \\ b_ {21} \ b_ {22} \ \ cdots \ b_ {2n} \\ \ vdots \\ b_ {m1} \ b_ {m2} \ \ cdots \ b_ {mn} \ end {pmatrix} \ begin {pmatrix} a_1 \\ a_2 \\ \ vdots \\ a_n \ end {pmatrix} [/ math]
Por lo tanto, resulta que la multiplicación de matrices se produce de forma natural simplemente considerando cuál debe ser la estructura de una transformación lineal.