¿Qué motivó la estructura de una matriz en álgebra lineal?

Al resolver ecuaciones lineales como 2x + 3y – 7z = 20 (y dos ecuaciones más similares), es conveniente alinear los términos en x, y y z verticalmente.

Las ecuaciones tienen una solución única si el determinante del conjunto de coeficientes, en el mismo diseño que las ecuaciones, no es cero. Otros determinantes obtenidos al omitir filas y columnas se encontraron útiles. La matriz de palabras (del latín que significa matriz: mater = madre, que conduce a palabras como matriculado) proviene de un comentario de Sylvester. Dijo que la matriz de coeficientes es la matriz a partir de la cual se pueden obtener estos determinantes.

Desde entonces, las matrices han encontrado muchas otras aplicaciones, como las matrices de coeficientes para formas cuadráticas y bilineales, y para transformaciones lineales.

Esta respuesta no debe tomarse como aprobación del uso de determinantes: son de uso limitado ya que requieren demasiado tiempo para calcular matrices incluso moderadamente grandes (por ejemplo, 5 × 5).

El álgebra lineal es en gran parte el estudio de transformaciones lineales, que transforman objetos (vectores) en un espacio vectorial a otros vectores en un espacio vectorial diferente. Podemos hablar de manera abstracta sobre tal transformación, por ejemplo [matemática] T: V \ a W [/ matemática], que transforma los vectores en el espacio [matemática] V [/ matemática] a vectores en el espacio [matemática] W [/ matemáticas]. Sabemos, por ejemplo, que para cualquiera de los dos vectores [matemática] v_1, v_2 \ en V, [/ matemática] y cualquier escalar [matemática] \ lambda, \ mu \ en F, [/ matemática] donde [matemática] F [ / math] es un campo (generalmente los números racionales [math] \ mathbb {Q} [/ math] o números reales [math] \ mathbb {R} [/ math]), [math] T (\ lambda v_1 + \ mu v_2) = \ lambda T (v_1) + \ mu T (v_2) [/ math].

Podemos llegar bastante lejos manipulando estas cantidades abstractas de acuerdo con reglas como esta. Sin embargo, cuando se trata de calcular cosas (y programar computadoras para calcular cosas), a menudo nos vemos obligados a elegir una base [matemática] \ matemática {B} = [/ matemática] [matemática] \ {e_i \}, [/ matemática], que es un conjunto de vectores linealmente independientes de modo que cualquier vector en nuestro espacio puede escribirse como una combinación lineal de los vectores base: [matemática] v = \ sum_i \ lambda_ie_i \; \ forall \, v \ en V [/ matemáticas].

Cuando elegimos una base, todo se vuelve mucho más concreto. De repente, podemos representar estos vectores abstractos, flotando en algún espacio [math] n [/ math] -dimensional, como una lista ordenada de números (ordenada [math] n [/ math] -tuple, donde [math] n [/ matemática] es la dimensión del espacio vectorial). Por ejemplo, tome un vector arbitrario [math] v [/ math] en nuestro espacio vectorial [math] V [/ math]. Una vez que elegimos una base [matemática] \ matemática {B} = [/ matemática] [matemática] \ {e_i \} _ {i = 1} ^ n [/ matemática], podemos escribir [matemática] v [/ matemática] en la forma [math] v = \ lambda_1e_1 + \ lambda_2e_2 + \ cdots + \ lambda_ne_n, [/ math] donde cada [math] \ lambda_i [/ ​​math] es un escalar en el campo [math] F [/ math] (generalmente [math ] F = \ mathbb {Q} [/ math] o [math] F = \ mathbb {R} [/ math]). Podemos identificar cada elemento base [math] e_i [/ ​​math] con una tupla simple ordenada [math] n [/ math] a través de la identificación [math] T_ \ mathcal {B} [/ math], que toma [math] e_i \ mapsto (0, \ ldots, 1_i, \ ldots, 0) ^ t = T_ \ mathcal {B} (e_i), [/ math] que es una columna de escalares [math] n [/ math] con un 1 en [math] i ^ \ text {th} [/ math] spot y ceros en otro lugar. Bajo esta identificación, podemos representar cualquier vector [math] v [/ math] como [math] T_ \ mathcal {B} (v) = (\ lambda_1, \ lambda_2, \ ldots, \ lambda_n) ^ t, [/ math ] una columna simple de números.

Ahora, lo hermoso de las transformaciones lineales es que solo necesitamos saber qué hacen con los elementos de una base para saber qué harán con cualquier vector en el espacio vectorial: [matemáticas] T (v) = T ( \ lambda_1e_1 + \ cdots + \ lambda_ne_n) = \ lambda_1T (e_1) + \ cdots + \ lambda_nT (e_n) [/ math]. Pero cada vector base transformado [math] T (e_i) [/ math] es un elemento del espacio vectorial [math] W [/ math] (ya que [math] T [/ math] es una transformación lineal de [math] V \ a W [/ matemáticas]). Entonces, por definición, podemos escribir cada [matemática] T (e_i) [/ matemática] como una combinación lineal de vectores base para [matemática] W [/ matemática]. Suponga que [math] \ mathcal {B} ‘= \ {f_j \} _ {j = 1} ^ m [/ math] es una base para [math] W [/ math]. Entonces podemos escribir [math] T (e_i) = a_ {1i} f_1 + a_ {2i} f_2 + \ cdots + a_ {mi} f_m [/ math] para algunos escalares [math] a_ {ji} [/ math]. Y bajo la identificación [math] T_ \ mathcal {B ‘}, [/ math] podemos representar esta es una columna de escalares [math] T (e_i) \ mapsto (a_ {1i}, \ ldots, a_ {mi} ) ^ t [/ matemáticas].

Si apilamos estas columnas de la forma [matemática] (a_ {1i}, \ ldots, a_ {mi}) ^ t [/ matemática] una al lado de la otra como libros en un estante, formamos una [matemática] n \ veces m [/ math] array

[matemáticas] M_T = \ begin {pmatrix} a_ {11} y a_ {12} & \ cdots & a_ {1n} \\ a_ {21} y a_ {22} & \ cdots & a_ {2n} \\\ vdots & \ vdots & \ ddots & \ vdots \\ a_ {n1} y a_ {n2} y \ cdots y a_ {nm} \ end {pmatrix} [/ math]

Esta matriz [math] M_T [/ math] es una matriz [math] n \ times m [/ math], que representa la transformación lineal [math] T [/ math] con respecto a la base [math] \ mathcal {B }[/matemáticas].

[matemática] M_T [T_ \ matemática {B} (v)] = T_ \ matemática {B ‘} [T (v)] [/ matemática]


Entonces, la estructura de las matrices en álgebra lineal simplemente aparece cuando elegimos una base para nuestro espacio vectorial.

Otra cuestión que creo que vale la pena mencionar es que la multiplicación de matrices en álgebra lineal es paralela a la composición de operaciones lineales: si T, T ‘son operadores lineales [matemática] T, T’: V \ rightarrow V [/ matemática] entonces las composiciones [matemática ] T \ circ T ‘, T’ \ circ T [/ math] están dados, respectivamente, por los productos de matriz [math] TT ‘[/ math] y [math] T’T [/ math].