¿Por qué no puedes multiplicar una matriz de 2 × 2 con una matriz de 3 × 2?

Una manera fácil de imaginar la multiplicación de matrices es usar la analogía de latitudes y longitudes .

Las filas de la primera matriz son análogas a las latitudes y las columnas de la segunda matriz son análogas a las longitudes.

Las latitudes (filas de la primera matriz), mapean (juego de palabras) cada longitud (columna) de la segunda matriz a una ubicación particular (valor en la matriz resultante).

Cada elemento de la matriz resultante se puede describir en términos de su latitud (fila de la primera matriz) y longitud (columna de la segunda matriz), a partir de la cual se generó. Por ejemplo, C [2] [3] se genera a partir de la segunda fila de la matriz A y la tercera columna de la matriz B.

Eso debería construir cierta intuición para la multiplicación de matrices.

Ahora, como puede ver en la figura de la matriz, si el número de elementos en cada fila de la primera matriz y el número de elementos en cada columna de la segunda matriz no coinciden, tendrá variables adicionales con las que No sabría qué hacer. Esta es la razón por la que el número de columnas de la primera matriz y el número de filas de la segunda matriz tienen que ser iguales.

Solo considera cómo haces la multiplicación de matrices:

Tenga en cuenta que:
1. El número de columnas de la primera matriz debe ser igual al número de filas de la segunda matriz.
2. La matriz del producto tiene el mismo número de filas que el de la primera matriz y el mismo número de columnas que el de la segunda matriz.

Algoritmo: suponga que tiene dos matrices [matemáticas] A = (a_ {ij}) _ {m \ veces n} [/ matemáticas] y [matemáticas] B = (b_ {ij}) _ {n \ veces p} [/ matemática], donde i y j son los índices de fila y columna, respectivamente. Entonces, el producto [math] AB = (c_ {ij}) _ {m \ times p} [/ math] es una matriz [math] m \ times p [/ math] con entradas [math] c_ {ij} = \ sum_n a_ {in} b_ {nj} [/ math]

En la imagen, está multiplicando la fila i por la columna j para obtener el componente [math] c_ {ij} [/ math] como se ilustra en la imagen a continuación, que obtuve de Wikipedia.
fuente: http://en.wikipedia.org/wiki/Mat

Usted encuentra que si [matemática] C = A _ {\ alpha \ times \ beta} B _ {\ sigma \ times \ rho} [/ matemática] pero [matemática] \ beta \ neq \ sigma [/ matemática], no tiene forma para calcular el producto de acuerdo con el algoritmo que se muestra arriba.

La operación matricial no es un hecho de la naturaleza o un fenómeno natural. Es una cuestión de definición a partir de la cual se sigue el razonamiento.

Es más parecido a que la operación de multiplicación estándar entre matrices se define solo cuando el número de columna del primer operando es igual al número de fila del segundo operando. De lo contrario, no está definido. ¿Por qué se define de esta manera? Porque permite una fácil representación de numerosas estructuras matemáticas en campos puros y aplicados como álgebra lineal, teoría de ecuaciones, topología de espacios métricos, análisis convexo, autómatas, teoría de la información, diseño de controladores, procesamiento de señales, etc.

Ahora, por supuesto, puede definir una operación binaria que involucre una matriz de 2 × 2 y una matriz de 3 × 2. Pero llamar a eso una operación de multiplicación solo servirá para confundir a los lectores ya que ya tenemos una noción bien establecida de multiplicación matricial.

Por ejemplo, puede formar una nueva matriz de 3 × 2 donde la submatriz superior de 2 × 2 se obtiene por productos inteligentes de las matrices anteriores. La última fila se obtiene manteniendo intacta la última fila del segundo operando. Ahora, puedes nombrar la operación como quieras, incluso después de ti mismo si tienes la inclinación. Pero la pregunta es si la operación es significativa de alguna manera para la solución o la representación concisa de una amplia categoría de problemas, estructuras, funciones, objetos matemáticos o incluso fenómenos físicos. Si puede resolver algunos problemas hasta ahora no resueltos utilizando su operación, o simplificar una gran variedad de formulaciones complejas o demostrar que su operación es una categoría más generalizada de operaciones previamente conocidas y simplificarlas, será una contribución verdaderamente innovadora. Eso es lo que hará que su operación sea significativa, no el simple acto de definirla.

Para reiterar, una vez más, una matriz 2 × 2 no se puede multiplicar por una matriz 3 × 2, como se define la operación. Pero se pueden combinar para producir una nueva matriz de cualquier dimensión de numerosas maneras diferentes. Depende de la comunidad practicante de investigadores o ingenieros juzgar si el método de combinación es significativo o no.

Estás intentando multiplicar y sumar una fila de ancho-2 por una columna de altura-3.

Pero en su ejemplo, se quedaría sin cosas para que coincida, por lo que no se pudo completar el cálculo. La matriz de altura 3 a la derecha necesita 3 cosas para que la multiplicación tenga sentido, pero solo le está dando 2 (= el ancho de la matriz a la izquierda).

dónde
.

Cómo multiplicar matrices


(Por cierto, si fuera un punk, te diría que puedes multiplicar un 2 × 2 por un 3 × 2, solo tienes que poner el más alto a la izquierda. 😉 Pero sé que eso no es lo que querías decir. )


Para obtener más información sobre cuándo / por qué / cómo una matriz 3 × 2 representa un mapa lineal de 3D → 2D, consulte:

sobre La geometría de ecuaciones lineales y “rango + nulidad”.

(La mayoría de las conferencias de álgebra lineal que puedes encontrar en la Web tratan estas partes cruciales del álgebra lineal, así como ver títulos como “espacio de fila, espacio nulo, espacio de columnas”. Solo estoy haciendo una sugerencia específica para que puedas llegar directamente a ella en lugar de buscar el mejor.)


También mi respuesta es “calculadora”. Una razón más profunda basada en la lógica por la que no puede multiplicar estos dos (en el orden que desea) es la siguiente:

  • Una matriz 3 × 2 (multiplicando a la izquierda de la entrada [math] \ mathrm {\ left [M \ right]} \ cdot \ vec {v} [/ math]) representa una transformación lineal de 2D → 3D.
  • Una matriz 2 × 2 representa una transformación lineal de 2D → 2D.
  • Multiplicar matrices crea una transformación compuesta: “Haz A, luego haz B” [math] \ mathrm {\ left [A \ right]} \ cdot \ mathrm {\ left [B \ right]} \ cdot \ vec {v} [ /matemáticas].

Entonces, la segunda matriz 2 × 2 espera transformar un objeto 2D en otro objeto 2D. Si lo alimentaste con un objeto 3D (porque el resultado vino de tu operación 3 × 2 a la izquierda), entonces no sabría qué hacer con él.

Podría hacer una analogía para alimentar una función de computadora con un tipo de datos incorrecto. Por ejemplo, si trataste de abrir una página web con un reproductor de mp3. Una página web no es el tipo de datos correcto que esperaba el reproductor de mp3. Una cosa 3D no es la entrada que su operador 2D → 2D esperaba.

Las dimensiones internas deben coincidir para calcular todos los productos escalares relevantes en forma de fila-columna. Entonces, si A es 2 × 2 y B es 3 × 2, entonces AB está indefinido pero BA está definido, como nosotros AB ‘.

Hay otros productos de matriz que se definen, como el producto Kronecker, pero eso probablemente no es lo que estaba pensando.

Las matrices representan funciones lineales. El número de filas es el número de variables en la salida / rango y el número de columnas es el número de variables en la entrada / dominio. La multiplicación de matrices es en realidad una composición de funciones lineales, es decir, toma la salida de la primera función (es decir, la representada por la matriz a la derecha) y la aplica a la entrada de la segunda función (es decir, la representada por matriz a la izquierda). Es por eso que el número de filas en la matriz derecha tiene que coincidir con el número de columnas en la segunda.

Por ejemplo, una matriz [matemática] 2 \ veces 2 [/ matemática] representa un mapa lineal que toma 2 variables de entrada a 2 variables de salida y una matriz [matemática] 3 \ veces 2 [/ matemática] representa un mapa lineal que toma 2 variables de entrada a 3 variables de salida. Como hay 3 variables de salida a la derecha y 2 variables de entrada a la izquierda, no es una operación bien definida. Por ejemplo, si te dije que evaluaras la función [matemática] f (x) = x ^ 2 [/ matemática] y te diera las variables [matemática] x = 3, y = 5, [/ matemática] no lo harías tener una salida bien definida ya que no sabe qué hacer con la variable [math] y = 5 [/ math]. Lo mismo aquí: la matriz izquierda espera exactamente dos variables y no sabe qué hacer con las tres que le da la matriz derecha.

Supongamos que tenemos dos matrices A y B. Para encontrar AB, primero debemos verificar si este producto está definido o no. Este producto se definirá solo cuando el número de columnas en la matriz A sea igual al número de filas en la matriz B. En la pregunta formulada, esta condición no se cumple, por lo que no podemos multiplicarlas.

Si [matemática] C = AB [/ matemática], entonces [matemática] c_ {ij} [/ matemática] es el producto escalar de la fila [matemática] i [/ matemática] de [matemática] A [/ matemática] con la columna [matemática] j [/ matemática] de [matemática] B [/ matemática]. Eso significa que el número de columnas de [math] A [/ math] debe ser igual al número de filas de [math] B [/ math].

En el caso donde [math] A \ in \ mathbb {R} ^ {2 \ times 2} [/ math] y [math] B \ in \ mathbb {R} ^ {3 \ times 2} [/ math] usted no tiene esa igualdad, por lo que el producto [math] AB [/ math] no está definido. Sin embargo, puede calcular [math] BA [/ math] porque las dimensiones se alinean correctamente.