¿Cuál es la intuición matemática detrás del determinante de una matriz? ¿Cómo se concibió su definición y por qué es importante? ¿Qué significa intuitivamente?

Gracias por A2A.

En realidad, una noción de determinante es bastante natural. Es solo un volumen con signo de [math] n [/ math] -lelelepípedo dimensional formado por columnas de una matriz [math] A [/ math] (ya que [math] \ det A = \ det {~} ^ {t} A [/ math], uno puede reemplazar filas por columnas en cualquier parte de este texto).

Para [matemáticas] n = 2 [/ matemáticas] tenemos un paralelogramo.


Como puede ver, a medida que el ángulo entre los vectores se hace más pequeño, el área del paralelogramo también lo es.

En particular, si dos vectores son colineales, su área es cero, y estos dos vectores ya no abarcan el espacio bidimensional.

Lo mismo vale para [math] n [/ math] -dim vector space [math] V [/ math]. Ese volumen es igual a cero significa que los vectores [math] n [/ math] no abarcan [math] n [/ math] -dim vector space; es decir, abarcan un subespacio lineal adecuado [matemática] W \ subconjunto V [/ matemática] (p. ej., geométricamente, hiperplano para [matemática] \ dim W = n-1 [/ matemática], una línea para [matemática] \ dim W = 1 [/ math], o algo entre ellos por dimensión).

Ahora nos gustaría definir una función que mida el volumen con signo formado por columnas de matriz [matemáticas] A_1, A_2, \ ldots, A_n [/ matemáticas].

Bueno, como de costumbre, asignamos [math] n [/ math] -dimensional standard unit cube volume [math] 1 [/ math].

Así tenemos:

1) [matemática] \ det (e_1, e_2, \ ldots e_n) = 1 [/ matemática].

El volumen de un paralelepípedo es claramente cero si alguno de sus bordes coincide:

2) [math] \ det (A_1, \ ldots A_i, \ ldots, A_j, \ ldots, A_n) = 0 [/ math] siempre que [math] A_i = A_j [/ math] para algún par [math] (i, j) [/ math] con [math] i \ neq j [/ math].

Si estiramos un borde de un paralelepípedo por el factor [math] \ lambda [/ math], su volumen también debería cambiar en [math] \ lambda [/ math], es decir, tenemos:

3) [math] \ det (\ lambda A_1, A_2, \ ldots, A_n) = \ lambda \ det (A_1, A_2, \ ldots, A_n). [/ Math]
Lo mismo vale para otros argumentos.

Y la última pero no menos importante propiedad de un volumen que necesitamos es:

4) [matemática] \ det (A_1 + B_1, A_2, \ ldots, A_n) = [/ matemática] [matemática] \ det (A_1, A_2, \ ldots, A_n) + [/ matemática] [matemática] \ det ( B_1, A_2, \ ldots, A_n) [/ math].
Lo mismo vale para otros argumentos.

La propiedad 4) es quizás la propiedad menos obvia del volumen de un paralelepípedo. Mire una vez más la situación [matemáticas] n = 2 [/ matemáticas].


Tiene dos paralelogramos formados por los vectores [matemática] a [/ matemática] y [matemática] c [/ matemática], respectivamente por [matemática] b [/ matemática] y [matemática] c_1 [/ matemática] ([matemática] c_1 [ / math] es solo una traducción paralela de [math] c [/ math] que nos permite obtener una buena imagen).
El área de un paralelogramo abarcado por [matemáticas] a + b [/ matemáticas] y [matemáticas] c [/ matemáticas] es claramente la suma de las áreas de estos dos paralelogramos (ambos triángulos grandes en la parte superior e inferior de la figura tienen el mismo áreas).

En otras palabras, por 3) y 4) [math] \ det [/ math] es una función lineal en cada uno de sus argumentos (forma multilineal) que satisface algunas propiedades adicionales del volumen con signo.

Además, tenemos por 2):

[matemática] \ det (A_1 + A_2, A_1 + A_2, A_3, \ ldots, A_n) = 0 [/ matemática]

Aplicando 4) tres veces obtenemos:

[matemática] 0 = \ det (A_1 + A_2, A_1 + A_2, A_3, \ ldots, A_n) = [/ matemática] [matemática] \ det (A_1, A_1, A_3, \ ldots, A_n) + [/ matemática] [matemáticas] \ det (A_2, A_2, A_3, \ ldots, A_n) + [/ matemáticas] [matemáticas] \ det (A_1, A_2, \ ldots, A_n) + \ det (A_2, A_1, \ ldots, A_n) [/matemáticas]

Entonces [matemática] \ det (A_1, A_2, A_3, \ ldots, A_n) = [/ matemática] [matemática] – \ det (A_2, A_1, A_3, \ ldots, A_n) [/ matemática] (+)

Del mismo modo, el intercambio de cualquier otra columna de matriz produce un cambio de signo.
La propiedad (+) justifica el nombre “forma multilineal alterna” para este tipo de mapa multilineal.

El orden de intercambio de dos vectores cambia su orientación http://en.wikipedia.org/wiki/Ori… (recuerde todas las leyes físicas divertidas donde la orientación juega un papel importante).

En particular, el signo de [math] \ det [/ math] mide la orientación de [math] (A_1, A_2, \ ldots, A_n) [/ math] con respecto al marco estándar [math] (e_1, e_2, \ ldots e_n) [/ matemáticas].

Las propiedades 1) -4) definen el determinante sin ambigüedad.

Por ejemplo, quiero calcular [math] \ delta = \ det \ begin {pmatrix} a_ {11} & a_ {12} \\ a_ {21} & a_ {22} \ end {pmatrix} [/ math] o en nuestra notación [matemáticas] \ delta = \ det (a_ {11} e_1 + a_ {21} e_2, a_ {12} e_1 + a_ {22} e_2). [/matemáticas]

Luego por propiedad 4):

[matemáticas] \ delta = \ det (a_ {11} e_1, a_ {12} e_1) + \ det (a_ {21} e_2, a_ {12} e_1) [/ matemáticas] [matemáticas] + \ det (a_ { 11} e_1, a_ {22} e_2) + \ det (a_ {21} e_2, a_ {22} e_2). [/matemáticas]

Por propiedad 3):

[matemáticas] \ det (a_ {11} e_1, a_ {12} e_1) = a_ {11} a_ {12} \ det (e_1, e_1) \ overset {\ text {2)}} {=} 0. [/matemáticas]

Igualmente:

[matemáticas] \ det (a_ {12} e_2, a_ {22} e_2) = 0. [/matemáticas]

Por propiedades 3), (+), 1):

[matemáticas] \ det (a_ {21} e_2, a_ {12} e_1) = a_ {21} a_ {12} \ det (e_2, e_1) = -a_ {12} a_ {21}. [/matemáticas]

Por propiedades 3), 1):

[matemáticas] \ det (a_ {11} e_1, a_ {22} e_2) = a_ {11} a_ {22} \ det (e_1, e_2) = a_ {11} a_ {22}. [/ matemáticas]

Así obtenemos [math] \ delta = a_ {11} a_ {22} -a_ {12} a_ {21}. [/ Math]

Si generaliza este enfoque para una [matemática] n \ in \ mathbf {N} [/ matemática] arbitraria, obtendrá una fórmula misteriosa para muchas con la suma de todas las permutaciones, que a menudo se utiliza para definir determinantes pero provoca preguntas como la suya.

Y, finalmente, existe la desigualdad de Hadamard que corrobora la naturaleza geométrica del determinante en el espacio euclidiano.
Afirma :

[matemáticas] | \ det (A_1, A_2, \ ldots A_n) | \ leq || A_1 || \ cdot || A_2 || \ cdot \ ldots \ cdot || A_n || [/matemáticas],
donde [matemáticas] || \ cdot || [/ math] es la norma euclidiana.

Geométricamente, solo significa que el volumen del paralelepípedo no es mayor que el volumen del cuboide (es decir, una caja) con bordes de las longitudes del paralelepípedo.

Algunos podrían argumentar que los determinantes no tenían una base lógica ni intuitiva.

Dicho esto, hay una interpretación geométrica del determinante de una matriz. Una matriz cuadrada nxn representa una asignación de [math] \ mathbb {R} ^ n [/ math] a sí misma. Considere la unidad “n-cube”. Este es el “volumen n” definido por los n vectores de unidad mutuamente perpendiculares [math] e_i [/ ​​math]. En 2 dimensiones es una unidad cuadrada con un vértice en el origen; en 3 dimensiones es un cubo unitario, etc. la imagen de este “n-cubo” bajo la transformación definida por la matriz tiene un volumen [matemático] V [/ matemático], que resulta ser igual al determinante de la matriz .

La mayoría de las veces, sin embargo, los determinantes aparecen simplemente porque son herramientas informáticas útiles. Por ejemplo, el inverso de una matriz cuadrada tiene un factor previo que es [math] (\ mathrm {det} A) ^ {- 1} [/ math].

En particular, Sheldon Axler, autor del artículo “Down With Determinants” y el libro “Linear Algebra Done Right” tiene fuertes sentimientos de que los determinantes no deben usarse en un curso introductorio sobre álgebra lineal. [1] No son intuitivos y aparentemente arbitrarios para los recién llegados al tema y su uso en derivaciones como el polinomio característico de los valores propios le roba al estudiante una visión profunda del álgebra lineal que viene con un enfoque alternativo.

[1] No puedo hablar por Axler, pero, según el prefacio de su texto, parece que puede tener una visión ligeramente más matizada. Los determinantes deben usarse en los cursos introductorios como lo son actualmente, pero aquellos estudiantes que realmente quieran entender el tema a fondo deberían tomar un segundo curso en el que los determinantes no juegan ningún papel, como el que describe en su libro de texto.

De determinante

Una matriz ℳ representa una secuencia de operaciones + y × . Al final, ha transformado linealmente un espacio (lo cortó, lo expandió, lo giró, pero mantuvo el origen donde está).
¿Cambió la cantidad de cosas en la imagen cuando hiciste eso? Si mantuviste todo en proporción, det | ℳ | = 1. Si no es así, det | ℳ | ≠ 1.
Si la cantidad de cosas aumentó en un 10%, det | ℳ | = 1.1. Si efectivamente redujo la imagen a la mitad, det | ℳ | = .5. Y así.
El determinante | ℳ | es el cambio en el volumen después de la transformación lineal.
Esta metáfora se extiende a 3-D y más allá.

  • Si el agua fluye linealmente en una corriente, entonces | ℳ | necesita ser 1, o de lo contrario se estaría creando agua (materia).
  • Si el dinero fluye linealmente en un sistema económico de mil millones de dimensiones, entonces | ℳ | es de esperar un poco por encima de 1, si se está creando un valor. (Los bancos centrales necesitan imprimir | ℳ | veces más dinero para evitar la deflación).
  • Y el espacio de fase de un sistema dinámico lineal de cien dimensiones crece en | ℳ | a cada paso

Cambio en el volumen. Le dice cómo se cambia un volumen unitario por la transformación representada por la matriz. Si comienza a pensar en cómo le gustaría que se viera una función de volumen, por ejemplo, cambie el signo de un vector (fila) y lo niega, escala, qué sucede cuando algunos de los vectores dependen linealmente entre sí … terminar con una fórmula que se parece al determinante. Por supuesto, como consecuencia, usted espera que sea invariable bajo rotaciones y otras transformaciones ortonormales.

Daré una explicación elemental por la cual el determinante cero implica la no invertibilidad. Limitaré mi discusión a matrices 2 × 2, ya que allí el razonamiento es más transparente. Para las matrices de rango superior, la discusión es similar, pero algunos detalles están más involucrados.

Para comprender qué representa el determinante, considere un sistema lineal de ecuaciones

[matemáticas]
\ begin {array} {l}
ax + by = e \\
cx + dy = f
\ end {array}
[/matemáticas]

donde [math] a, b, c, d, e, f [/ math] son ​​conocidos, y [math] x, y [/ math] son ​​incógnitas que necesitamos encontrar. Ahora estas ecuaciones también se pueden escribir como

[matemáticas]
MX = E
[/matemáticas]

dónde

[matemáticas] \ begin {array} {l}
M = \ begin {pmatrix}
a & b \\
discos compactos
\ end {pmatrix} \\
X = \ begin {pmatrix} x \\ y \ end {pmatrix} \\
E = \ begin {pmatrix} e \\ f \ end {pmatrix}
\ end {array}
[/matemáticas]

así que ahora, si pudiera encontrar la inversa [matemática] M ^ {- 1} [/ matemática] de [matemática] M [/ matemática], entonces simplemente puedo escribir la solución como

[matemáticas]
X = M ^ {- 1} E
[/matemáticas]

Entonces, encontrar una solución única del sistema original de ecuaciones es equivalente a encontrar la matriz inversa. Ahora la pregunta es, ¿cuándo es posible encontrar una solución o encontrar una solución única *?

Bueno, hay dos casos distintos cuando esto no es posible

1. El sistema de ecuaciones está sobredeterminado
2. El sistema de ecuaciones no tiene solución

Si el sistema de ecuaciones está sobredeterminado, eso significa que ambas ecuaciones se reducen a la misma ecuación. Esto a su vez significa que puedo multiplicar la segunda ecuación (o la primera, pero para mayor claridad tomamos la segunda) por algún número y obtener la primera. Llamemos a este número “n”. Por eso tenemos eso

[matemáticas] a = nc, b = nd, e = nd [/ matemáticas]

En el caso de que el sistema de ecuaciones no tenga una solución, significa que la segunda ecuación puede multiplicarse por algún número, de modo que su lado izquierdo se parece a la primera ecuación, pero su lado derecho es diferente y, por lo tanto, son inconsistentes, por lo que tenemos

[matemáticas] a = nc, b = nd [/ matemáticas]

Entonces, en ambos casos, 1. y 2. cuando no se puede encontrar una solución única (y, por lo tanto, la inversa de [matemática] M [/ matemática]), es posible escribir [matemática] a = nc, b = nd [ / math], donde [math] n [/ math] es algún número.

Pero, ¿cómo planteamos esto como un criterio sin la necesidad de introducir un número arbitrario [matemáticas] n [/ matemáticas]? Bueno, simple, solo divide la ecuación [matemática] a = nc [/ matemática] por [matemática] b = nd [/ matemática] y, por algún álgebra trivial, obtienes

[matemáticas]
ad-bc = 0
[/matemáticas]

Entonces, un criterio de que una matriz [matemática] M = \ begin {pmatrix} a & b \\ c & d \ end {pmatrix} [/ math] es no invertible (es decir, singular) es si la cantidad [math] ad-bc = 0 [/matemáticas]. Esta cantidad se denomina determinante de una matriz 2 × 2.

Para matrices de rango superior, la historia es similar. Los sistemas son más grandes, y la única forma de encontrar soluciones únicas es no tener un sistema de ecuaciones sobredeterminado o inconsistente, lo que equivale a que sus lados izquierdos no sean una combinación lineal entre sí. Esta es exactamente una de las propiedades de una cantidad que definimos como determinante, lo que explica su utilidad como criterio para encontrar un inverso de una matriz.

Por supuesto, los determinantes resultan útiles para algo más que el criterio de si la matriz es invertible, pero su utilidad es a menudo como una herramienta técnica, en lugar de intuitiva. Hay dos ejemplos en física que vienen a la mente donde hay intuición detrás del determinante. En la mecánica cuántica, se puede construir una función de onda de muchos cuerpos de fermiones que no interactúan a partir del llamado determinante Slater. En la teoría de campos cuánticos, la integración de los campos fermiónicos produce un coeficiente con el determinante del llamado operador Dirac, que tiene una interpretación como fluctuaciones cuánticas de fermiones virtuales.

Espero que esto haya sido útil.

La interpretación depende de cuál sea el uso del sistema lineal. Si lo piensa como un conjunto de ecuaciones lineales para resolver, el determinado determina si hay una solución única; si el determinante es distinto de cero, entonces lo hay, de lo contrario no lo es, si el determinante es cero (la matriz es singular ), al menos una de sus ecuaciones depende linealmente de las demás y no contiene información adicional sobre las variables.

Sin embargo, los determinantes aparecen en miles de aplicaciones diferentes, y la interpretación puede variar enormemente. El volumen encerrado por una operación lineal de una matriz M en un volumen unitario es una interpretación común, y en física, el determinante (funcional) puede usarse como un atajo para calcular las contribuciones de un bucle en las teorías de campo cuántico.

Para una matriz de transformación real, el determinante actúa esencialmente como un factor de escala. Entonces, si tiene una transformación 3 × 3 y la aplica a los vértices de algún objeto, el determinante le dirá cómo crece o se reduce el volumen. Ejemplos notables serían un determinante de 1 para las transformaciones de rotación, y -1 para las reflexiones (con rotación opcional). El hecho de que una matriz con determinante 0 no tenga inversa puede considerarse como una generalización de la división por cero para números reales.

Creo que la definición es la interpretación más intuitiva. El determinante es una función de una matriz que sigue las siguientes propiedades:
– [matemáticas] det (I) = 1 [/ matemáticas]. El determinante de una matriz de identidad es siempre 1.
– Si toma una matriz A e intercambia dos filas para obtener [matemáticas] \ tilde {A} [/ matemáticas], entonces [matemáticas] det (\ tilde {A}) = – det (A) [/ matemáticas], es decir, el determinante simplemente cambiará de signo.
– Si toma una matriz A y multiplica cualquier fila por un escalar c para obtener [matemática] \ tilde {A} [/ matemática], entonces [matemática] det (\ tilde {A}) = c \ cdot det (A) [/matemáticas]. es decir, el determinante es lineal con cada fila individual de la matriz.

Resulta que no solo un determinante sigue estas reglas (por definición), sino que también es la función * única * de una matriz que puede seguir estas reglas. Además, no es muy difícil obtener muchas otras propiedades con las que podría estar más familiarizado. Por ejemplo, puede deducir que el determinante es invariante para una transposición, que un determinante de una matriz triangular es solo el producto de los elementos diagonales, que el determinante de una matriz singular es siempre 0 y muchas cosas más útiles.

Esto podría no ser una respuesta directa: no he explicado ninguna interpretación del determinante. Si eso es lo que está buscando, entonces no puedo responderle, y creo que la respuesta es muy difícil de determinar. Mi sugerencia es la siguiente: el determinante de una matriz es solo un número que está directamente relacionado con muchas otras propiedades de la matriz que se interpretan más fácilmente (singularidad, valores propios, rango, etc.).

PD. Puede encontrar un capítulo completo sobre los determinantes en el libro de Gilbert Strang “Introducción al álgebra lineal”.

Esta es una gran aplicación para el svd: let
[matemáticas]
A = USV ‘[/ matemáticas]
Donde A es la matriz original y U y V son unitarios con S diagonal con entradas distintas de cero que son los valores singulares. Entonces
[matemáticas]
det (A) = det (USV ‘) = det (U) det (S) det (V’) \\ = det (S) = \ prod_ {i = 1} ^ N s_i.
[/matemáticas]
Así que ahora suponga que tiene un cubo de longitud 1 en cada dimensión en el espacio x. Entonces, y = Ax sea el mapeo de cada punto dentro de este cubo de N espacio a N espacio. ¿Cuál es el volumen del cubo expresado en y? Bueno, U y V simplemente giran sin cambios en el volumen. Ahora cada valor singular comprime o expande el volumen y el resultado es el producto que se muestra arriba. ¡Juego terminado!

Espero que esto ayude

Se puede considerar como “cuánto espacio” ocupa.

Para una matriz bidimensional, da una indicación del área del paralelogramo cuyos bordes son los vectores componentes de esa matriz.

Para un tridimensional, el volumen del paralelepípedo, etc.

¡Puedo estar equivocado en cuyo caso, alguien me corrige rápidamente!