¿Por qué es tan importante la forma canónica de Jordan?

Hay tres leyes fundamentales para el álgebra lineal:

1.) Nunca escriba una base.
2.) NUNCA escriba una base.
3.) Si tiene que escribir una base, elija algo que simplifique su problema lo más posible.

Todo lo que definas en álgebra lineal debe ser coordinado independiente. ¿Por qué? Porque las coordenadas son una muleta. Son una elección arbitraria que usted hace si realmente lo necesita, pero dado que son una elección arbitraria, nada de lo que mire debería depender de ellos de ninguna manera. Nos preocupamos por el determinante y la traza de una matriz porque son invariantes: permanecen igual si decidimos mover todo a una base diferente.

Esto plantea la pregunta de cómo las transformaciones lineales se transforman bajo un cambio de base. Consideremos un mapa de [math] \ mathbb {R} ^ n [/ math] a sí mismo. Sabemos que si elegimos una base [math] (x_1, \ ldots, x_n) [/ math] podemos escribir esto como una matriz cuadrada [math] n \ times n [/ math], que llamaremos [math] L [/ matemáticas].

Ahora, supongamos que elegimos una nueva base [matemática] (y_1, \ ldots y_n) = M (x_1, \ ldots x_n) [/ math] (aquí [math] M [/ math] será una transformación lineal invertible— es decir, matriz). ¿Cómo escribimos [matemáticas] L [/ matemáticas] en esta nueva base?

Bueno, una forma en que podríamos determinar qué hace [math] L ‘[/ math] es tomar nuestro vector [math] v [/ math] en nuestro nuevo sistema de coordenadas, transformarlo nuevamente en nuestro sistema de coordenadas original como [math] ] M ^ {- 1} v [/ math], aplica [math] L [/ math] a eso (entonces tenemos [math] LM ^ {- 1} v [/ math]), y finalmente transforma de nuevo a nuestro nuevo sistema de coordenadas, dando [matemáticas] MLM ^ {- 1} v [/ matemáticas]. O, en otras palabras:

[matemáticas] L ‘= MLM ^ {- 1} [/ matemáticas]

Si esto le resulta familiar, debería serlo. Así es exactamente como se ve la forma canónica de Jordan: tienes una matriz [matemática] L ‘[/ matemática] que te gustaría descomponer, tienes algún cambio de matriz base [matemática] M [/ matemática] y tienes un (con suerte más simple) matriz [matemáticas] L [/ matemáticas] que representa su transformación lineal, solo en un mejor sistema de coordenadas.

Ahora, finalmente puedo explicar lo que está haciendo la forma canónica de Jordan: le permite clasificar todas las transformaciones lineales hasta un cambio de coordenadas. Entonces, por ejemplo, para transformaciones lineales en [math] \ mathbb {C} ^ 2 [/ math], en realidad solo hay dos clases de transformación:

[matemáticas] \ begin {pmatrix} \ lambda_1 & \\ & \ lambda_2 \ end {pmatrix} [/ math] o [math] \ begin {pmatrix} \ lambda & 1 \\ & \ lambda \ end {pmatrix} [/ matemáticas].

Eso es. No hay nada más, no existe. Siempre que elija sus coordenadas correctamente, nunca tendrá que lidiar con nada más complicado. Es una noticia fantástica para las aplicaciones, sin duda, pero también tiene consecuencias teóricas.

EDITAR: Como se ha señalado en los comentarios, en general no querrá usar la forma canónica de Jordan para aplicaciones debido a la inestabilidad (pequeños cambios en los parámetros que producen grandes cambios en los resultados). Supongo que es por eso que los matemáticos teóricos suelen estar más entusiasmados con este resultado.

Digamos que desea calcular el exponencial de una matriz. En primer lugar, ¿qué significa eso? Bueno, sabemos que [matemáticas] e ^ x = 1 + x + x ^ 2/2 + x ^ 3/3! + \ ldots [/ math], y no hay razón para que no podamos escribir [math] e ^ L = I + L + L ^ 2/2 + L ^ 3/3! + \ ldots [/ math].

Ahora, calcular esto es bastante difícil, ya que tienes que determinar qué [matemática] L ^ n [/ matemática] es para cada [matemática] n [/ matemática]. Ay.

Ah, pero ahora viene la belleza de la forma canónica de Jordan. Uno verifica que el exponencial sea invariante bajo transformaciones de coordenadas, es decir, [matemática] e ^ {MLM ^ {- 1}} = Me ^ {L} M ^ {- 1} [/ matemática]. Sabiendo esto, el problema se vuelve fácil: transforma tu matriz en la forma canónica de Jordan, donde calcular [matemática] L ^ n [/ matemática] es muy, muy simple, calcula [matemática] e ^ L [/ matemática] allí, y luego transforma espalda.

Como ejemplo: [matemáticas] \ begin {pmatrix} 4 & -6 \\ 1 & -1 \ end {pmatrix} = \ begin {pmatrix} 3 & 2 \\ 1 & 1 \ end {pmatrix} \ begin {pmatrix } 2 & \\ & 1 \ end {pmatrix} \ begin {pmatrix} 3 & 2 \\ 1 & 1 \ end {pmatrix} ^ {- 1} [/ math].

[matemáticas] e ^ {\ begin {pmatrix} 2 & \\ & 1 \ end {pmatrix}} = I + \ begin {pmatrix} 2 & \\ & 1 \ end {pmatrix} [/ math]
[matemáticas] + \ begin {pmatrix} 2 ^ 2/2 & \\ & 1/2 \ end {pmatrix} + \ begin {pmatrix} 2 ^ 3/3! & \\ & 1/3! \ end {pmatrix} + \ ldots [/ math] [math] = \ begin {pmatrix} e ^ 2 & \\ & e \ end {pmatrix} [/ math]

Así que finalmente:
[matemáticas] e ^ {\ begin {pmatrix} 4 y -6 \\ 1 & -1 \ end {pmatrix}} [/ math]
[math] = \ begin {pmatrix} 3 & 2 \\ 1 & 1 \ end {pmatrix} \ begin {pmatrix} e ^ 2 & \\ & e \ end {pmatrix} \ begin {pmatrix} 3 y 2 \\ 1 & 1 \ end {pmatrix} ^ {- 1} [/ math]
[matemáticas] = \ begin {pmatrix} 3e ^ 2 – 2 e & 6e – 6e ^ 2 \\ -e + e ^ 2 & 3e -2e ^ 2 \ end {pmatrix} [/ math]

Aprendí álgebra lineal de Halmos también, pero realmente no entendí su importancia hasta que estudié mecánica cuántica, lo cual es un poco irónico porque fue el asesor de Halmos von Neumann quien puso la mecánica cuántica sobre una base matemática sólida. (Con eso no me refiero a la teoría cuántica de campos, solo a la mecánica cuántica).

En la mecánica cuántica, los números, como la posición y el momento, se reemplazan por operadores, es decir, transformaciones lineales, a veces en espacios de dimensión finita y a veces en espacios de dimensión infinita. En cierto sentido, lo que esto significa es que el universo usa una matemática donde los “números verdaderos” son matrices u operadores, aunque admito advertencias obvias y no estoy tratando de ser preciso.

Bueno, una de las cosas que puede hacer con un número real o complejo es aplicarle una función. Si tiene un número complejo z puede calcularlo exponencial, ect. Bueno, la forma de Jordan realmente se basa en la aplicación de funciones diferenciables de una variable compleja a una matriz. Ahora, el exponencial de una matriz es una cosa importante y útil. De hecho, te da la solución a la ecuación de Schrodinger en mecánica cuántica. [Advertencia: los operadores que expones en mecánica cuántica son todos autoajustados, por lo que puedes usar el teorema espectral y no la forma de Jordan].

Suponga que tiene un bloque J de Jordan con un valor propio lamda y una cadena de unos encima de él. Bueno, si aplicas un polinomio P a J, lo que obtienes es P (lamda) en la diagonal, P ‘(lamda) en el superdiagonal, P’ ‘(lamda) / 2 en la diagonal por encima de eso, ect. Lo que esto significa es que si toma la exponencial de una matriz, debe hacer lo mismo, donde las derivadas son las derivadas complejas que estudiará cuando tome un curso sobre análisis complejo.

Entonces, la forma de Jordan te dice que P (matriz), donde P es tu polinomio, depende solo de los valores de P y de un cierto número de derivadas (dependiendo de la longitud de la cadena de 1) en los valores propios. [Convención: el polinomio P (x) = 1 aplicado a una matriz se interpreta como que devuelve la matriz de identidad.] Puede ver esto como una declaración sobre la forma de Jordan o sobre los valores propios.

Una cosa interesante es que P (matriz) parece una cosa perfectamente continua, ¡pero la longitud de las cadenas de 1 en los bloques de Jordan no lo es! De hecho, cualquier matriz está arbitrariamente cerca de las matrices diagonales. Si ve la forma de Jordan como realmente una declaración de cómo los polinomios actúan sobre las matrices, este interesante ejercicio ayuda a eliminar la paradoja de por qué una cosa discontinua debería ser tan útil en problemas que no se ven discontinuos:

Ejercicio: demuestre que P de la matriz 2 x 2 {{a, 1}, {0, b}} viene dada por la matriz 2 x 2

{{P (a), (P (a) -P (b)) / (ab)}, {0, P (b)}}.

En otras palabras, la dependencia de a y b en la entrada diagonal anterior es un cociente de diferencia que pasa a la derivada. Lo que esto significa en la práctica es que si uno quiere aproximar f (matriz), donde f es una función compleja diferenciable, por P (matriz), entonces es mejor asegurarse de que P y suficientes derivados interpolen f en los valores propios. Aquí “suficientemente muchos” significa siempre que la cadena Jordan más larga de 1’s.

El teorema espectral para las matrices autoadjuntas es de un sabor similar, pero dice que cuando se extiende un polinomio o función f: R-> R a matrices autoadjuntas, solo importa el valor de la función en los valores propios. En particular, a uno no le importan los valores de las derivadas de la función en los valores propios.