Permítanme comenzar diciendo que la pregunta es errónea, por dos razones diferentes.
- Las reflexiones también están representadas por matrices ortogonales.
- En dimensiones superiores, es útil hacer una distinción entre “rotaciones” y “movimientos rígidos”.
El primer problema se puede prescindir fácilmente: solo debemos mirar las matrices ortogonales del determinante 1, las “matrices ortogonales especiales”. Este grupo de matrices se denota típicamente por [math] SO (n) [/ math].
El segundo problema es de alguna manera más fundamental. ¿Qué queremos decir con rotación?
Rotaciones En dos dimensiones, espero que todos podamos acordar qué es una rotación. Está dada por una matriz de rotación [matemática] R (\ theta) [/ matemática], que gira el plano alrededor del origen en algún ángulo [matemática] \ theta [/ matemática].
En tres dimensiones, una rotación es algo que fija un eje y gira alrededor de ese eje.
Teorema 1. Si [math] M [/ math] es una matriz ortogonal real [math] 3 \ times 3 [/ math] con determinante 1, entonces hay una base ortonormal de [math] \ mathbb {R} ^ 3 [ / math] tal que [math] M [/ math] toma la forma
[matemáticas] \ begin {pmatrix} 1 & 0 \\\\ 0 & R (\ theta) \ end {pmatrix} [/ math]
Por lo tanto, en la dimensión 3, las rotaciones y las matrices ortogonales especiales son lo mismo.
(Discutiré la prueba del teorema al final de la respuesta).
¡En dimensiones superiores, ningún teorema análogo es verdadero! Por ejemplo, aquí hay una matriz ortogonal especial [matemática] 4 \ veces 4 [/ matemática]:
[matemáticas] \ begin {pmatrix} R (\ theta) & 0 \\\\ 0 & R (\ psi) \ end {pmatrix} [/ math]
Para las elecciones apropiadas de [math] \ theta, \ psi [/ math], esta matriz no tiene valores propios reales. No está “girando” alrededor de ningún vector fijo. Los dos primeros componentes de un vector y los dos últimos componentes de un vector giran simultáneamente de manera independiente. La matriz es una composición de dos rotaciones, cada una fijando un subespacio bidimensional, pero tal vez no deberíamos llamar a la matriz en sí misma una rotación.
Movimientos rígidos. Si la matriz [matemática] 4 \ veces 4 [/ matemática] anterior no es algo con lo que nos sentimos cómodos llamando una rotación basada en nuestra experiencia en el espacio tridimensional, entonces, ¿qué es?
Dado que 3 espacios es fácil de visualizar, imagine que comenzamos con la base ortonormal estándar de [math] \ mathbb {R} ^ 3 [/ math]. Siéntase libre de sacar los dedos como un idiota: eso es lo que estoy haciendo ahora.
Un movimiento rígido es el resultado final de lo que sucede cuando mantiene los dedos fijos (rígidos) y mueve la muñeca como lo desee (movimiento).
Una matriz ortogonal especial [matemática] n \ veces n [/ matemática] [matemática] M \ en SO (n) [/ matemática] tiene columnas que son una base ortonormal, “orientada positivamente” para [matemática] \ mathbb {R } ^ n [/ matemáticas]. El hecho “orientado positivamente” significa esencialmente que una versión de mayor dimensión de la regla de la derecha contiene: dados los vectores básicos [matemáticos] n-1 [/ matemáticos], hay un subespacio unidimensional ortogonal a su envergadura, y se prefiere una de las dos direcciones posibles para el vector [math] n [/ math] th. (Es solo la dirección que hará que la matriz resultante de los vectores de columna tenga el determinante 1).
Imagine que la posición inicial de nuestra mano es la base estándar de [math] \ mathbb {R} ^ 3 [/ math] (o [math] \ mathbb {R} ^ n [/ math] si su mano parece mucho más interesante que mía.) Esto corresponde a la matriz de identidad
[matemáticas] I \ en SO (n) [/ matemáticas].
Ahora empiezo a mover la muñeca a medida que varía el tiempo y a medida que cambia mi base ortonormal, obtengo un camino
[matemáticas] f (t): [0,1] \ a SO (n) [/ matemáticas]
tal que [matemáticas] f (0) = I [/ matemáticas]. Tenga en cuenta que dado que estoy moviendo mi mano continuamente, la “regla de la mano derecha” sigue siendo válida para mis nuevas bases del espacio euclidiano. Entonces, la base donde termino al final de dejar caer mi mano es la colección de vectores de columna de la matriz [matemática] A = f (1) [/ matemática].
Por definición, entonces, un movimiento rígido es solo la transformación lineal correspondiente a alguna de esas matrices [matemáticas] A [/ matemáticas]. Toma la base estándar del espacio euclidiano a la base dada por los vectores de columna.
Observe que una composición de dos rotaciones es un movimiento rígido. En términos más generales, una composición de dos movimientos rígidos es un movimiento rígido, ya que primero podemos mover nuestra mano con un movimiento rígido, luego imaginar el resultado como una nueva base estándar del espacio euclidiano y movernos de acuerdo con el segundo movimiento rígido.
Por último, aquí hay una versión precisa de la declaración en la pregunta, válida en todas las dimensiones.
Teorema 2. Una matriz [matemática] n \ veces n [/ matemática] [matemática] A [/ matemática] representa un movimiento rígido si y solo si es ortogonal especial.
Lo único necesario para demostrar esto es el hecho de que el espacio [matemático] SO (n) [/ matemático] de matrices ortogonales especiales está conectado : dada cualquier base orientada positivamente del espacio euclidiano con la matriz correspondiente [matemática] A [/ matemática ], es posible encontrar un camino
[matemáticas] f (t): [0,1] \ a SO (n) [/ matemáticas]
con [matemáticas] f (0) = I [/ matemáticas] y [matemáticas] f (1) = A [/ matemáticas]. Este hecho es estándar, pero está un poco más allá de una respuesta de Quora, por lo que te dejaré que lo busques.
Apéndice: bosquejo del teorema 1. La idea clave para probar este teorema es encontrar un vector propio con un valor propio de 1, que abarcará el “eje de rotación”. Esta parte de la prueba es algo interesante, así que déjame pasar por el argumento:
La matriz [matemática] M [/ matemática] tiene 3 valores propios con multiplicidad sobre los números complejos. Son las raíces del polinomio característico [matemático] p_M (x) [/ matemático], que es de grado 3 y tiene coeficientes reales. Como [math] M [/ math] es ortogonal, conserva la longitud de los vectores, y esto significa que los valores propios deben estar en el círculo unitario en el plano complejo. Al menos uno de los valores propios [math] \ lambda [/ math] debe ser real ya que cualquier polinomio cúbico tiene una raíz real según el Teorema del valor intermedio. Las otras dos raíces son conjuntas reales o complejas entre sí desde el polinomio cuadrático
[matemáticas] p_M (x) / (x- \ lambda) [/ matemáticas]
tiene coeficientes reales Si [math] z [/ math] se encuentra en el círculo de la unidad, entonces [math] z \ cdot \ overline {z} = 1 [/ math]. Finalmente, dado que [math] M [/ math] tiene el determinante 1, el producto de sus valores propios (que es igual al determinante) debe ser 1. Si [math] M [/ math] tiene un valor propio no real [math] z [/ math ], entonces concluimos
[matemáticas] \ lambda \ cdot z \ cdot \ overline {z} = 1 [/ matemáticas]
y entonces [math] \ lambda = 1 [/ math]. Por otro lado, si todos los valores propios de [matemática] M [/ matemática] son reales, entonces los tres valores propios deben ser [matemática] 1,1,1 [/ matemática] o [matemática] 1, -1, – 1 [/ matemáticas]; De cualquier manera hemos terminado.