Cómo probar esta ecuación matricial [math] \ nabla_ATr (ABA ^ TC) = CAB + C ^ TAB ^ T [/ math]

A2A, gracias.

Antes de entrar en esto, me gustaría hacer dos comentarios: (1) tales preguntas se ven mejor, no como preguntas sobre matrices, sino como preguntas sobre transformaciones lineales, y (2) esta pregunta se trata realmente de comprender el concepto de una derivada en los espacios de Banach (véase, por ejemplo, Cálculo de H. Cartan en espacios de Banach ), y esperar que el estudiante produzca esto usando entradas de matriz, sin haber cubierto el cálculo del espacio de Banach, no le enseña nada al estudiante.

Ahora, a la pregunta. Como mínimo, debe especificar los dominios y codominios de las transformaciones [matemáticas] A, B, C [/ matemáticas]. Además, en lugar de “matriz de transposición”, piense en “transformación dual”. Entonces, suponiendo que estas transformaciones sean tales que el siguiente cálculo sea significativo … 🙂

… hagamos primero las diferencias finitas:

[matemáticas] \ mbox {Tr} [(A + \ triángulo A) B (A ^ T + \ triángulo A ^ T) C] – \ mbox {Tr} [ABA ^ {T} C] =… [/ matemáticas]

Expanda esto y extraiga los términos lineales en [matemáticas] \ triángulo A [/ matemáticas] o en [matemáticas] \ triángulo A ^ {T} [/ matemáticas]:

[matemáticas] \ mbox {Tr} [AB (\ triángulo A ^ {T}) C] + \ mbox {Tr} [(\ triángulo A) BA ^ {T} C] [/ matemáticas]

Ahora, utilizaremos las propiedades (a) [matemáticas] \ mbox {Tr} (PQ) = \ mbox {Tr} (QP) [/ matemáticas], y (b) [matemáticas] \ mbox {Tr} S = \ mbox {Tr} S ^ {T} [/ math].

Por (a) ,

[matemáticas] \ mbox {Tr} [AB (\ triángulo A ^ {T}) C] = \ mbox {Tr} [CAB (\ triángulo A ^ {T})] [/ matemáticas].

Por (b) ,

[matemáticas] \ mbox {Tr} [(\ triángulo A) BA ^ {T} C] = \ mbox {Tr} [C ^ {T} AB ^ {T} (\ triángulo A ^ {T})] [/ matemáticas].

Cada una de estas expresiones puede y debe verse como un mapeo lineal que actúa sobre el vector [matemáticas] \ triángulo A [/ matemáticas], y esta vista nos da el resultado deseado.

Con notación de índice:

[matemáticas] \ nabla_ATr (ABA ^ TC) = \ frac {\ partial} {\ partial A_ {ml}} \ left (A_ {ij} B_ {jk} A_ {sk} C_ {si} \ right) = \ delta_ {mi} \ delta_ {lj} B_ {jk} A_ {sk} C_ {si} + A_ {ij} B_ {jk} \ delta_ {sm} \ delta_ {lk} C_ {si} [/ math]

Puedes hacer el resto pero funciona.

[matemáticas] Tr ((A + \ epsilon H) B (A + \ epsilon H) ^ TC) = Tr (ABA ^ TC) + \ epsilon (Tr (HBA ^ TC) + Tr (ABH ^ TC)) + \ epsilon ^ 2… = Tr (ABA ^ TC) + \ epsilon (Tr (BA ^ TC H) + Tr (CAB H ^ T)) +… = Tr (ABA ^ TC) + \ epsilon Tr ((CAB + C ^ TAB ^ T) H ^ T) +… [/ matemáticas]

Si bien no estoy seguro de cuál es su definición de gradiente (¿está utilizando la norma Frobenius para pasar de formas diferenciales a campos vectoriales?), Este debería ser el cálculo clave. El punto es que para encontrar el gradiente necesita ver qué sucede con el primer orden a medida que cambia su variable.