¿Cuál es el equivalente a la matriz de identidad para tensores de orden superior?

Existe un Tensor de identidad de modo, [math] \ mathcal {I} _m [/ math], que es análogo a la identidad de matriz, I. Hay un tensor de identidad asociado con cada modo de tensor (eje tensorial).

Puede parecer peculiar tener múltiples tensores de identidad; sin embargo, uno debe recordar que en el álgebra lineal, existen matrices de identidad izquierda y derecha para cada matriz rectangular A con filas [matemáticas] R [/ matemáticas] y columnas [matemáticas] C [/ matemáticas] ( A [matemáticas] \ en \ mathbb {C} ^ {R} \ times ^ {C}) [/ math]. Mientras que las matrices de identidad izquierda y derecha tienen diferentes dimensiones, comparten la misma estructura diagonal. Por el contrario, los tensores de identidad de modo m no son tensores diagonales.

Aquí hay una figura que ilustra la estructura de los tres tensores de identidad de modo-m de orden 3. Hay una [matemática] 1 [/ matemática] en cada ubicación azul y [matemática] 0 [/ matemática] de lo contrario.

(Imagen y texto Copyright M. Alex O. Vasilescu)

Un tensor de identidad mode-m , [math] \ mathcal {I} _m [/ math], deja un tensor, [math] \ mathcal {A}, [/ math] sin cambios cuando se multiplica modem, [math] × m , [/ math] donde [math] 1 \ le m \ le M [/ math]. El tensor de identidad de modo-m surgió del resultado de modo-m multiplicando un tensor con su tensor pseudo-inverso de modo-m.

La definición formal de un tensor de identidad de modo m es análoga a la definición de identidad de matriz.

Definición ( matriz de identidad ) La matriz I es una matriz de identidad multiplicativa, si y solo si

    • IA = A donde A [matemática] \ en \ mathbb {C} ^ {I_1 × I_2} [/ matemática] e I [matemática] \ en \ mathbb {R} ^ {I_1 × I_1}. [/ Matemática]

El tensor de definición ( tensor de identidad de modo ) [math] \ mathcal {I} _m [/ math] es un tensor de identidad multiplicativo mode-m, si y solo si

    • [matemática] \ matemática {I} _m \ veces_m \ matemática {A} = \ matemática {A} [/ matemática],

donde [math] \ mathcal {A} \ in \ mathbb {C} ^ {I_1 ×… × I_m ×… × I_M} [/ math] y [math] \ mathcal {I} _m \ in \ mathbb {R} ^ {I_1 ×… × I_ {m − 1} × J_m × I_ {m + 1} ×… × I_M} [/ math], donde [math] J_m = I_1I_2. . . I_ {m − 1} I_ {m + 1}. . . I_M [/ matemáticas].

Propiedad del tensor de identidad de modo: una multiplicación por módem de [math] \ mathcal {I} _m [/ math] con una matriz o un vector de fila da como resultado una versión tensorizada de la matriz / vector original. No cambia los valores de la matriz / vector, sino que simplemente reordena sus elementos. En particular, puede volver a tensorizar una matriz, A [matemática] _ {[m]}, [/ matemática] que se obtuvo mediante la matriz de un tensor, [matemática] \ matemática {A}. [/ matemáticas] Por lo tanto,

    • [matemática] \ matemática {I} _m \ veces_m [/ matemática] A [matemática] _ {[m]} [/ matemática] = [matemática] \ matemática {A}. [/ matemática]

Referencias
[1] MAO Vasilescu y D. Terzopoulos, “Proyección multilineal para el reconocimiento basado en la apariencia en el marco tensorial”, Proc. Undécima Conf. Internacional IEEE on Computer Vision (ICCV’07) , Río de Janeiro, Brasil, octubre de 2007, 1-8.
http://www.media.mit.edu/~maov/m…

[2] MAO Vasilescu, “Proyección multilineal para reconocimiento facial mediante descomposición canónica”, en Proc. Cara y gesto Conf. (FG’11), 476-483.

Las siguientes respuestas proporcionan ejemplos concretos con ilustraciones de tensores y descomposición de tensores de datos:

  • ¿Cuál es todo el alboroto actual sobre la descomposición y análisis del tensor de datos? Análisis de datos y perspectiva histórica.
  • ¿Cómo se utilizan los métodos tensoriales en la visión por computadora y el aprendizaje automático?
  • ¿Cuál es la diferencia entre una “matriz de datos” y una matriz (operador de matriz), o un “tensor de datos” y un tensor (operador de tensor)?
  • ¿Cuáles son las descomposiciones de tensor equivalentes a la matriz SVD?
    Diferencias esenciales: Tucker vs. Candecomp / descomposiciones de tensor Parafac
  • ¿Hay ejemplos concretos para comprender SVD de orden superior (descomposición de Tucker)?

La matriz de identidad es un tensor de tipo (1,1) que actúa sobre un vector o codificador para devolver el mismo vector o codificador,

[matemáticas] \ delta ^ a_b v_a = v_b [/ matemáticas]
[matemáticas] \ delta ^ a_b v ^ b = v ^ a [/ matemáticas]

Una matriz de “identidad de rango superior” debería ser un objeto que actúe sobre un tensor de rango n para devolver el mismo tensor de rango n. Por ejemplo, si n = 2 entonces

[matemáticas] T ^ {ab} {} _ {cd} U_ {ab} = U_ {cd} [/ matemáticas]
[matemáticas] T ^ {ab} {} _ {cd} U ^ {cd} = U ^ {ab} [/ matemáticas]

Está claro que dicho objeto debe tomar la forma

[matemáticas] T ^ {ab} {} _ {cd} = \ delta ^ a_c \ delta ^ b_d [/ matemáticas]

es decir, el producto tensorial de n matrices de identidad.

Los tensores en el espacio [math] M_n (\ mathbb {C}) ^ {\ otimes d} [/ math] pueden considerarse como matrices indexadas por pares [math] (I, J) [/ math] donde [math] I [/ math] y [math] J [/ math] son ​​conjuntos de índices [math] I = (i_1, \ dots, i_d), J = (j_1, \ dots, j_d), [/ math] con [math] 1 \ leq i_k, j_k \ leq n. [/ math] Este espacio tiene una base ortonormal [math] \ {e_ {I, J} | I, J \} [/ math] y el tensor de identidad sería [math] \ sum_I e_ {I, I}. [/matemáticas]