¿Qué es contravariante y covariante (vector, tensor) en lenguaje simple?

Primero, comencemos con algunas notas introductorias.

Deje [math] \ left (x ^ 1, x ^ 2, \ text {…}, x ^ n \ right) [/ math] y [matemáticas] \ left (\ bar {x} ^ 1, \ bar {x} ^ 2, \ text {…}, \ bar {x} ^ n \ right) [/ math] ser las coordenadas de un punto en dos marcos de referencia.
Supongamos que hay n relaciones independientes entre las coordenadas de los dos sistemas dadas por:
[matemáticas] \ bar {x} ^ j = \ bar {x} ^ j \ left (x ^ 1, x ^ 2, \ text {…}, x ^ n \ right) [/ math]

Por el contrario, un conjunto único [matemático] \ left (x ^ 1, x ^ 2, \ text {…}, x ^ n \ right) [/ math] corresponde a cada conjunto de coordenadas [matemática] \ left (\ bar {x} ^ 1, \ bar {x} ^ 2, \ text {…}, \ bar {x} ^ n \ right) [/ math] , dada por :
[matemáticas] x ^ j = x ^ j \ left (\ bar {x} ^ 1, \ bar {x} ^ 2, \ text {…}, \ bar {x} ^ n \ right) [/ math]

Las relaciones anteriores definen una transformación de coordenadas de un marco de referencia a otro.

Suponga que n cantidades [matemáticas] T ^ 1, \ text {…}, T ^ n [/ matemáticas] en un sistema de coordenadas
[matemática] \ left (x ^ 1, x ^ 2, \ text {…}, x ^ n \ right) [/ math] están relacionados con n otras cantidades [matemática] \ bar {T} ^ 1, \ text {…}, \ bar {T} ^ n [/ matemática] en un sistema de coordenadas [matemáticas] \ left (\ bar {x} ^ 1, \ bar {x} ^ 2, \ text {…}, \ bar {x} ^ n \ right) [/ math] por las ecuaciones de transformación:

Estos se llaman componentes de un vector contravariante o tensor contravariante de rango u orden uno. De hecho, los vectores son tensores de rango uno (y los escalares son tensores de rango cero).

Para [matemática] j = 1,2,3 [/ matemática] y [matemática] k = 1,2,3 [/ matemática], las ecuaciones anteriores se pueden ampliar de la siguiente forma:

Las imágenes de las ecuaciones expandidas anteriores están tomadas de un antiguo sitio web mío:
Tensores

Al usar la convención de suma de Einstein, las ecuaciones de transformación del tensor contravariante anterior se pueden escribir como:

De manera similar, las ecuaciones de transformación para los componentes de un vector covariante o tensor covariante de rango uno están dados por (usando la convención de suma de Einstein):

Los superíndices se usan para denotar componentes contravariantes, y los subíndices para denotar componentes covariantes de tensores.

Los tensores de mayor rango también se pueden definir.
Las ecuaciones de transformación de los componentes contravariantes de un tensor de segundo rango están dadas por:

Usando la convención de suma, las ecuaciones de transformación se convierten en:

Y las ecuaciones de transformación de los componentes covariantes de un tensor de segundo rango están dadas por:

Uno puede convertir los tensores de covariante a contravariante y viceversa al “subir” o “bajar” los índices en los tensores. Esto se logra utilizando el tensor métrico [math] g_ {\ text {ij}} [/ math] y su conjugado

Por definición, el campo matricial fundamental inverso (tensor métrico)

se llama tensor métrico conjugado.

Si tenemos un vector contravariante (o tensor de rango uno) [matemáticas] T ^ j [/ matemáticas] , el producto interno del tensor dado con el tensor métrico reduce el índice contrariante:

Uso del tensor métrico conjugado con un vector o tensor covariante [math] T_j [/ math] , el índice covariante puede elevarse y obtenemos:

La reducción y el aumento de los índices se pueden aplicar a los tensores de orden superior:

[matemáticas] T_r ^ {\ text {np}} [/ matemáticas] se llama tensor mixto.

Para obtener información adicional sobre la covarianza y la contravirancia, consulte el artículo de Wikipedia sobre la covarianza y la contravarianza de los vectores.

Consulte también el artículo de Wikipedia sobre cómo subir y bajar índices.

Las palabras ‘contravariante’ y ‘covariante’ se refieren a propiedades de transformación.

Piensa en un vector simple. Digamos que tiene una hoja de papel con una cuadrícula marcada en centímetros. Las coordenadas horizontal y vertical son [matemática] x [/ matemática] y [matemática] y [/ matemática]. Tome un vector [math] {\ mathbf p} [/ math], con coordenadas [math] p ^ x [/ math] y [math] p ^ y [/ math] (el índice superior aquí es solo un índice, no exponenciación.) ¿Qué significan estos dos números, [matemática] p ^ x [/ matemática] y [matemática] p ^ y [/ matemática]?

Tienen que ver con la base de coordenadas. En un sistema de coordenadas rectilíneo simple, la base de coordenadas consta de dos vectores unitarios en las direcciones [matemática] x [/ matemática] y [matemática] y [/ matemática]. Digamos, [math] {\ mathbf e} _x [/ math] y [math] {\ mathbf e} _y [/ math]. Entonces el vector [math] {\ mathbf p} [/ math] se da como [math] {\ mathbf p} = p ^ x {\ mathbf e} _x + p ^ y {\ mathbf e} _y [/ math ]

Ahora pasemos de centímetros a, digamos, pulgadas. Tenemos nuevos vectores básicos en este nuevo sistema de coordenadas: [math] {\ mathbf e} ‘_ x = 2.54 {\ mathbf e} _x [/ math], y [math] {\ mathbf e}’ _ y = 2.54 {\ mathbf e} _y [/ math]. En consecuencia, los componentes del vector también deben cambiar: [matemática] p ^ x {} ‘= p ^ x / 2.54 [/ matemática] y [matemática] p ^ y {}’ = p ^ y / 2.54 [/ matemática] .

Estas conversiones simplemente reflejan el hecho de que a medida que alargamos nuestros vectores base (en lugar de usar el centímetro como unidad, ahora usamos la pulgada como unidad), los números necesarios para describir un vector se hacen más pequeños; lo que mide 25.4 cm, por ejemplo, es solo 10 “.

Y observe que el vector en sí no ha cambiado: [matemática] {\ mathbf p} = p ^ x {\ mathbf e} _x + p ^ y {\ mathbf e} _y = p ^ x {} ‘{\ mathbf e} ‘_x + p ^ y {}’ {\ mathbf e} ‘_ y [/ math]. Es decir, la cantidad vectorial no depende de su representación coordinada; ambos conjuntos de números, [matemática] (p ^ x, p ^ y) [/ matemática] vs. [matemática] (p ^ x {} ‘, p ^ y {}’) [/ matemática], representan la misma geometría cantidad, en dos sistemas de coordenadas diferentes.

En términos más generales, y en sistemas de coordenadas arbitrarias, las cosas que se transforman como los vectores base [math] {\ mathbf e} _x [/ math] y [math] {\ mathbf e} _y [/ math] se llaman covariantes y generalmente se marcan con un índice más bajo Las cosas que se transforman como los componentes de coordenadas de un vector, [matemática] p ^ x [/ matemática] y [matemática] p ^ y [/ matemática], se llaman contravariantes y generalmente se marcan con un índice superior.

En relatividad general, a menudo tenemos que hacer cálculos con espacio curvo (o espacio de Mankowski). Entonces, tenemos que saber cómo hacer cosas en espacios curvos en lugar de espacios planos.
Consideremos una cosa:
Longitud del vector (en espacio 2D):

  1. En espacio plano:

Es simplemente el teorema de Pitágoras.
l² = x² + y².
También puede expresarse como la suma de cuadrados de proyecciones o componentes a lo largo de los ejes.
2. En el sistema de ejes inclinados:
La longitud no depende únicamente de las proyecciones o únicamente de los componentes, sino de sus respectivos productos. Esto significa que la longitud del vector es:
L = (componente en el eje x) * (proyección en el eje x) + (componente en el eje y) * (proyección en el eje y).
Por lo tanto, puede llamar a las proyecciones como covariantes y componentes como contravariantes.
Se pueden convertir con la ayuda del tensor métrico, que es la calidad de un sistema de coordenadas particular.

Puede pensar aproximadamente en ellos como la diferencia entre el vector [math] v [/ math] y el funcional lineal en los vectores [math] v \ cdot [/ math] (es decir, este último puede tomarse como ([math] v \ cdot) (w) [/ math] dando una forma de mapear vectores a números).

Un vector ordinario es contravariante , algo de la forma “[math] v \ cdot [/ math]” es covariante .

Ahora, en el uso ordinario, no hacemos una distinción, porque “[math] \ cdot [/ math]” no es algo que dependa de nada; es solo una cosa constante, por lo que podemos ignorar su papel en todo.

Sin embargo, en una variedad, “[math] \ cdot [/ math]” puede variar de un lugar a otro. Por lo tanto, debemos tener cuidado cuando, por ejemplo, tomamos derivados: ¿estamos incluyendo [math] \ cdot [/ math] en nuestra derivada, o no?

En un lenguaje más técnico, [math] \ cdot [/ math] es el tensor métrico, y la pregunta es si contraemos los componentes de nuestro vector con el tensor métrico para subirlos o bajarlos o no.


Aspecto diferente de lo mismo: en lugar de agregar [math] \ cdot [/ math], agregue una transposición a su vector de columna; es decir, la diferencia entre [matemáticas] v [/ matemáticas] y [matemáticas] v ^ T [/ matemáticas].

Del mismo modo: en el uso ordinario, no hay diferencia allí (los componentes son los mismos).

Sin embargo, cuando ingresa a una métrica más general, el análogo de “transposición” no es tan simple e incluso puede variar de un lugar a otro. Por lo tanto, al tomar derivados, debemos tener cuidado con cuál estamos usando, y lo representamos con índices elevados y bajos.

Nuevamente: la diferencia entre un vector y su transposición es la misma diferencia, en espíritu, que la que existe entre los índices elevados y bajos.


Los tensores son análogos, solo que tienen más índices de los que preocuparse.

Si aprende la definición formal de un producto tensorial, se dará cuenta de que puede dividir un tensor en una suma de listas de vectores. Por ejemplo, un tensor de dos índices se puede escribir como [math] \ T_ {ab} = v_aw_b + x_ay_b + \ ldots [/ math] [kinda. Esta no es una correspondencia conceptual perfecta, pero funciona a un nivel crudo.]

Esto es análogo a escribir una matriz como una suma de matrices de rango uno, cada una de las cuales se puede escribir en la forma [math] vw ^ T [/ math] para algunos [math] v, w [/ math]. (Entonces, piense en cómo hacer eso, luego aplique esa lógica a los tensores).

En cualquier caso, eso significa que un tensor es, en términos generales , una combinación de vectores de fila y columna. Tenemos que hacer un seguimiento de cuál es cuál porque convertir una en la otra requiere una “transposición”, que, de nuevo, puede variar de un lugar a otro (b / c en realidad es una contracción con la métrica).

De esa manera, la distinción co / contravariante para los tensores es un resultado directo de la distinción co / contravariante para los vectores.