¿Por qué el principio de equivalencia implica que el espacio-tiempo es curvo?

No, por sí mismo no lo hace. Pero no solo confíe en mi palabra; ¡derivemos GR en un marco moderno! * Primero, estableceremos postulados:

  1. Las leyes de la física son las mismas para todos los observadores, independientemente de su movimiento.
  2. Los efectos de la aceleración constante y un campo gravitatorio uniforme son equivalentes.
  3. El universo puede ser descrito por una variedad riemanniana en algún lugar diferenciable con un grupo de simetría local de [matemáticas] SO (d, 1) [/ matemáticas], donde [matemáticas] d [/ matemáticas] es el número de dimensiones espaciales.

Ahora, examinemos algunas de las implicaciones de nuestros postulados. A partir de los postulados (3) y (1), podemos deducir dos cosas: primero, los cambios en las coordenadas (observadores) deben ser mapeos invertibles entre los gráficos en la variedad. Si conoce algo de geometría diferencial, los reconocerá como difeomoefismos (mapeos invertibles en un múltiple liso). En segundo lugar, las leyes de la física deberían ser invariantes al difeomorfismo. Juntos, esto significa que cualquiera que sea nuestra teoría, tenemos que formularla en términos de un lagrangiano escalar. **

Ahora, necesitamos descubrir qué usaremos como el campo dinámico de la teoría. Esto es realmente más complicado de lo que parece, pero utilizaremos la retrospectiva para nuestro beneficio. Lo que tenemos que hacer es primero averiguar cuál es la conexión que usaremos. De los postulados (1), (2) y (3), podemos deducir varias cosas:

  • La conexión no debe tener un acoplamiento de fuerza variable (a diferencia, por ejemplo, del electromagnetismo, donde la conexión [matemática] D _ {\ mu} = \ parcial _ {\ mu} -iqA _ {\ mu} [/ matemática] depende de la carga de el observador).
  • Debería ser una conexión afín.

La conexión más obvia que satisface estas condiciones es la conexión Levi-Civita,

[matemáticas] \ nabla _ {\ mu} = \ parcial _ {\ mu} + \ Gamma ^ {\ alpha} _ {\ mu \ beta}. [/ matemáticas]

Probemos esto y veamos a dónde nos lleva. A partir de esta conexión, podemos, lo más importante, deducir cuál será el campo dinámico de la teoría. Ahora, ingenuamente esperaríamos que el campo dinámico sean los símbolos de Christoffel [math] \ Gamma ^ {\ alpha} _ {\ mu \ beta} [/ math], especialmente después de ver la conexión para el electromagnetismo. Sin embargo, estaríamos equivocados. Hay un campo más fundamental que los símbolos de Christoffel que podemos usar: el campo métrico, [math] g _ {\ mu \ nu} [/ math] (o equivalente, el métrico inverso, [math] g ^ {\ mu \ nu} [/ matemáticas]).

Ahora que tenemos un campo dinámico, necesitamos construir un lagrangiano escalar usando solo ese campo y sus derivados. Afortunadamente, la geometría riemanniana nos ofrece muchas opciones, ya que el tensor de Riemann, [math] R ^ {\ alpha} _ {\ mu \ beta \ nu} [/ math] está hecho de la métrica y sus derivados, todos verdaderos escalares ( no pseudoescalares) construidos a partir de él serían candidatos válidos lagrangianos (o componentes de los mismos). Pero comencemos con el escalar más simple: el escalar Ricci, [matemáticas] R = R _ {\ mu \ nu} g ^ {\ mu \ nu} = g ^ {\ mu \ nu} R ^ {\ alpha} _ { \ mu \ alpha \ nu}. [/ math]

Entonces, intentaremos establecer [math] \ mathcal {L} = R \ sqrt {-g} [/ math] (el [math] \ sqrt {-g} [/ math] es el determinante jacobiano) y veremos qué obtenemos. La siguiente sección vendrá de ¿Cómo se deriva la acción de Hilbert a lo largo de una métrica ?, en la que dejo que el lagrangiano sea [math] \ mathcal {L} = (r-2 \ Lambda) \ sqrt {-g} [/ math] ; simplemente ignore los bits con [math] \ Lambda [/ math] por ahora. No cambia la sustancia de la respuesta.


Comenzamos tomando la acción [math] S = \ int d ^ 4x (R-2 \ Lambda) \ sqrt {-g} [/ math], donde [math] R [/ math] es el escalar de curvatura de Ricci, [ matemática] \ Lambda [/ matemática] es la constante cosmológica, y [matemática] g [/ matemática] es el determinante de la métrica. Ahora, desde el Principio de la menor acción, las ecuaciones de movimiento se encuentran en el punto estacionario de la acción. Eso significa que, cuando la acción varía en una cantidad infinitesimal ([math] S \ mapsto S + \ delta S [/ math]), su valor no cambia.

Entonces, establecemos [math] \ delta S = 0 [/ math]. Esto es análogo a arrojar el lagrangiano a las ecuaciones de Euler-Lagrange; en teoría, se podría hacer esto con la acción de Hilbert, pero sería extremadamente difícil, y debido a que el cálculo de variaciones nos permite hacerlo de manera diferente, no vamos usar la ecuación de Euler-Lagrange.

Ahora, para calcular realmente esta variación, tomaremos la derivada funcional de [math] S [/ math] con respecto a la métrica inversa [math] g ^ {\ mu \ nu} [/ math], y multiplicaremos por [math] ] \ delta g ^ {\ mu \ nu} [/ math], dándonos [math] \ delta S = \ displaystyle \ frac {\ delta S} {\ delta g ^ {\ mu \ nu}} \ delta g ^ {\ mu \ nu} = 0 [/ math]. Entonces, ¡hagamos esto!

Primero, debemos tener en cuenta que la derivada funcional obedece la regla de Leibniz, por lo que [math] \ displaystyle \ frac {\ delta [(R-2 \ Lambda) \ sqrt {-g}]} {\ delta g ^ {\ mu \ nu}} = \ sqrt {-g} \ displaystyle \ frac {\ delta R} {\ delta g ^ {\ mu \ nu}} + (R-2 \ Lambda) \ displaystyle \ frac {\ delta \ sqrt {- g}} + 2 \ sqrt {-g} \ frac {\ delta \ Lambda} {\ delta g ^ {\ mu \ nu}} [/ math].


En orden, primero calcularemos [matemáticas] \ frac {\ delta R} {\ delta g ^ {\ mu \ nu}} [/ matemáticas]. Esto es un poco complicado, porque [math] R [/ math] está compuesto por el tensor Ricci, que a su vez está compuesto por el tensor Riemann. Esto significa que primero debemos variar el tensor de Riemann, luego usarlo para encontrar la variación del tensor de Ricci, luego usar eso para encontrar la variación del escalar de Ricci. En este punto, por conveniencia en esta sección, usaré índices latinos en lugar de griegos; no dejes que esto te confunda; siguen siendo indicios en 4-D. Recuerde que [matemáticas] R ^ a_ {bcd} = \ partial_c \ Gamma ^ a_ {db} – \ partial_d \ Gamma ^ a_ {cb} + \ Gamma ^ a_ {cm} \ Gamma ^ m_ {db} – \ Gamma ^ a_ {dm} \ Gamma ^ m_ {cb} [/ math], entonces [math] \ delta R ^ a_ {bcd} = \ partial_c \ delta \ Gamma ^ a_ {db} – \ partial_d \ delta \ Gamma ^ a_ { cb} + \ delta \ Gamma ^ a_ {cm} \ Gamma ^ m_ {db} + \ Gamma ^ a_ {cm} \ delta \ Gamma ^ m_ {db} – \ delta \ Gamma ^ a_ {dm} \ Gamma ^ m_ {cb} – \ Gamma ^ a_ {dm} \ delta \ Gamma ^ m_ {cb} [/ math]. En este punto, echemos un vistazo a lo que significa exactamente [math] \ delta \ Gamma ^ a_ {bc} [/ math]. Primero, recuerde que un símbolo de Christoffel por sí solo no es un tensor. ¡Pero la diferencia de dos símbolos de Christoffel es! ¿Y qué sabes, porque [matemática] \ delta \ Gamma ^ a_ {bc} [/ matemática] es la variación de un símbolo de Christoffel (la diferencia de un punto a otro), es un tensor! ¿Y qué significa eso para este problema? ¡Significa que podemos tomar la derivada covariante de la misma! Ahora, esto puede parecer una gran cantidad de pasos innecesarios, pero confía en mí, tendrá sentido por qué estamos haciendo esto en un minuto.

Entonces, terminemos con esto: siguiendo las reglas habituales de la derivada covariante con una conexión métrica compatible [math] \ Gamma [/ math], [math] \ nabla_m \ delta \ Gamma ^ a_ {bc} = \ partial_m \ Gamma ^ a_ {bc} + \ Gamma ^ a_ {dm} \ delta \ Gamma ^ d_ {cb} – \ Gamma ^ d_ {bm} \ delta \ Gamma ^ a_ {dc} – \ Gamma ^ d_ {cm} \ delta \ Gamma ^ a_ {bm} [/ math]. Mire esto por un minuto y luego mire [math] \ delta R ^ a_ {bcd} [/ math]. Puede notar que, de hecho, [math] \ delta R ^ a_ {bcd} [/ math] puede expresarse como la diferencia de dos derivadas covariantes de variaciones de los símbolos de Christoffel, específicamente, [math] \ delta R ^ a_ {bcd} = \ nabla_c (\ delta \ Gamma ^ a_ {db}) – \ nabla_d (\ delta \ Gamma ^ a_ {cb}) [/ math].

Ahora, ¿cómo obtenemos [math] R_ {ab} [/ math] de [math] R ^ d_ {cab} [/ math]? ¡Acabamos de contratar indicios! Se deduce lógicamente que [math] \ delta R_ {ab} = \ delta R ^ c_ {acb} [/ math]. Yendo a nuestra fórmula anterior (que pronto aprenderemos tiene un nombre), encontramos que [matemáticas] \ deltaR_ {ab} = \ nabla_c (\ delta \ Gamma ^ c_ {ba}) – \ nabla_b (\ delta \ Gamma ^ c_ {ca}) [/ math]. Esto se llama la identidad de Palatini. Para ser honesto, podría haber saltado la mayor parte de la sección anterior y comenzar desde aquí, pero ¿dónde está la diversión en eso? Además, ¡solo leerlo es mucho mejor que sentarse con un cuaderno y derivarlo usted mismo! Pero yo divago. Ahora es el momento de llegar al escalar Ricci real, que se obtiene al contraer el tensor Ricci con la métrica.

Entonces, según la regla de Liebniz, porque [matemáticas] R = R_ {ab} g ^ {ab} [/ matemáticas], [matemáticas] \ delta R = \ delta R_ {ab} g ^ {ab} + R_ {ab} \ delta g ^ {ab} = [\ nabla_c (\ delta \ Gamma ^ c_ {ba}) – \ nabla_b (\ delta \ Gamma ^ c_ {ca})] g ^ {ab} + R_ {ab} \ delta g ^ {ab} [/ matemáticas]. Al distribuir la métrica inversa en [math] \ delta R_ {ab} [/ math], encontramos que [math] \ delta R = \ nabla_m (g ^ {ab} \ delta \ Gamma ^ m_ {ba} -g ^ { am} \ delta \ Gamma ^ n_ {na}) + R_ {ab} \ delta g ^ {ab} [/ math].

Ahora, debemos recordar dos cosas: primero, estamos multiplicando todo este término por el jacobiano, [math] \ sqrt {-g} [/ math]. Y segundo, esto tiene una implicación muy especial en términos de esta Acción: cuando se multiplica por [math] \ sqrt {-g} [/ math], la derivada covariante de un campo [math] T ^ a [/ math] se convierte en un derivada parcial ordinaria del campo multiplicado por [math] \ sqrt {-g} [/ math], que es una derivada total. En símbolos, [math] \ sqrt {-g} \ nabla_a T ^ a = \ partial_a (\ sqrt {-g} T ^ a) [/ math], que es una derivada total. ¿Qué tiene de especial una derivada total? Bueno, veamos el teorema de Stoke, que dice que, para una forma diferencial [matemática] \ omega [/ matemática], en una variedad [matemática] M [/ matemática] con límite [matemática] \ parcial M [/ matemática], [matemáticas] \ int_ {M} d \ omega = \ int _ {\ parcial M} \ omega [/ matemáticas].

Esto significa que, cuando se integra sobre el elemento de volumen [math] d ^ 4x [/ math], todo el término [math] \ nabla_m (g ^ {ab} \ delta \ Gamma ^ m_ {ba} -g ^ {am} \ delta \ Gamma ^ n_ {na}) [/ math] contribuye a nuestras ecuaciones solo en el límite del bloque de personal. Para el espacio-tiempo, ese límite está infinitamente lejos, por lo que no queremos agregar eso a nuestras ecuaciones. Entonces, después de todo esto, encontramos que [matemáticas] \ sqrt {-g} \ delta R = \ sqrt {-g} \ displaystyle \ frac {\ delta R} {\ delta g ^ {ab}} \ delta g ^ { ab} = R_ {ab} \ delta g ^ {ab} \ sqrt {-g} [/ math].


Con ese tedioso cálculo terminado, volveré a las indicaciones griegas (¡porque no tendré que escribir casi tantas!), Y volveremos nuestra atención al próximo término en nuestra Acción: [matemáticas] R \ displaystyle \ frac {\ delta \ sqrt {-g}} {\ delta g ^ {\ mu \ nu}} \ delta g ^ {\ mu \ nu} [/ math]. Debido a que [math] \ sqrt {-g} [/ math] involucra el determinante de una matriz, y la estamos diferenciando, debemos recurrir a la fórmula de Jacobi para las derivadas de determinantes. Voy a pasar por alto esto, porque no creo que pueda darte una idea más profunda de esto que 5 o 10 minutos de Google. Aplicando la fórmula y la regla de la cadena, encontramos que [matemáticas] \ sqrt {-g} = \ frac {1} {2} \ sqrt {-g} g ^ {\ mu \ nu} \ delta g _ {\ mu \ nu} [/ matemáticas]. Al subir y bajar correctamente las indicaciones de [math] \ delta g _ {\ mu \ nu} [/ math] y [math] g ^ {\ mu \ nu} [/ math], encontramos que [math] R \ displaystyle \ frac {\ delta \ sqrt {-g}} {\ delta g ^ {\ mu \ nu}} \ delta g ^ {\ mu \ nu} = – \ frac {1} {2} Rg _ {\ mu \ nu } \ sqrt {-g} [/ math].


Ahora, llegamos a la última parte: [matemáticas] \ displaystyle \ frac {\ delta (-2 \ Lambda \ sqrt {-g})} {\ delta g ^ {\ mu \ nu}} [/ math]. Nuevamente, explicando con la regla de Leibniz, tenemos [matemáticas] \ sqrt {-g} \ displaystyle \ frac {\ delta (-2 \ Lambda)} {\ delta g ^ {\ mu \ nu}} – 2 \ Lambda \ displaystyle \ frac {\ delta \ sqrt {-g}} {\ delta g ^ {\ mu \ nu}} [/ math]. Debido a que la derivada de una constante es cero y [math] \ Lambda [/ math] es una constante, nos quedamos con [math] -2 \ Lambda \ displaystyle \ frac {\ delta \ sqrt {-g}} {\ delta g ^ {\ mu \ nu}} [/ math]. Nuevamente aplicando la fórmula Jabobi, terminamos con [math] \ Lambda g _ {\ mu \ nu} \ sqrt {-g} \ delta g ^ {\ mu \ nu} [/ math].

Al sumar todo, encontramos que [matemáticas] \ delta S = \ displaystyle \ frac {\ delta S} {\ delta g ^ {\ mu \ nu}} \ delta g ^ {\ mu \ nu} = \ sqrt {- g} \ delta g ^ {\ mu \ nu} (R _ {\ mu \ nu} – \ frac {1} {2} Rg _ {\ mu \ nu} + \ Lambda g _ {\ mu \ nu}) = 0 [ /matemáticas]. Dividiendo por [math] \ sqrt {-g} \ delta g ^ {\ mu \ nu} [/ math], tenemos [math] R _ {\ mu \ nu} – \ frac {1} {2} Rg _ {\ mu \ nu} + \ Lambda g _ {\ mu \ nu}) = 0 [/ math]. Esta es la ecuación de campo de Einstein en el vacío. Ahora, esto es muy útil. Pero aún más útil sería una versión de esto que incorpora la materia. Y podemos hacer esto. Si tenemos una teoría de la materia con Acción [matemáticas] S_M [/ matemáticas], podemos definir un tensor [matemáticas] T _ {\ mu \ nu} = \ displaystyle \ frac {\ delta S_M} {\ delta g ^ {\ mu \ nu}} [/ math]. Si calculamos que la materia está acoplada a la gravedad por una constante [matemática] \ kappa [/ matemática], la nueva Acción es [matemática] \ int d ^ 4x \ sqrt {-g} (R-2 \ Lambda) + \ frac {1} {2 \ kappa} S_M [/ matemáticas]. La variación de esto da las ecuaciones de campo de Einstein completas, [matemáticas] R _ {\ mu \ nu} – \ frac {1} {2} Rg _ {\ mu \ nu} + \ Lambda g _ {\ mu \ nu}) = \ frac {8 \ pi G} {c ^ 4} T _ {\ mu \ nu} [/ math].


¡Ahora tenemos ecuaciones de movimiento de nuestro lagrangiano! Y podemos compararlo con la naturaleza, y encontrar que este lagrangiano realmente describe la gravedad mientras la observamos, lo que significa que elegimos nuestro pozo lagrangiano.

Ahora, ¿qué tiene que ver todo esto con la curva del espacio-tiempo? Bueno, así como el electromagnetismo tiene una interpretación geométrica (podemos interpretar el tensor de Faraday como un tensor de curvatura), también lo tiene la gravedad. Sin embargo, mientras que las partículas electromagnéticas con carga diferente ven geometría diferente (recuerde que la conexión para el electromagnetismo es [matemática] D _ {\ mu} = \ parcial _ {\ mu} -iqA _ {\ mu} [/ matemática], que depende de la carga) , debido a que la conexión Levi-Civita es universal, todos los observadores ven la misma geometría. Por lo tanto, podemos interpretar la geometría de la relatividad general como la geometría de fondo del espacio-tiempo.


* Con lo que quiero decir con lagrangianos, técnicas de teoría de campo y retrospectiva.

** Tener un lagrangiano escalar significa que el lagrangiano no cambia cuando cambiamos las coordenadas, lo cual es muy bueno.