2.3. Espacio-tiempo, conos nulos, métrica, geometría conforme
Cuando, en 1908, el distinguido matemático Hermann Minkowski —quien casualmente había sido uno de los profesores de Einstein en el Politécnico de Zurich— demostró que podía compendiar las ideas básicas de la relatividad especial en términos de un tipo inusual de geometría 4-dimensional, Einstein no expresó mucho entusiasmo por la idea. Pero más tarde comprendió la importancia crucial de la noción geométrica del espacio-tiempo de Minkowski. De hecho, Einstein generalizó la propuesta de Minkowski para obtener el espacio-tiempo curvo, que era la base de su teoría de la relatividad general.
El 4-espacio de Minkowski añadía a las tres dimensiones ordinarias del espacio una cuarta dimensión para describir el paso del tiempo. Por ello, es frecuente llamar sucesos a los puntos de este 4-espacio, puesto que cualquiera de estos puntos tiene una especificación temporal tanto como espacial. No hay realmente nada muy revolucionario si nos quedamos en esto. Pero el punto clave de la idea de Minkowski —que sí era revolucionario— es que la geometría de su 4-espacio no se divide de forma natural en una dimensión temporal y (más importante) una familia de 3-espacios euclidianos ordinarios, uno por cada instante de tiempo dado. En su lugar, el espacio-tiempo de Minkowski tiene otro tipo de estructura geométrica, que da un curioso giro a la antigua idea de geometría de Euclides. Proporciona una geometría global para el espacio-tiempo, que hace de éste un todo indivisible y codifica por completo la estructura de la relatividad especial de Einstein.
Así, en la 4-geometría de Minkowski no tenemos que considerar que el espacio-tiempo está construido simplemente a base de una sucesión de 3-espacios, cada uno de los cuales representa lo que consideramos como «espacio» en varios instantes diferentes (Fig. 2.10). En esta interpretación, cada una de estas 3-superficies describiría una familia de sucesos, todos los cuales serían simultáneos. Por el contrario, en la relatividad especial la noción de «simultáneos» para sucesos espacialmente separados no tiene un significado absoluto. En su lugar, la «simultaneidad» dependerá de la velocidad de un observador arbitrariamente escogido.
Esto, por supuesto, está en contradicción con la experiencia común, pues parece que nosotros sí que tenemos una noción de simultaneidad para sucesos distintos que es independiente de nuestra velocidad. Pero (según la relatividad especial de Einstein) si llegáramos a movernos a una velocidad comparable a la de la luz, entonces sucesos que a nosotros nos parecen simultáneos no serían en general simultáneos para otro observador que se moviera con una velocidad diferente. Más aún, las velocidades ni siquiera tendrían que ser muy grandes si tratamos con sucesos muy distantes. Consideremos, por ejemplo, el suceso que constituye el cruce de dos personas que marchan en direcciones opuestas a lo largo de una trayectoria; entonces es probable que sucesos en la galaxia Andrómeda que cada uno de ellas individualmente consideraría simultáneos con ese cruce, ¡difirieran en varias semanas![2.25] (véase la Fig. 2.11).
Según la relatividad, la noción de «simultáneos», para sucesos distantes, no es absoluta sino que depende de que se especifique la velocidad de un observador, de modo que el rebanado del espacio-tiempo en una familia de 3-espacios simultáneos es subjetivo en el sentido en que para una velocidad del observador diferente se obtendría un rebanado diferente. Lo que consigue el espacio-tiempo de Minkowski es proporcionar una geometría objetiva, que no depende de la visión del mundo de un observador arbitrario y que no hay cambiar cuando un observador es reemplazado por otro. En cierto sentido, lo que hizo Minkowski era sacar la «relatividad» de la teoría de la relatividad especial y ofrecernos una imagen absoluta de la actividad espaciotemporal.
Pero para que esto nos dé una imagen firme necesitamos un tipo de estructura para el 4-espacio que reemplace a la idea de una sucesión temporal de 3-espacios. ¿Qué estructura es ésta? Utilizaré la letra para denotar el 4-espacio de Minkowski. La estructura geométrica más básica que atribuyó Minkowski a es la noción de un cono nulo,[2.26] que describe cómo se propaga la luz en cualquier suceso particular p en . El cono nulo —que es un cono doble, con un vértice común en p— nos dice cuál es la «velocidad de la luz» en cualquier dirección, en el suceso p (véase la Fig. 2.12(a)). La imagen intuitiva de un cono nulo la ofrece un destello de luz, que inicialmente se focaliza hacia dentro precisamente hacia el suceso p (cono nulo pasado), e inmediatamente después se dispersa desde p (cono nulo futuro), como el destello de una explosión en p, de modo que la descripción espacial (Fig. 2.12(b)) que sigue a la explosión se convierte en una sucesión de esferas concéntricas en expansión. En mis diagramas dibujaré normalmente conos nulos con sus superficies inclinadas aproximadamente 45° respecto a la vertical, que es lo que obtenemos si escogemos unidades de espacio y de tiempo de modo que la velocidad de la luz sea c = 1. Así, si escogemos segundos para nuestra escala de tiempo, escogemos un segundo-luz (= 299.792.458 metros) como nuestra unidad de distancia; si escogemos años para nuestra escala de tiempo, entonces escogemos un año-luz (≅ 9,46 × 1012 kilómetros) como nuestra unidad de distancia, etc.[2.27]
La teoría de Einstein nos dice que la velocidad de cualquier partícula masiva debe ser siempre menor que la de la luz. En términos de espacio-tiempo, esto significa que la línea de universo de dicha partícula —el lugar geométrico de todos los sucesos que constituyen la historia de la partícula— debe estar dirigida dentro del cono de luz en cada uno de sus sucesos. Véase la Fig. 2.13. Una partícula puede tener un movimiento que es acelerado en algunos lugares a lo largo de su línea de universo, por lo que su línea de universo no tiene por qué ser recta, pues la aceleración se expresa, en términos espaciotemporales, como una curvatura de la línea de universo. Donde la línea de universo se curva, es el vector tangente a la línea de universo el que debe yacer dentro del cono nulo. Si la partícula no tiene masa,[2.28] como es el caso de un fotón, entonces su línea de universo debe yacer a lo largo del cono nulo en cada uno de sus puntos, puesto que se considera que su velocidad en cada uno de sus sucesos es la velocidad de la luz.
Los conos nulos nos hablan también de causalidad, que es la cuestión de determinar qué sucesos van a considerarse capaces de influir en qué otros sucesos. Uno de los postulados de la relatividad (especial) es que no está permitido que las señales se propaguen más rápidas que la luz. Por consiguiente, en términos de la geometría de , decimos que un suceso p podría tener una influencia causal sobre el suceso q si hay una línea de universo que conecta p con q, es decir, una trayectoria (suave) de p a q que yace a lo largo o dentro de los conos nulos. Para ello tenemos que especificar una orientación para la trayectoria (indicada asociando una «flecha» a la trayectoria), que procede uniformemente de pasado a futuro. Esto requiere que se asigne a la geometría de una orientación temporal, que equivale a una asignación independiente, continua y consistente, de «pasado» y «futuro» a los dos componentes de cada cono nulo. Etiqueto a cada componente pasado con un signo «–» y a cada componente futuro con un signo «+». Todo esto se ilustra en la Fig. 2.13(a), donde el cono nulo pasado se distingue en mis dibujos por el uso de líneas de trazos. La terminología normal de «causación» considera que las influencias causales proceden en la dirección pasado a futuro, es decir, a lo largo de líneas de universo cuyos vectores tangentes orientados apuntan a lo largo o dentro de los conos nulos futuros.[2.29]
La geometría de es completamente uniforme; cada suceso está en pie de igualdad con cualquier otro. Pero cuando pasamos a la teoría de la relatividad general de Einstein, esta uniformidad se pierde. De todas maneras, tenemos de nuevo una asignación continua de conos nulos orientados en el tiempo, y de nuevo es cierto que cualquier partícula masiva tiene una línea de universo cuyos vectores tangentes (orientados al futuro) yacen dentro de dichos conos nulos futuros. Y, como antes, una partícula sin masa (un fotón) tiene una línea de universo cuyos vectores tangentes yacen a lo largo de conos nulos. En la Fig. 2.14 he representado el tipo de situación que se da en la relatividad general, donde los conos nulos no están ahora dispuestos de un modo uniforme.
Tenemos que tratar de imaginar estos conos dibujados en una especie de «lámina elástica» ideal con los conos nulos impresos en ella. Podemos moverla y distorsionarla como queramos, siempre que la deformación se haga suavemente, y los conos nulos se mueven con la lámina elástica. Nuestros conos nulos determinan la «estructura de causalidad» entre sucesos, y ésta no se altera por tal deformación con tal de que los conos se consideren arrastrados con la lámina.
Una situación parecida es la que ofrece la representación de Escher del plano hiperbólico que se muestra en la Fig. 2.3(c), en §2.1, donde podemos imaginar que la imagen de Escher está impresa en una lámina elástica ideal. Podríamos escoger uno de los diablos que parece estar próximo a la frontera y moverlo, mediante una deformación suave de la lámina, de modo que llegue a la localización previamente ocupada por otro diablo cerca del centro. Es posible hacer que este movimiento lleve todos los diablos a localizaciones previamente ocupadas por otros diablos, y dicho movimiento describiría una simetría de la geometría hiperbólica subyacente ilustrada por la imagen de Escher. En relatividad general pueden darse simetrías de este tipo (como en los modelos de Friedmann descritos en §2.1), aunque esto es bastante excepcional. Sin embargo, la posibilidad de realizar semejantes deformaciones de «lámina elástica» es buena parte de la teoría general, y se conocen como «difeomorfismos» (o «transformaciones de coordenadas generales»). La idea es que tales deformaciones no alteran en absoluto la situación física. El principio de «covariancia general», que es una piedra angular de la relatividad general de Einstein, consiste en formular la ley física de manera que tales «deformaciones de lámina elástica» (difeomorfismos) no alteren las propiedades físicamente significativas del espacio y sus contenidos.
Esto no quiere decir que se pierda toda la estructura geométrica, y que el único tipo de geometría que queda para nuestro espacio podría ser simplemente algo de su naturaleza topológica (a veces conocida como «geometría de lámina elástica», en la que la superficie de una taza de té se identificaría con la de un anillo, etc.). Pero debemos tener cuidado en especificar qué estructura es necesaria. Con frecuencia se utiliza el término variedad para dicho espacio, con un número finito definido de dimensiones (y podemos llamar n-variedad a una variedad de n dimensiones); una variedad es suave pero no tiene asignada necesariamente ninguna otra estructura más allá de su suavidad y su topología. En el caso de la geometría hiperbólica hay realmente una noción de métrica asignada a la variedad —una cantidad «tensorial» matemática (véase también §2.6), normalmente denotada por la letra g— que puede considerarse que asigna una longitud[2.30] a cualquier curva suave finita en el espacio. Cualquier deformación de la «lámina elástica» que constituya esta variedad llevaría con ella cualquier curva que conecta un par de puntos p, q (donde p y q también son arrastrados con la deformación) y se estima que la longitud asignada por g al segmento que une p y q no queda afectada por esta deformación (y, en este sentido, g también es «arrastrada» por la deformación).
La noción de longitud implica asimismo una noción de línea recta, conocida como una geodésica, que es una línea l caracterizada por el hecho de que para dos puntos cualesquiera p y q en l, no demasiado apartados, la curva más corta (en el sentido de longitud que proporciona g) de p a q es en efecto la porción pq de l. Véase la Fig. 2.15. (En este sentido, una geodésica proporciona la «ruta más corta entre dos puntos»). También podemos definir ángulos entre dos curvas suaves (igualmente determinados una vez que se da g), de modo que las nociones ordinarias de geometría están disponibles para nosotros una vez que se ha asignado g. Sin embargo, esta geometría diferiría normalmente de la familiar geometría euclidiana.
La geometría hiperbólica de la imagen de Escher (Fig. 2.3(c), representación conforme de Beltrami-Poincaré) tiene también sus líneas rectas (geodésicas). Estas pueden entenderse en términos de la geometría euclidiana de fondo en la que se representa esta figura, como arcos circulares que cortan al círculo frontera a ángulos rectos (véase la Fig. 2.16).Tomando a y b como los puntos extremos del arco que pasa por dos puntos dados p y q, la g-distancia hiperbólica entre p y q resulta ser
donde el «log» utilizado aquí es un logaritmo natural (2,302 585… veces el «log10» de §1.2), «|qa|», etc., son las distancias euclidianas ordinarias en el espacio de fondo, y es una constante positiva llamada el pseudorradio del espacio hiperbólico.
Pero más que especificar la estructura proporcionada por tal g, se podría asignar en su lugar otro tipo de geometría. El tipo que más nos interesará aquí es la geometría conocida como geometría conforme. Ésta es la estructura que proporciona una medida para el ángulo entre dos curvas suaves, en cualquier punto donde se cortan, pero no especifica una noción de «distancia» o «longitud». Como se ha mencionado, el concepto de ángulo está realmente determinado por g, pero la propia g no está fijada por la noción de ángulo. Aunque la estructura conforme no fija la medida de longitud, sí fija las razones de las medidas de longitud en diferentes direcciones en cualquier punto, de modo que determina las formas infinitesimales. Podemos reescalar al alza o a la baja esta medida de longitud en diferentes puntos sin afectar a la estructura conforme (véase la Fig. 2.17). Expresamos este reescalado como
g → Ω2g
donde Ω es un número real positivo definido en cada punto, que varía suavemente sobre el espacio. Así g y Ω2g nos dan la misma estructura conforme cualquiera que sea el Ω positivo que escojamos, pero g y Ω2g nos dan diferentes estructuras métricas (si Ω ≠ 1), donde Ω es el factor de cambio de escala. (La razón por la que Ω aparece elevado al cuadrado en la expresión «Ω2g» es que las expresiones para las medidas directas de separación espacial, o temporal, que proporciona g, salen de tomar una raíz cuadrada (véase la nota 2.30)). Volviendo a la Fig. 2.3(c) de Escher, encontramos que la estructura conforme del plano hiperbólico (aunque no su estructura métrica) es realmente idéntica a la del espacio euclidiano interior al círculo frontera, pero difiere de la estructura conforme del plano euclidiano entero.
Cuando llegamos a la geometría espaciotemporal, estas ideas siguen siendo válidas, aunque hay algunas diferencias significativas, debido al «giro» que introdujo Minkowski en las ideas de la geometría euclidiana. Este giro es lo que los matemáticos llaman un cambio de la signatura de la métrica. En términos algebraicos, esto se refiere a que algunos signos + se cambian por signos –, y básicamente nos dice cuántas de un conjunto de n direcciones mutuamente ortogonales, en el caso de un espacio n-dimensional, van a considerarse «de tipo tiempo» (dentro del cono nulo) y cuántas «de tipo espacio» (fuera del cono nulo). En geometría euclidiana, y su versión curva conocida como geometría riemanniana, consideramos que todas las direcciones son de tipo espacio. La idea habitual de «espacio-tiempo» implica que sólo una de las direcciones, en tal conjunto ortogonal, es de tipo tiempo y el resto son de tipo espacio. Le llamamos minkowskiano si es plano y lorentziano si es curvo. En el tipo ordinario (lorentziano) de espaciotiempo que estamos considerando aquí, n = 4, y la signatura es «1 + 3», que divide nuestras 4 direcciones mutuamente ortogonales en una dirección de tipo tiempo y 3 de tipo espacio. «Ortogonalidad» entre direcciones de tipo espacio (y entre direcciones de tipo tiempo, si hubiéramos tenido más de una de ellas) significa simplemente «a ángulos rectos», mientras que la ortogonalidad entre una dirección de tipo espacio y una de tipo tiempo es más parecida geométricamente a la situación representada en la Fig. 2.18, al estar las direcciones ortogonales simétricamente relacionadas con la dirección nula entre ellas. Físicamente, un observador cuya línea de universo está en la dirección de tipo tiempo considera que los sucesos en una dirección ortogonal de tipo espacio son simultáneos.
En la geometría ordinaria (euclidiana o riemanniana), solemos considerar las longitudes en términos de separación espacial, que es algo que quizá podríamos medir con una regla. Pero ¿qué es una regla, en términos de espacio-tiempo (minkowskiano o lorentziano)? Es una cinta, que no parece en un primer momento que sea el artilugio más obvio para medir la separación espacial entre dos sucesos p y q.Véase la Fig. 2.19. Podemos poner p en un extremo de la cinta y q en el otro. También podemos suponer que la regla es estrecha y no está acelerada, de modo que no son importantes los efectos de curvatura espaciotemporal de la relatividad general (lorentziana) de Einstein y sería adecuado un tratamiento de acuerdo con la relatividad especial. Pero, según la teoría de la relatividad especial, para que la medida de distancia que proporciona la regla dé la separación espaciotemporal correcta entre p y q, exigimos que estos sucesos sean simultáneos en el sistema de reposo de la regla. ¿Cómo podemos asegurar que estos sucesos son realmente simultáneos en el sistema de reposo de la regla? Podemos utilizar para esto el tipo de argumento original de Einstein, aunque, más que en una regla, él estaba pensando en un tren en movimiento uniforme; así que parafrasearemos también las cosas de esa manera.
Llamemos extremo frontal al extremo del tren (regla) que contiene al suceso p, y extremo trasero al extremo que contiene a q. Imaginemos un observador situado en el extremo frontal, que envía una señal luminosa desde un suceso r al extremo trasero del tren, temporizada de modo que llegue allí precisamente en el suceso q, donde la señal es reflejada de inmediato hacia el extremo frontal para ser recibida por el observador en el suceso s. Véase la Fig. 2.20. Entonces el observador juzga que q es simultáneo con p, en el sistema de reposo del tren, si p ocurre a mitad de camino entre la emisión y la recepción final de la señal, es decir, si el intervalo de tiempo de r a p es exactamente el mismo que de p a s. La longitud del tren (esto es, de la regla) coincidiría entonces (y sólo entonces) con el intervalo espacial entre p y q.
Advertimos que esto no sólo es algo más complicado que «tender una regla» para medir la separación espacial entre sucesos, sino que lo que mide realmente el observador serían los intervalos temporales rp y ps. Estos intervalos temporales (iguales) proporcionan directamente la medida del intervalo espacial pq que se está determinando (en unidades donde la velocidad de la luz c se toma como la unidad). Esto ilustra el hecho clave sobre la métrica del espacio-tiempo, a saber, que es realmente algo que tiene mucho más que ver directamente con la medida del tiempo que con la distancia. En lugar de proporcionar una medida de longitud para curvas, nos proporciona directamente una medida de tiempo. Además, no es a todas las curvas a las que se les asigna una medida de tiempo: es a las curvas que se conocen como causales, que podrían ser líneas de universo de partículas; curvas que en todo lugar son o bien de tipo tiempo (con vectores tangentes dentro de los conos de luz, propias de partículas masivas) o nulas (con vectores tangentes a lo largo de los conos nulos, propias de partículas sin masa). Lo que hace la métrica del espacio-tiempo g es asignar una medida de tiempo a cualquier segmento finito de una curva causal (siendo cero la contribución a la medida de tiempo para cualquier porción de la curva que sea nula). En este sentido, la «geometría» que posee la métrica del espacio-tiempo debería en realidad llamarse «cronometría», como ha sugerido el distinguido teórico de la relatividad irlandés John L. Synge.[2.31]
Es importante para la base física de la teoría de la relatividad general que realmente existan en la Naturaleza, en un nivel fundamental, relojes extremadamente precisos, puesto que toda la teoría depende de una métrica g definida de manera natural.[2.32] De hecho, esta medida de tiempo es algo muy central para la física, pues hay un sentido claro en el que cualquier partícula masiva (estable) individual desempeña un papel como reloj prácticamente perfecto. Si m es la masa de la partícula (supuesta constante), entonces encontramos que tiene una energía en reposo[2.33] E dada por la famosa fórmula de Einstein
E = mc2,
que es fundamental para la teoría de la relatividad. La otra fórmula, casi igualmente famosa —fundamental para la teoría cuántica— es la de Max Planck
E = hν
(siendo h la constante de Planck), que nos dice que la energía en reposo de esta partícula define para ella una frecuencia concreta ν de oscilación cuántica (véase la Fig. 2.21). En otras palabras, cualquier partícula masiva estable se comporta como un reloj cuántico muy preciso, que marca «tics» con la frecuencia específica
exactamente proporcional a su masa, con una constante de proporcionalidad (fundamental) c2/h.
De hecho, la frecuencia cuántica de una única partícula es extremadamente alta, y no puede ser directamente aprovechada para hacer un reloj utilizable. Para un reloj que pueda ser utilizado en la práctica necesitamos un sistema que contenga muchas partículas, combinadas y actuando de manera adecuada en concierto. Pero el punto clave sigue siendo que para construir un reloj necesitamos masa. Las partículas sin masa (por ejemplo, fotones) solas no pueden ser utilizadas para hacer un reloj, porque sus frecuencias tendrían que ser cero; ¡pasaría una eternidad antes de que el «reloj» interno de un fotón marcase su primer «tic»! Este hecho será de gran importancia para nosotros más adelante.
Todo esto está de acuerdo con la Fig. 2.22, donde vemos diferentes relojes idénticos, todos los cuales tienen su origen en el mismo suceso p, pero moviéndose con velocidades diferentes que pueden ser comparables con (aunque menores que) la velocidad de la luz. Las 3-superficies en forma de cuenco (hiperboloides, en la geometría ordinaria) marcan los sucesivos «tics» de los relojes idénticos. (Estas 3-superficies son las equivalentes a esferas para la geometría de Minkowski, pues son superficies a «distancia» constante de un punto fijo). Notemos que una partícula sin masa, que tiene una línea de universo a lo largo del cono de luz, nunca llega siquiera a la primera de las superficies con forma de cuenco, en acuerdo con lo que se ha dicho antes.
Finalmente, la noción de una geodésica, para una curva de tipo tiempo, tiene una interpretación física como la línea de universo de una partícula masiva en movimiento libre bajo gravedad. Desde el punto de vista matemático, una línea geodésica de tipo tiempo l está caracterizada por el hecho de que para dos puntos cualesquiera p y q en l, no demasiado apartados, la curva más larga (en el sentido de longitud de tiempo proporcionada por g) desde p a q es de hecho una porción de l. Véase la Fig. 2.23: ésta es una curiosa inversión de la propiedad de minimización de longitud de las geodésicas en espacios euclidianos o riemannianos. La noción de geodésica se aplica también a las geodésicas nulas, cuya «longitud» es cero, y la estructura de conos nulos del espacio-tiempo es suficiente por sí sola para determinarlas. Esta estructura de conos nulos es realmente equivalente a la estructura conforme del espacio-tiempo, un hecho que tendrá gran importancia para nosotros más adelante.