5_Curved_Space

5
弯曲空间
5.1
球面几何
到目前为止,我们只考虑了平直欧几里得空间和狭义相对论中的平直时空(即闵可夫斯基空间)中的物理。在本章中,我们将涉足更一般的弯曲空间几何,并探讨它的一些物理应用。在下一章,我们将使用这里发展的数学工具来描述广义相对论的弯曲时空几何,即爱因斯坦的引力理论。
欧几里得空间是以希腊数学家欧几里得(Euclid)的名字命名的,他在公元前3世纪将古典几何最重要的成果汇编成他的《几何原本》。欧几里得从一小组定义和公理或公设开始。然后,他一步一步地构建出简单的结果,例如证明三角形的内角和等于两个直角——因此它们总和为180°或π弧度——并逐渐建立起关于多边形、圆和正立体结构的更复杂结果。两千年来,几何的概念就意味着欧几里得的几何。人们曾普遍认为欧几里得的结果在任何情况下都必须成立,以至于欧几里得几何与现实世界结构之间的直接对应关系被无条件接受。我们现在知道,这种信念是错误的。
欧几里得的几何甚至在像球面这样熟悉的曲面上也不成立。这是因为欧几里得的一条公理——平行公设——在球面上不成立。表述平行公设的方法有多种。根据其中一种表述,如果我们选择平面内的一条直线L和不在L上的一点P,那么我们总是可以通过P画出一条唯一且不与L相交的直线。这在平坦的平面上是正确的,但在弯曲的曲面上则不成立。在球面上,类似于直线的是大圆;经线就属于大圆。两条经线在赤道处看起来可能是平行的,但它们在北极和南极都会相交。球面上不存在平行线。
欧几里得任何依赖于平行公设的结果,例如三角形内角之和等于π的证明,在球面上都不成立。这如图5.1所示。在球面上,三角形的内角和为Σ∆= π + A/a²,其中A是三角形的面积,a是球面的半径。三角形的面积越大,内角和就越大。例如,图5.1中所示的球面三角形覆盖了球体的一个八分象限,因此其面积为A = (1/2)πa²,从而内角和为Σ∆= (3/2)π。通过观察该图可以确认这一点,图中清楚显示所有三个角都是直角。我们从生活在地球上的经验得知,在相对于整个地球而言很小的区域内,表面看起来近似是平坦的。上述公式与我们
《物理世界》。Nicholas Manton 和 Nicholas Mee,牛津大学出版社(2017年)。
© Nicholas Manton 和 Nicholas Mee。DOI 10.1093/acprof:oso/9780198795933.001.0001

球面几何
127
图5.1 一个画在地球表面上的球面三角形示例。该三角形的三个角都是直角。

直觉上,对于那些面积远小于整个球面面积的球面三角形,欧几里得几何中三角形内角和为π的结果仍是一个很好的近似。

5.1.1 测地线
要理解弯曲曲面的几何,我们需要一个更广义的直线概念。在平直空间中,直线是两点之间最短的路径。自然可将这一性质推广到可能弯曲的曲面上。我们熟悉的墨卡托世界地图扭曲了我们对距离的感知。在这些地图上,经线和纬线看起来都是直线,但经线是连接两点之间的最短路径,而纬线(赤道除外)则肯定不是。正如船舶和飞机导航员所熟知的,连接地球仪上两点的最短路径是大圆的一部分,大圆是像赤道一样与球体本身半径相同的圆。这些最短路径被称为测地线(geodesics),当空间弯曲时,它们就相当于直线。从词源上讲,geodesic一词源自希腊语。Geodesy意为测量,字面意思是划分大地。经线是测地线,因为它们是大学(大圆)的弧段,而纬线则不是。例如,如图5.2所示,从伦敦飞往东京的最短航线是沿一条大圆航线,它会使飞机深入到北极地区,尽管东京比伦敦靠南得多。

球面几何的另一个重要特征是它的均匀性。与平面几何一样,球面上所有的点在几何上都是等价的,并且从一点出发的所有方向也是等价的。这种几何被称为均匀且各向同性的。我们可以取一个几何对象,比如一个三角形,移动它、旋转它,它的几何性质不会改变。如果平面上两个不同位置的三角形的边长相等,那么它们全等,因此它们在顶点处的角也相等。球面三角形是以测地线段为边的三角形,它们具有类似的性质——位于不同位置、边长相同的三角形,在边相交处的角也自动相等。

128
弯曲空间
伦敦
东京
伦敦
东京
图5.2 左:墨卡托投影世界地图上伦敦与东京之间看似一条直线的路径。右:两座城市之间的最短路径实际上是一条大圆航线。
5.2
非欧几里得双曲几何
几个世纪以来,许多数学家对欧几里得的平行公设感到不安,因为它似乎比其他公设和公理复杂得多,看起来更像是一条定理。人们投入了大量的精力试图从其他更简单的公理中推导出它,但都没有成功。到了19世纪20年代,重新评估这一状况的时机已经成熟。突破几乎同时由三位数学家取得,他们独立地认识到,否定平行公设并不会导致任何矛盾。证明几何定理仍然是可能的,但他们发现的那些奇怪的几何结果并不适用于欧几里得几何;这些定理描述的是一种新的非欧几里得几何。卡尔·弗里德里希·高斯(Carl Friedrich Gauss)是19世纪初世界顶尖的数学家。他是第一个发现非欧几里得几何可能性的人,并私下里研究其性质多年。直到一位名叫亚诺什·鲍耶(János Bolyai)的年轻匈牙利数学家的工作引起他的注意时,他才透露了自己的研究。鲍耶独立地发现了许多与高斯相同的结果。人们很快意识到,第三位数学家尼古拉·罗巴切夫斯基(Nikolai Lobachevsky)也在一家俄罗斯期刊上发表了非常相似的成果。
虽然球面几何易于可视化,但非欧几里得几何并非如此。它是一种完全不同的二维几何,现在被称为双曲平面几何,或简称为双曲几何。与球面类似,双曲平面是一个弯曲的曲面(并非真正的平面),其中所有的点和所有的方向在几何上都是等价的,且它有一个尺度参数a,类似于球面的半径。当我们想到曲线和曲面时,我们通常认为它们是嵌入在平坦的三维空间中的。然而,与球面不同,双曲平面是无限的,无法作为一个整体曲面嵌入在三维空间中,但部分曲面可以嵌入,如图5.3所示。
非欧几里得几何的发现引发了数学思想史上最深刻的革命之一。两千年来,数学家和哲学家一直假定欧几里得几何建立在我们所生活的世界不可否认的真理之上。这一点由伊曼努尔·康德(Immanuel Kant)表述得最为清晰,他的哲学建立在这样一种信念之上:欧几里得公理是关于宇宙的直观真理原子。

高斯曲率
129
图5.3 嵌入三维空间中的双曲平面的一部分。与球面不同,在这种嵌入中无法展示双曲平面的对称性和均匀性。
康德(Kant)将其称为先天分析真理。康德进而论证,既然这些公理必然为真,那么欧几里得的定理——综合真理——必定自动适用于宇宙的结构。高斯(Gauss)、鲍耶(Bolyai)和罗巴切夫斯基(Lobachevsky)提供的新见解打破了这些观念。显然,几何学的公理,乃至整个数学,并不是一成不变的。数学家可以决定不同的公理集合并研究其推论。从此,数学系统的公理更像是游戏规则,在游戏开始前就已商定。它们必须一致且自足,但不必与现实有任何联系。数学家从此得以自由探索那些完全独立于任何物理基础的抽象领域。数学与物理学的分离也引发了空间实际几何是什么的问题。这将是一个由实验和测量来决定的问题。
高斯是第一个思考我们生活的空间可能不是以往所假设的平坦欧几里得三维空间的人;它可能是某种弯曲的三维空间。为了检验这一点,高斯利用了这样一个定理:在球面几何中,三角形的内角和大于π,而在双曲几何中则小于π,超出或不足的量取决于三角形的大小(见图5.1)。高斯在德国中部的哈尔茨山脉的三座山峰上架设了测量设备,以测量由连接山峰的测地线为边的三角形的性质。由于观测是目视的,这里隐含了一个假设:光线沿测地线传播。高斯测量了每个山峰处三角形两边之间的夹角,以确定角度之和是否为π。他发现确实如此,从而得出结论:空间是欧几里得的。(当然,高斯试图测量的是地球周围空间的曲率,而不是地球表面的曲率。)如果不是近一个世纪后爱因斯坦(Einstein)重新拾起这个问题,高斯的这些研究无疑早就被遗忘了。

5.3
高斯曲率
让我们跟随高斯的脚步,看看数学家是如何分析曲率的。在欧几里得三维空间中的一条曲线上,在任意一点P处,我们都能找到一个与曲线最精确相切的圆。其圆心称为曲率中心。如果P点处仅有微小的曲率,

130
弯曲空间
P
κ2
κ1
图 5.4 在球面上,每一点的两个曲率半径 κ1 和 κ2 指向同一方向,因此曲率为正。

这个圆的半径就大,而如果弯曲程度强,半径就小。因此,很自然地,我们用这个圆半径的倒数 κ 作为曲率的度量。
现在,考虑 3 维空间中一个曲面上的点 P。通过点 P 所有方向都有测地曲线,因此存在一个依赖于方向的单参数圆族,这些圆与这些测地线最精确地相切。这些圆曲率中的最大值和最小值被称为主曲率 (principal curvatures)。我们将其记为 κ1 和 κ2。它们被称为外蕴曲率 (extrinsic curvatures),因为它们依赖于曲面如何嵌入在 3 维空间中。然而,高斯 (Gauss) 意识到,它们的乘积 K = κ1κ2 是曲面在 P 点邻域的一个内蕴性质。K 被称为曲面在 P 点的高斯曲率 (Gaussian curvature)。

极大曲率与极小曲率曲线正交。在图 5.4 中,通过半径为 a 的球面上一点 P(代表性点),画出了两条正交的曲线。这两条曲线的曲率中心都是球心,因此 κ1 和 κ2 的大小和符号相同。两者都等于 1/a,因此球面的高斯曲率为正常数 K = 1/a²。

嵌入在 3 维空间中的双曲平面区域,形状如同马鞍或弯曲漏斗,如图 5.5 所示。插图显示了一个代表性点以及通过它的两条垂直测地线。曲率中心位于相反的方向,如箭头所示。这种情况下,κ1 和 κ2 被视为符号相反,高斯曲率 K 为负。在双曲平面上,K 是一个负常数 −1/a²,这正是其几何的定义性特征。
图 5.5 双曲平面的一个局部,形状像马鞍。κ1 和 κ2 符号相反。

内蕴地看,双曲平面围绕其任何一点都是圆对称的,就像球面一样。但当双曲平面嵌入 3 维空间时,这种对称性必然丢失。尽管图 5.5 所示的曲面围绕一个垂直轴具有圆对称性,但该轴上的任何点都不属于曲面,而且曲面上任何实际点处都没有圆对称性。如果嵌入的曲面围绕其某点具有圆对称性,那么在该点 κ1 和 κ2 就会相等,从而 K 为正或为零。因此,在嵌入中,双曲平面的完全对称性并不显现。

圆柱面提供了均匀曲面的第三个例子。在这种情况下,到其中一个曲率中心的距离为无穷大。(其中一个曲率圆退化为一条无穷长的直线。)因此,κ1 = 0,而 κ2 = 1/r(r 为圆柱半径),并且圆柱面的高斯曲率处处为零。

高斯曲率
131
P
κ₂
κ₁
图5.5 在双曲平面上,曲率半径κ₁和κ₂方向相反,因此曲率为负。

无限长直线。)因此κ₁或κ₂为零,且高斯曲率处处为零。因此,圆柱面上的几何局部地属于欧几里得(Euclid)的平坦平面几何,这一点我们可以通过将一张平坦的纸卷成圆柱来轻易验证。

高斯曲率K是曲面的一个内禀属性,因为它可以仅由测地线的行为以及曲面内的距离来确定。我们可以通过以下方式计算其在点P的值。考虑从P发出的一束测地线。沿着每条测地线标出一小段距离ε。所有距离P为ε的端点构成一条包围P的闭合曲线。如果曲面是平坦的,那么这条曲线是一个周长为C(ε) = 2πε的圆。对于弯曲的曲面,其周长会偏离这个结果。正曲率导致曲线缩短,负曲率导致曲线增长。例如,与欧几里得平面不同,在半径为a的球面上,靠近北极点处,距离极点为ε的纬度圈的周长为
C(ε) = 2πa sin(ε/a) = 2πa (ε/a - 1/6 ε³/a³ + …) = 2π (ε - 1/6 Kε³ + …), (5.1)
其中高斯曲率K已用1/a²代入。图5.6对此给出了说明。类似地,在双曲平面上,其周长为
C(ε) = 2πa sinh(ε/a) = 2πa (ε/a + 1/6 ε³/a³ + …) = 2π (ε - 1/6 Kε³ + …), (5.2)
此时K = -1/a²。

一般地,高斯曲率由以下内禀表达式给出
K = 3/π lim_{ε→0} (2πε - C(ε)) / ε³, (5.3)
这定义了任意点P的K。对于大多数曲面,其几何并非均匀,曲率逐点变化。例如,考虑一个嵌入在三维空间中的环面。

132
弯曲空间
P
C
a
ρ
ε
图5.6 高斯曲率:从北极点P到圆C的测地线距离为ε。该圆的周长为2πa sin(ε/a),其中a是球体的半径。

P₁
P₂
图5.7 嵌入三维空间中环面的曲率。在P₁点高斯曲率为正,在P₂点为负。

在环面上,诸如位于环面外缘的P₁点处,高斯曲率为正;而诸如位于环面内缘的P₂点处,曲率为负。如果对整个曲面积分高斯曲率,其总和为零。这或许看起来令人惊讶,但可以如下理解。一个环面完全可以是平坦的,处处曲率为零。这样的曲面本质上是一个对边认同的矩形,如图5.8所示。平坦环面只有通过扭曲才能嵌入三维空间,而这种扭曲改变了其高斯曲率。然而,这种扭曲并不会改变整个曲面上曲率的积分。¹

5.4 黎曼几何

非欧几里得的双曲几何的发现,仅仅是几何学新时代的开端。高斯的学生伯恩哈德·黎曼(Bernhard Riemann)发展了一套普适的内禀形式体系,使他能够分析任意

¹ 这一结果是高斯-博内定理(Gauss–Bonnet theorem)的一个特例。

黎曼几何
133
图 5.8 通过粘合矩形的对边形成环面。将长边粘合产生圆柱管,然后将管的两端弯曲并粘合以形成环面。
维度数目。我们将在此处呈现三维空间情况下黎曼几何的核心内容,并在随后将其推广到闵可夫斯基(Minkowski)和爱因斯坦(Einstein)的四维时空几何。黎曼方法的关键在于以一种推广毕达哥拉斯(Pythagoras)定理的方式捕捉空间的局部距离关系。
回顾在欧几里得几何中,点具有笛卡尔坐标 xi (i = 1, 2, 3),且点 xi 与 xi + δxi 之间的无穷小距离的平方为
δs2 = δx2
1 + δx2
2 + δx2
3 .
(5.4)
这一表达式被称为欧几里得度规。除非对于所有 i 均有 δxi = 0,否则 δs2 为正。
三维黎曼几何与此类似,但对此进行了推广。它同样假设一个点可以用三个坐标 yi (i = 1, 2, 3) 在局部唯一地标记。此处有一个记号上的变化;从现在起,坐标用上指标表示。当指标为抽象的拉丁或希腊字母而非数字时,这尤其方便。(重要的是,不要将坐标 y2 和 y3 与“y 的平方”和“y 的立方”相混淆。)
在黎曼几何中,假定坐标为 yi 和 yi + δyi 的无穷小分开的两点之间的距离平方具有以下形式
δs2 = gij(y)δyiδyj ,
(5.5)
其中 gij(y) 是一个 3×3 矩阵,它是坐标 y = (y1, y2, y3) 的光滑函数。此处还有另一个记号变化,称为求和约定。在这种紧凑记法中,重复指标表示对其求和,并省略显式的求和符号。gij 被取为对称矩阵,因为任何反对称部分对 δs2 没有贡献,这是由于 δyiδyj 必然是对称的。采用稍微更明显的形式(但省略自变量 y),
δs2 = gij δyiδyj = g11 (δy1)2 + g22 (δy2)2 + g33 (δy3)2
+2g12 δy1δy2 + 2g13 δy1δy3 + 2g23 δy2δy3 .
(5.6)
gij 被称为度规张量,而无穷小距离平方的表达式 (5.5) 被称为(黎曼)度规。假设对于任何 δyi,δs2 均为正。

134
弯曲空间
并非对所有 i 都为零。这就要求矩阵 gij 处处正定。将 δs 取为 δs2 的正平方根,并通过对 δs 积分来得到连接两点的路径长度。

度量张量 gij 的逆,记作 gij,是通常的 3 × 3 矩阵逆。由于 gij 是正定的,gij 处处存在且正定。度量张量与其逆之间的关系可写为
gijgjk = δi
k ,
(5.7)
这里对指标 j 采用求和约定。δi
k 被称为克罗内克(Kronecker) delta 符号。它等于单位矩阵,因此若指标 i 和 k 相同,δi
k = 1;若 i 和 k 不同,δi
k = 0。当指标升或降时,克罗内克 delta 保持不变,所以 δik 和 δik 也都是单位矩阵,所有矩阵元均为 1 或 0。

黎曼(Riemann)的基本洞见之一是,真正的几何量并不依赖于坐标系的选取。距离和度量与坐标无关,因此在坐标变换下,δs2 保持不变,而 yi 以及 gij 会改变。事实上,在一点处求值的 gij 并不携带任何几何信息。通过坐标变换,可以在该点将度量张量化成标准的欧几里得形式。因此,一般的黎曼几何在一点的无穷小邻域内与平坦几何无法区分。为形象地理解这意味着什么,我们可以考虑一个球面三角形,如图 5.1 所示。对于一个无穷小的三角形,其内角之和为 π,因此局部看来球面显得平坦。

5.4.1
一些度量的简单例子
让我们来看看几个熟悉几何中的黎曼度量:采用球极坐标的平坦空间,以及最简单的弯曲表面——二维球面(简称 2-球面)。我们还将看一看双曲几何。

我们从平坦三维空间和笛卡尔坐标 x1, x2, x3 开始。欧几里得度量为
δs2 = (δx1)2 + (δx2)2 + (δx3)2 ,
(5.8)
因此欧几里得度量张量为 gij = δij,或以矩阵形式:
gij =


1
0
0
0
1
0
0
0
1

⎠.
(5.9)
现在将坐标变换为球极坐标,y1 = r, y2 = ϑ, y3 = ϕ。坐标变换公式为
x1 = r sin ϑ cos ϕ,
x2 = r sin ϑ sin ϕ,
x3 = r cos ϑ .
(5.10)
无穷小坐标偏移可通过偏微分求得,给出
δx1

δr sin ϑ cos ϕ + r cos ϑ δϑ cos ϕ −r sin ϑ sin ϕ δϕ ,
δx2

δr sin ϑ sin ϕ + r cos ϑ δϑ sin ϕ + r sin ϑ cos ϕ δϕ ,
δx3

δr cos ϑ −r sin ϑ δϑ ,
(5.11)

黎曼几何
135
将这些表达式代入(5.8),我们得到相当简单的度规:
δs² = δr² + r²δϑ² + r² sin² ϑ δϕ² 。 (5.12)
球极坐标相当特殊,因为这里没有出现像δrδϑ这样的交叉项。将表达式(5.12)与方程(5.5)中度规的一般定义相匹配,即可得到球极坐标下的度规张量。其分量为:
g_{rr} = 1, g_{ϑϑ} = r², g_{ϕϕ} = r² sin² ϑ, g_{rϑ} = g_{rϕ} = g_{ϑϕ} = 0, (5.13)
它们组合成矩阵:
g_{ij}(r, ϑ, ϕ) =


1 0 0
0 r² 0
0 0 r² sin² ϑ

⎠ 。 (5.14)
该矩阵对坐标有非平凡的依赖关系;然而,几何仍然是平坦的欧几里得三维空间。(注意,方程(5.13)中的重复指标并不表示求和。这些指标只是度规张量分量的标记。)

现在我们可以把注意力限制在曲面 r = a 上,它是一个半径为 a 的二维球面,因此不是平坦的。r 是常数,所以度规中包含 δr 的项可以去掉。剩下的角坐标 ϑ 和 ϕ,使得(5.12)约化为球面度规:
δs² = a²(δϑ² + sin² ϑ δϕ²) 。 (5.15)
这是一个二维黎曼几何,其度规张量分量为:
g_{ϑϑ} = a², g_{ϕϕ} = a² sin² ϑ, g_{ϑϕ} = 0, (5.16)
或写成矩阵形式:
g_{ij} =


a² 0
0 a² sin² ϑ

⎠ 。 (5.17)
逆矩阵的分量为:
g^{ϑϑ} = 1/a², g^{ϕϕ} = 1/(a² sin² ϑ), g^{ϑϕ} = 0 。 (5.18)
如果改变坐标,二维球面度规看起来就不同了。如图 5.6 所示,我们不用角坐标 ϑ,而使用到竖轴的距离 ρ 以及方位角 ϕ。那么
ρ = a sin ϑ, δρ = a cos ϑ δϑ, (5.19)
可重新整理得出:
a² δϑ² = δρ² / (1 - ρ²/a²) = δρ² / (1 - Kρ²), a² sin² ϑ δϕ² = ρ² δϕ², (5.20)
其中 K = 1/a² 是高斯曲率。因此,在这些坐标下,度规(5.15)变为:
δs² = δρ² / (1 - Kρ²) + ρ² δϕ² 。 (5.21)
此公式在 ρ = a 处奇异,所以严格来说它只在北半球有效。

136
弯曲空间
球面上另一个有趣的坐标变换是:
x = 2 tan(ϑ/2) cos ϕ, y = 2 tan(ϑ/2) sin ϕ 。 (5.22)
此变换的逆为:
ϑ = 2 tan⁻¹ [ (x² + y²)^{1/2} / 2 ], ϕ = tan⁻¹(y/x) 。 (5.23)
微分得:
δϑ = (x δx + y δy) / { [1 + (x² + y²)/4] (x² + y²)^{1/2} }, δϕ = (-y δx + x δy) / (x² + y²) 。 (5.24)
我们还需要三角恒等式:
sin ϑ = (2 tan(ϑ/2)) / (1 + tan²(ϑ/2)) = (x² + y²)^{1/2} / [1 + (x² + y²)/4] 。 (5.25)
将这些量代入方程(5.15),交叉项消去,在新的坐标下球面度规简化为:
δs² = a² (δx² + δy²) / [1 + (x² + y²)/4]² 。 (5.26)
这是平面欧几里得度规 δx² + δy² 乘以一个非常数函数:
Ω(x, y) = a² / [1 + (x² + y²)/4]² 。 (5.27)
与欧几里得度规相差一个非常数的正因子 Ω 的度规,称为共形平坦的。共形因子 Ω 的效果是重新标度距离,但不改变角度。坐标 x, y 遍及整个平面,给出了整个球面(除南极点外)的度规,在南极点 tan(ϑ/2) 为无穷大。

双曲平面的度规是(5.15)的双曲对应:
δs² = a²(δϑ² + sinh² ϑ δϕ²) 。 (5.28)
通过坐标变换可得到(5.21)形式的度规,但这里 K = -1/a²,且 ρ 的范围是 0 ≤ ρ < ∞。类比于(5.22)的坐标变换:
x = 2 tanh(ϑ/2) cos ϕ, y = 2 tanh(ϑ/2) sin ϕ, (5.29)
应用于度规(5.28),得到结果:
δs² = a² (δx² + δy²) / [1 - (x² + y²)/4]², (5.30)
因此,与球面一样,双曲平面也是共形平坦的。现在坐标 x, y 必须限制在圆盘 x² + y² < 4 的内部。这种对双曲

张量
137
图5.9 用内角为π/4的等边三角形对庞加莱圆盘进行的无限镶嵌。
平面是由亨利·庞加莱(Henri Poincaré)发现的,并被称为庞加莱圆盘模型。它使得双曲平面相对容易可视化。可以证明,完整的测地线是与边界正交的圆弧段,并且到边界的真实距离是无限的。图5.9展示了用等边三角形(具有相等的双曲尺寸)对双曲平面进行的镶嵌,其边缘是测地线段。该图并未显示边缘的真实长度,但角度是正确的,因为庞加莱圆盘模型是保角正确的。可以看出,每个等边三角形的内角和小于π,因为在每个顶点处有八个三角形相遇,所以每个角为π/4。我们也很容易看出双曲平面定义性的非欧几里得本质。图5.10显示,存在无限多条通过P点且不与测地线L相交的测地线。换句话说,存在无限多条通过P点且“平行”于L的“直线”。从图中不明显的是,双曲几何是均匀的,没有任何点是特殊的。

度规(5.30)的一个性质是,在原点附近,它近似于平直度规a²(δx² + δy²)。如果我们使用重新标度的坐标X = ax,Y = ay,那么δs² ≃ δX² + δY²,并且仅有X和Y的二次项修正,因此在原点处度规张量为gij = δij (i, j = 1, 2),且gij的一阶偏导数在那里也为零。球面的度规(5.26)具有相同的性质。这是黎曼(Riemann)几何的一个普遍特征。在任意点P的邻域内,可以找到一个坐标系,使得度规张量为gij = δij,且仅有二次项修正。换句话说,度规张量的所有一阶导数在P点为零。以这种方式适配于P点的坐标系称为(黎曼)法坐标系。但即使在法坐标系中,度规的二阶偏导数一般并不为零。它们与P点处的空间曲率密切相关,我们将会看到这一点。

5.5 张量
在局域定义于一点P处、具有几何意义对象的自然表示方式是使用向量或更一般的张量。张量具有固有的结构,与坐标系无关。张量的分量在不同的坐标系中可能取不同的值,就像向量的分量在极坐标和笛卡尔坐标中不同一样,但这仅仅是由于从一个坐标系到另一个坐标系的变换所致。推而广之,在局域表达对象之间关系的唯一具有几何意义的方式就是作为张量方程。物理学的方程是张量方程,并且与坐标系无关,所以如果一个张量方程在一个坐标系中成立,那么它在所有其他坐标系中也成立。这在后续内容中将非常方便。

张量的基本例子是向量Vⁱ。我们可以从Vⁱ(在点P处,使用坐标yⁱ)构造的一个几何对象是微分算子
Vⁱ ∂/∂yⁱ,
并且我们认为它是坐标不变的。因此,如果我们改变坐标为zⁱ,那么向量具有新的分量Ṽⁱ,且
Ṽⁱ ∂/∂zⁱ = Vⁱ ∂/∂yⁱ。
现在,坐标zⁱ是坐标yʲ的某些函数,并且这种关系应是可逆的,至少在局域可逆,因此yʲ是坐标zⁱ的函数。我们可以求导并得到3×3的偏导数雅可比(Jacobi)矩阵∂zⁱ/∂yʲ。其元素可以被视为旧坐标或新坐标的函数。然后,无论是形式上还是使用链式法则,我们从方程(5.32)可以看出
Ṽⁱ = Vʲ ∂zⁱ/∂yʲ。

张量
139
这就是矢量分量在坐标变换下的变化规则。另一个有用的矩阵是雅可比矩阵(Jacobian matrix) ∂yj/∂zi 的逆矩阵,它正是原矩阵的逆。
除了矢量 V^i,还存在带下标的余矢量(covector) U_i。根据定义,在坐标变换下,U_i 的变换方式与 V^i 相反,使用的是雅可比矩阵的逆。余矢量的一个例子是标量场的梯度,
U_i = ∂ψ/∂y^i 。 (5.34)
采用坐标 z^i 可得
Ũ_i = ∂ψ/∂z^i = ∂ψ/∂y^j ∂y^j/∂z^i = U_j ∂y^j/∂z^i , (5.35)
这就证实了相反的变换规则。
一个张量可以有多个指标,既可带上标也可带下标。例如,W^{ij}_k 是一个具有两个上标和一个下标的三指标张量(3阶张量),在三维空间中有27个分量。坐标变换时,每个指标都会引入一个雅可比因子。
张量方程将两个同类型张量等同起来(或者等价地,令某个张量为零)。在坐标变换下,方程两边以完全相同的方式获得这些雅可比因子,因此,如果方程在某一个坐标系中成立,那么它在所有坐标系中都成立。
关于张量,有一些有用的构造方式。一对张量可以逐分量相乘,例如,W^{ij}_k U_l 就是一个四指标张量。另一种操作是指标收缩(contracting indices),它产生一个指标更少的张量。操作方法是:选取张量的一对指标,一上一下,令它们相等并对各项求和。其结果可以表示为一个收缩指标被移除的张量。例如,将 W^{ij}k 中的指标 k 和 j 收缩,可得到矢量
V^i = ∑
{j=1}^3 W^{ij}j 。 (5.36)
(使用求和约定,上式可写为 V^i = W^{ij}j。)在坐标变换下,由于按照这种方式收缩指标时两个雅可比因子相互抵消,V^i 如矢量般变换。指标收缩的另一个例子是余矢量 U_i 与矢量 V^i 的乘积(对 i 求和),得到标量 φ = U_i V^i,该标量在坐标变换下保持不变。这就是两个矢量点积在一般黎曼空间(Riemannian space)中的类比。
利用度规张量(metric tensor)及其逆,再配合指标收缩,还可以对张量进行操作。从一个矢量 V^i 可以构造出一个余矢量
V_i = g
{ij} V^j 。 (5.37)
这一操作称为指标下降(index lowering)。类似地,可以将余矢量 U_i 的指标上升,得到矢量 U^i = g^{ij} U_j。指标下降与上升互为逆操作。下列各量完全相同:
φ = U_i V^i = g
{ij} U^j V^i = g^{ij} U_i V_j 。 (5.38)
对于一般的张量,可以对其任意指标进行上升或下降操作。指标经过上升或下降的张量,其分量值会有所不同(除非度规是欧几里得的),但所承载的几何信息本质上相同。

140
弯曲空间
图5.11 左:在笛卡尔坐标系中向量的平移不涉及坐标基的改变。右:在极坐标系中向量的平移需要基的改变。
5.5.1 协变导数与克里斯托费尔符号
回想一下,黎曼几何的基本特征是局部几何是欧几里得的。在一点附近存在一个法坐标系,使得度量张量为克罗内克δ,并且度量张量的所有一阶导数都为零。后一个性质与前一个同样重要,因为它使得许多公式可以大大简化。如果我们找到一个在法坐标下局部成立的方程,通常可以推导出一个等价的张量方程,然后确保它在任何其他坐标系中也成立。这是寻找张量方程的一种有力方法。
张量表示空间某一点的几何对象,而张量场则表示整个空间中的几何对象。为了理解矢量场和张量场如何逐点变化,我们需要确定在这种场中微分如何在弯曲空间中工作。
考虑平坦欧几里得空间中的标量场。我们可以通过取其梯度来计算它在每个空间方向上的变化,并以此方式生成一个(余)矢量场。使用笛卡尔坐标,我们可以对矢量场或余矢量场执行相同的梯度操作,并生成一个二阶张量场。然而,在弯曲空间中,或者甚至在平坦空间中但使用一般坐标,微分并不是张量性的,因为它涉及取相邻点处张量的差,而第二个点处的坐标基可能与第一个点处的坐标基不同。例如,在极坐标系下的平面中就是这种情况,如图5.11所示。在左侧,图显示了一个矢量在笛卡尔坐标系中两点之间的平移。在两点使用相同的基来分解矢量,我们看到矢量的分量是相同的,因此在无穷小意义上,梯度为零。在右侧,图显示了该矢量在极坐标系中的平移。该矢量在两点分解成径向和角向分量的方式相当不同,因此天真地看它有一个非零梯度,但这种矢量的表观空间变化仅仅是由于坐标系造成的。
我们需要找到一个在平坦或弯曲空间中都能协变地工作的导数算子,使得矢量的协变导数在任何坐标系中都是一个二阶张量,并且一般而言,n阶张量的协变导数是一个n+1阶张量。协变意味着以相同的方式变换,因此协变导数的基本性质是

张量
141
秩为n的张量应当像秩为n+1的张量那样在坐标变换下进行变换。
这一要求通过以下方式得以满足。在度规张量的一阶导数为零的点处,协变导数就是通常的梯度,其分量仅为偏导数。如果度规张量的导数不为零,那么协变导数会包含一个修正项,该修正项源于为使度规张量的导数局域为零所需的坐标变换。通过考虑必要的坐标变换可以显式地找到这个修正项;但有一种更好的方法可以避免改变坐标。并不奇怪,正如我们将看到的,这个修正项包含度规张量的导数。
矢量场V i的协变导数
D
Dyj 为
DV i
Dyj = ∂V i
∂yj + Γi
jkV k ,
(5.39)
其中第二项是修正项。引入克里斯托费尔符号(Christoffel symbols)Γi
jk是为了弥补偏导数
∂V i
∂yj 缺乏协变性的缺陷。这里有三个指标,并对k求和,以平衡方程中的指标。我们尚未确定Γi
jk的具体形式,但很快会给出。
标量场的协变导数就是标准的偏导数,并且如果我们要求标量φ = UiV i的协变导数满足莱布尼茨法则,那么余矢量场Ui的协变导数必定为
DUi
Dyj = ∂Ui
∂yj −Γk
jiUk .
(5.40)
当协变导数作用于标量φ = UiV i时,克里斯托费尔符号会相互抵消,如下面的计算所示:
D(UiV i)
Dyj

DUi
Dyj V i + Ui
DV i
Dyj

∂Ui
∂yj V i −Γk
jiUkV i + Ui
∂V i
∂yj + UiΓi
jkV k

∂Ui
∂yj V i + Ui
∂V i
∂yj = ∂(UiV i)
∂yj
.
(5.41)
(重复指标均表示求和。我们可以改变这些指标的标记而不影响表达式,因此在上面第二行的最后一项中,我们交换了指标标记i和k。这样就清楚地看到含Γ的项抵消了。)
类似地,我们可以通过再次要求协变导数遵循莱布尼茨导数规则,将其作用推广到更高秩的张量。例如,张量Wij (它可以是两个余矢量的外积UiVj)的协变导数为
DWij
Dyk = ∂Wij
∂yk −Γl
kiWlj −Γl
kjWil ,
(5.42)
其中每个张量指标对应一个Γ项。特别地,度规张量的协变导数

142
弯曲空间
张量为
Dgij
Dyk = ∂gij
∂yk −Γl
kiglj −Γl
kjgil .
(5.43)
如前所述,在一点附近的法坐标系中,度规张量 gij 等于克罗内克δ符号 δij,同样重要的是,其导数为零,即
∂gij
∂yk = 0 .
(5.44)
这并不是一个张量方程,但协变导数在法坐标系中必须约化为此式,从而我们知道以下是一个等效的张量方程:
Dgij
Dyk = 0 .
(5.45)
这个协变方程在一个坐标系(法坐标系)中成立,因此它必定在所有的坐标系中都成立,而这几乎足以确定 Γi
jk。
为方便起见,我们现在将使用逗号表示偏导数来简化记号,即 ‘,i’ 表示对坐标 yi 求导,而 ‘,ij’ 表示对 yi 和 yj 的双重求导。按照这一新记号,
Dgij
Dyk = gij,k −Γl
kiglj −Γl
kjgil = 0 .
(5.46)
因此
gij,k = Γl
kiglj + Γl
kjgil ,
(5.47)
并置换指标,得
gik,j

Γl
jiglk + Γl
jkgil ,
(5.48)
gjk,i

Γl
ijglk + Γl
ikgjl .
(5.49)
现在,作为最后一个条件,我们要求 Γi
jk 关于其两个下指标对称。然后,将方程 (5.47) 和 (5.48) 相加并减去方程 (5.49),我们得到
gij,k + gik,j −gjk,i = 2Γl
jkgil ,
(5.50)
其中我们用到了 Γi
jk 关于 jk 的对称性假设。用逆度规张量 gim 乘以两边并对 i 求和,我们得到最终表达式
Γm
jk = 1
2gim(gij,k + gik,j −gjk,i) ,
(5.51)
它用度规张量的导数确定了克里斯托费尔符号(Christoffel symbols)。
克里斯托费尔符号在黎曼几何(Riemannian geometry)中扮演着非常重要的角色,尽管它们并非张量的分量。在 P 点的法坐标系中,度规张量的导数为零,因此克里斯托费尔符号在 P 点也为零。如果它们是张量分量,那么在一个坐标系中为零将会使它们在所有坐标系中都为零。

黎曼曲率张量
143
5.5.2
平面极坐标下的克里斯托费尔符号
为了对克里斯托费尔符号有所熟悉,让我们在平面内用极坐标将它们计算出来。度规为 δs2 = δr2 + r2δϑ2,因此度规张量的分量为
grr = 1 ,
gϑϑ = r2 ,
grϑ = 0 ,
(5.52)
且度规张量唯一的非零导数为 gϑϑ,r = 2r。在二维情形,一般有六个克里斯托费尔符号(考虑到下指标的对称性),但在这里,非零的克里斯托费尔符号只有
Γϑ
rϑ = Γϑ
ϑr = 1
2gϑϑ(gϑr,ϑ + gϑϑ,r −grϑ,ϑ) = 1
2
 1
r2

2r = 1
r
(5.53)

Γr
ϑϑ = 1
2grr(grϑ,ϑ + grϑ,ϑ −gϑϑ,r) = 1
2(−2r) = −r .
(5.54)
因为平面是平坦的,克里斯托费尔符号在笛卡尔坐标下为零,但在极坐标下不为零。这是必要的,以便补偿一个向量移动时坐标基底的变化,如图 5.11 所示。

5.6
黎曼曲率张量
P
B
B
A
A
图 5.12 弯曲空间中一个向量沿两条不同路径平移的比较。
黎曼(Riemann)发现了一个几何对象,如今被称为黎曼曲率张量(Riemann curvature tensor,简称黎曼张量),它包含了任意维数下每一点曲率的全部信息。图 5.12 展示了它是如何被确定的。一个切向量从 P 点沿方向 A 平移一小段距离,再沿方向 B 平移一小段距离,然后将它与同一个向量先沿方向 B 平移一小段距离,再沿方向 A 平移一小段距离的结果进行比较。在平坦空间中,不会有任何差别;无论走哪条路径,向量的最终位置和取向都相同。然而,如图 5.12 所示,在弯曲空间中存在差别,且这一差别依赖于曲率。这可以用代数表示为协变导数不

144
弯曲空间

在弯曲空间中不对易——它们的顺序至关重要。黎曼张量 (R^i_{\ jkl}) 定义为作用于任意矢量场 (V^i) 的协变导数的对易子,
[
R^i_{\ jkl}V^j = \left( \frac{D}{Dy^k}\frac{D}{Dy^l} - \frac{D}{Dy^l}\frac{D}{Dy^k} \right) V^i .
\tag{5.55}
]
对易子是先以一种顺序求值、再以另一种顺序求值的双重协变导数之差。(标准偏导数的对易子为零,因为混合偏导数具有对称性。)

现在我们可以推导出 (R^i_{\ jkl}) 的显式公式。矢量场 (V^i) 的双重协变导数是对 (V^i) 的单次协变导数(即方程(5.39)中给出的具有一个上指标和一个下指标的二阶张量)再求协变导数。我们得到(使用偏导数的简记符号)
[
\begin{aligned}
\frac{D}{Dy^k}\frac{D}{Dy^l} V^i
&= \frac{D}{Dy^k}\left( V^i_{,l} + \Gamma^i_{lj}V^j \right) \
&= V^i_{,lk} + \Gamma^i_{lj,k}V^j + \Gamma^i_{lj}V^j_{,k} + \Gamma^i_{kj}V^j_{,l} + \Gamma^i_{km}\Gamma^m_{lj}V^j \
&\quad -\Gamma^m_{kl}V^i_{,m} - \Gamma^m_{kl}\Gamma^i_{mj}V^j .
\end{aligned}
\tag{5.56}
]
此等式右边第一、第六和第七项在交换指标 (k) 和 (l) 时是对称的,第三与第四项之和同样是对称的。(这包括了所有含有 (V^i) 导数的项。)唯一不对称的项是 (\Gamma^i_{lj,k}V^j) 和 (\Gamma^i_{km}\Gamma^m_{lj}V^j)。如果我们现在减去以相反顺序求值得到的双重协变导数的类似表达式,那么所有对称项就会对消,我们便得到了黎曼张量的公式
[
R^i_{\ jkl} = \Gamma^i_{lj,k} - \Gamma^i_{kj,l} + \Gamma^i_{km}\Gamma^m_{lj} - \Gamma^i_{lm}\Gamma^m_{kj} .
\tag{5.57}
]
根据构造,该张量对其指标 (k) 和 (l) 是反对称的。

黎曼曲率张量是高斯曲率的高维推广。它涉及克里斯托费尔(Christoffel)符号的一阶导数,因此依赖于度规张量 (g_{ij}) 的二阶导数。我们可以通过乘以度规张量并收缩指标来下降第一个指标,从而得到更对称的黎曼张量
[
R_{ijkl} = g_{im} R^m_{\ jkl} .
\tag{5.58}
]
虽然并不明显,(R_{ijkl}) 还具有一些进一步的对称性。它在指标 (ij) 上是反对称的,在 (kl) 上也是反对称的,并且在交换指标对 (ij) 与 (kl) 时是对称的。它在其后三个指标上还具有循环对称性
[
R_{ijkl} + R_{iklj} + R_{iljk} = 0 ,
\tag{5.59}
]
这被称为第一比安基恒等式(Bianchi identity)。这些对称性可以通过在法坐标系中,将 (R_{ijkl}) 完全用度规张量及其二阶导数表示而最容易地展示出来。

对于在所有方向上具有恒定(均匀)曲率的空间,黎曼张量在任何坐标系下都简化为
[
R_{ijkl} = C(g_{ik}g_{jl} - g_{il}g_{jk}) ,
\tag{5.60}
]
其中 (C) 为常数。注意这一表达式与指标对称性是一致的。

黎曼曲率张量
145
5.6.1 平面极坐标下的黎曼曲率
我们在第5.5.2节已经看到,即便在欧几里得平面上,某些克里斯托费尔符号在极坐标下也是非零的。现在考察一下极坐标下的黎曼曲率张量是很有启发性的。
克里斯托费尔符号(5.53)和(5.54)仅有的非零导数为
Γϑ
rϑ,r = Γϑ
ϑr,r = −1
r2 ,
Γr
ϑϑ,r = −1 .
(5.61)
黎曼张量由方程(5.57)给出,它的所有分量都恒等于零。例如,
Rr
ϑϑr

Γr
rϑ,ϑ −Γr
ϑϑ,r + Γr
ϑrΓr
rϑ + Γr
ϑϑΓϑ
rϑ −Γr
rrΓr
ϑϑ −Γr
rϑΓϑ
ϑϑ

0 + 1 + 0 −r
1
r

−0 −0 = 0 .
(5.62)
这证实了我们在平直空间中所预期的结果。
5.6.2 球面上的黎曼曲率
二维球面是一个弯曲空间的例子,其上的非零黎曼张量可以很容易地计算出来。在角坐标下,度规张量分量为
gϑϑ = a2 ,
gϕϕ = a2 sin2 ϑ ,
gϑϕ = 0 ,
(5.63)
它们仅有的非零导数为
gϕϕ,ϑ = 2a2 sin ϑ cos ϑ .
(5.64)
因此,仅有的非零克里斯托费尔符号为
Γϕ
ϑϕ = Γϕ
ϕϑ

1
2gϕϕ(gϕϑ,ϕ + gϕϕ,ϑ −gϑϕ,ϕ)

1
2

1
a2 sin2 ϑ

(2a2 sin ϑ cos ϑ)

cos ϑ
sin ϑ
(5.65)

Γϑ
ϕϕ = 1
2gϑϑ(gϑϕ,ϕ + gϑϕ,ϕ −gϕϕ,ϑ) = −sin ϑ cos ϑ .
(5.66)
于是,略去为零的项,

ϕϑϕ

Γϑ
ϕϕ,ϑ −Γϑ
ϕϕΓϕ
ϑϕ

−cos2 ϑ + sin2 ϑ + sin ϑ cos ϑ
cos ϑ
sin ϑ


sin2 ϑ
(5.67)
并且,降下第一个指标,
Rϑϕϑϕ = gϑϑRϑ
ϕϑϕ = a2 sin2 ϑ .
(5.68)
这基本上是球面上黎曼张量唯一的分量,因为所有其他非零分量都可以通过指标的对称性与这个分量联系起来。

146
弯曲空间
二维球面具有常曲率,因为我们可以将黎曼张量写成方程(5.60)的形式:
Rϑϕϑϕ = 1
a2 (gϑϑgϕϕ −gϑϕgϕϑ) = a2 sin2 ϑ .
(5.69)
在二维情形下,(5.60)中的常数C可以认定为高斯曲率,
K =
1
a2 .
5.6.3 三维球面
另一个具有常曲率的黎曼空间例子是三维球面,或简称3-球面。它是四维欧几里得空间中半径固定为a的球面。它在广义相对论和宇宙学中有重要的应用。
欧几里得四维空间具有笛卡儿坐标(x1, x2, x3, x4)和度规δs2 = (δx1)2 + (δx2)2 + (δx3)2 + (δx4)2。通过以下公式转换到极坐标:
x1

R sin χ sin ϑ cos ϕ ,
x2 = R sin χ sin ϑ sin ϕ ,
x3

R sin χ cos ϑ ,
x4 = R cos χ .
(5.70)
然后,类似于坐标变换(5.11)的计算可得极坐标下的度规
δs2 = δR2 + R2δχ2 + R2 sin2 χ(δϑ2 + sin2 ϑ δϕ2) .
(5.71)
固定R = a,我们得到3-球面上的度规
δs2 = a2(δχ2 + sin2 χ(δϑ2 + sin2 ϑ δϕ2)) .
(5.72)
通过坐标变换r = a sin χ,可以得到3-球面度规的另一种形式。度规(5.72)变为
δs2 =
δr2
1 −Kr2 + r2(δϑ2 + sin2 ϑ δϕ2) ,
(5.73)
其中K = 1
a2。这与二维球面度规(5.21)相对应。3-球面的任何赤道切片,例如切片ϑ = π
2,都是一个具有高斯曲率K的二维球面。取极限K →0,我们就恢复了欧几里得三维空间度规(5.12)。
3-球面度规的最后一种形式,我们不准备明确推导,但它等价于二维球面度规(5.26),即
δs2 = a2
δx2 + δy2 + δz2
1 + 1
4(x2 + y2 + z2)
2 = a2
δx · δx
1 + 1
4x · x
2 .
(5.74)
这个公式表明3-球面是一个共形平直空间。当x的取值范围覆盖整个(标准)三维空间时,除了一个点之外,整个球面都被覆盖到了。
5.7 测地线方程
有了黎曼及其后继者建立的一些工具,我们现在来考察粒子如何在弯曲空间中运动。首先,我们需要理解路径

测地线方程
147
在一个具有坐标 (y^i) 和度规张量 (g_{ij}) 的黎曼空间中。连接端点 G 和 H 的路径总长度 (s) 由以下积分给出²:
[
s = \int_{G}^{H} ds = \int_{G}^{H} \sqrt{g_{jk}(y) , dy^j , dy^k}.
\tag{5.75}
]
如果我们沿路径引入一个参数 (\lambda),那么路径由矢量函数 (y(\lambda) = (y^1(\lambda), y^2(\lambda), y^3(\lambda))) 给出,进而我们可以将路径长度转化为一个常规积分:
[
s = \int_{\lambda(G)}^{\lambda(H)} \sqrt{g_{jk}(y(\lambda)) \frac{dy^j}{d\lambda} \frac{dy^k}{d\lambda}} , d\lambda,
\tag{5.76}
]
实际上,该积分与参数化方式的选择无关。特别重要的是连接 G 到 H 的测地线或最短路径。这通过对 (s) 求极小值得到。

我们可以很自然地预期,正如平坦空间中的自由运动粒子沿直线运动一样,弯曲空间中的自由运动(惯性)粒子遵循测地线运动。因此,我们可以通过对粒子的作用量求极小值,而不是通过对路径长度 (s) 求极小值,来推导测地线方程。

考虑一个质量为 (m) 的粒子沿着路径 (y(t)) 从 G 运动到 H,其中参数 (t) 现在是时间。该粒子的速率为:
[
\frac{ds}{dt} = \sqrt{g_{jk}(y(t)) \frac{dy^j}{dt} \frac{dy^k}{dt}},
\tag{5.77}
]
其动能是质量乘以速率平方的一半:
[
\frac{1}{2}m \left( \frac{ds}{dt} \right)^2 = \frac{1}{2}m , g_{jk}(y(t)) \frac{dy^j}{dt} \frac{dy^k}{dt}.
\tag{5.78}
]
通过与平坦空间中粒子运动的表达式 (2.53) 类比,我们将粒子的作用量定义为:
[
S = \int_{t_0}^{t_1} \frac{1}{2}m , g_{jk}(y(t)) \frac{dy^j}{dt} \frac{dy^k}{dt} , dt,
\tag{5.79}
]
被积函数,即拉格朗日量,正是动能。如果粒子受到势能的影响,那么 (S) 会有进一步的贡献。如常,最小作用量原理要求真实的粒子运动是使 (S) 取极小值的路径 (y(t))。

路径长度和作用量在几何上都是有意义的,因为它们不依赖于所使用的坐标系。这是因为它们都是由一个基本的几何量——无穷小距离 (ds)——构建而成的。作用量 (S) 比路径长度 (s) 更易于使用,因为它不包含平方根,但与路径长度不同,(S) 确实依赖于参数化方式。(t) 不仅仅是沿路径的任意参数,而是物理时间。

² 在积分中,使用 (ds) 而不是 (\delta s) 来表示无穷小长度元更有意义。

148
弯曲空间

粒子的运动方程是由作用量 (S) 导出的欧拉-拉格朗日方程(通过变分法得到),即
[
\frac{d}{dt}\left( m, g_{lj}(y) \frac{dy^{j}}{dt} \right) - \frac{\partial}{\partial y^{l}}\left( \frac{1}{2}m, g_{jk}(y) \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} \right) = 0 .
\tag{5.80}
]
(注意 (m) 消掉了。)将导数展开,运动方程变为
[
g_{lj} \frac{d^{2}y^{j}}{dt^{2}} + \left( g_{lj,k} - \frac{1}{2} g_{jk,l} \right) \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} = 0 .
\tag{5.81}
]
括号中的第一项来源于 (g_{lj}(y)) 通过 (y(t)) 的时间依赖关系,它关于 (j) 和 (k) 并不对称;但由于它乘以对称的 (\frac{dy^{j}}{dt} \frac{dy^{k}}{dt}),我们可以显式地将这一项对称化,得到
[
g_{lj} \frac{d^{2}y^{j}}{dt^{2}} + \frac{1}{2} (g_{lj,k} + g_{lk,j} - g_{jk,l}) \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} = 0 .
\tag{5.82}
]
然后乘以逆度规 (g^{il}),给出
[
\frac{d^{2}y^{i}}{dt^{2}} + \frac{1}{2} g^{il} (g_{lj,k} + g_{lk,j} - g_{jk,l}) \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} = 0 .
\tag{5.83}
]
第二项包含逆度规与度规一阶导数的组合,这应该是我们熟悉的。它是一个克里斯托费尔符号(Christoffel symbol),正如第5.5.1节所导出的那样,因此运动方程的最终形式为
[
\frac{d^{2}y^{i}}{dt^{2}} + \Gamma^{i}_{jk} \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} = 0 .
\tag{5.84}
]
这就是测地线方程。它的解描述粒子沿测地线运动。

方程(5.84)是弯曲空间中运动与平直空间中自由粒子运动方程的类比;后者在笛卡尔坐标下为 (\frac{d^{2}x^{i}}{dt^{2}} = 0),表明粒子没有加速度,并沿直线运动。如果我们在 (P) 点附近采用法坐标系,则所有克里斯托费尔符号 (\Gamma^{i}_{jk}) 在 (P) 点为零,因此对于任何测地线运动,在 (P) 点的加速度 (\frac{d^{2}y^{i}}{dt^{2}}) 也为零。通过考虑沿粒子轨迹改变到局部法坐标的整个坐标变换族,我们发现在任何地方都没有真正的加速度,因此没有真正的力在作用。这是测地线运动的特征。然而,我们通常希望在围绕粒子轨迹的扩展区域内使用单一坐标系,此时就会出现非零的坐标加速度,它由方程(5.84)的第二项主导。我们说这些加速度是由虚拟力产生的。注意,它们对速度分量 (\frac{dy^{i}}{dt}) 是二次的。

测地线运动以恒定的速率进行,该速率由方程(5.77)给出。这可以从几个方面来理解。可以直接验证
[
\frac{d}{dt}\left( g_{jk}(y(t)) \frac{dy^{j}}{dt} \frac{dy^{k}}{dt} \right) = 0 ,
\tag{5.85}
]
这需要使用测地线方程(5.84)以及用度规表示的 (\Gamma^{i}_{jk}) 公式。更简单地说,正如上一段所论证的,在法坐标系中,速率显然……

测地线方程

由于加速度为零,速度恒定。最后,因为能量纯粹是动能,能量守恒等价于速率守恒。

设$\lambda$是沿测地线的长度参数,而非任意参数。由于测地线运动以恒定速率进行,$\lambda$是$t$的常数倍。因此,测地线方程的几何形式为
[
\frac{d^2 y^i}{d\lambda^2} + \Gamma^i_{jk} \frac{dy^j}{d\lambda} \frac{dy^k}{d\lambda} = 0,
\tag{5.86}
]
再结合长度与度规关系的辅助表达式:
[
g_{jk}(y) \frac{dy^j}{d\lambda} \frac{dy^k}{d\lambda} = 1.
\tag{5.87}
]

\subsection*{5.7.1 平面极坐标中的测地线}

作为例证,我们考虑平面中采用极坐标$r$和$\vartheta$的测地线方程。

常数$r$的圆不是测地线。一个粒子以恒定角速度沿这样的圆运动时,没有坐标加速度,但它受到一个真实的径向向内的力,正如我们在第2.6节讨论圆轨道时所看到的那样。另一方面,测地线运动涉及坐标加速度。在第5.5.2节中,我们发现非零的克里斯托费尔(Christoffel)符号为
[
\Gamma^r_{\vartheta\vartheta} = -r, \quad \Gamma^\vartheta_{r\vartheta} = \frac{1}{r},
\tag{5.88}
]
如果将这些代入方程(5.84),我们得到测地线方程的两个分量:
[
\frac{d^2 r}{dt^2} - r \left( \frac{d\vartheta}{dt} \right)^2 = 0, \quad \frac{d^2 \vartheta}{dt^2} + \frac{2}{r} \frac{dr}{dt} \frac{d\vartheta}{dt} = 0.
\tag{5.89}
]
这些方程包含了由离心力$mr \left( \frac{d\vartheta}{dt} \right)^2$和科里奥利力$-\frac{2m}{r} \frac{dr}{dt} \frac{d\vartheta}{dt}$引起的坐标加速度。这些都是虚拟力的例子。离心力沿径向向外。虽然不明显,但求解这些方程得到的测地线是平面中的直线。

\subsection*{5.7.2 测地线偏离方程}

如果平面中的两条直线平行,它们之间的距离是固定的。如果它们相交,则它们的间距以恒定速率增加或减小,如图5.13所示。设$\lambda$为沿两直线距离的参数,并设$\eta(\lambda)$为两直线上对应点之间的间距。那么$\frac{d\eta}{d\lambda}$为常数。再次求导得到
[
\frac{d^2 \eta}{d\lambda^2} = 0,
\tag{5.90}
]
这是测地线偏离方程的一个相当平凡的例子。

现在我们来确定半径为$a$的球面上的测地线偏离,其中测地线是大圆。考虑两条这样的测地线,它们在北(North)极以角度$\phi$相交,如图5.14所示。它们的间距先增大,直到到达赤道,然后减小,直到在南(South)极再次相遇。计算测地线之间的间距$\eta$是很直接的。如果我们再次用$\lambda$参数化沿测地线的距离,那么
[
\eta(\lambda) = \left( a \sin \frac{\lambda}{a} \right) \phi.
\tag{5.91}
]
对$\lambda$求导两次,我们得到
[
\frac{d^2 \eta}{d\lambda^2} + \frac{1}{a^2} \eta = 0,
\tag{5.92}
]
或等价地
[
\frac{d^2 \eta}{d\lambda^2} + K \eta = 0,
\tag{5.93}
]
其中$K = \frac{1}{a^2}$是高斯(Gaussian)曲率。这就是球面上的测地线偏离方程。

为了确定一般黎曼(Riemannian)空间中的测地线偏离方程,我们进行类似的但不那么明确的计算。我们取一条测地线$y(\lambda)$,以及附近的一条测地线$y(\lambda) + \eta(\lambda)$,它们之间相隔一个小向量$\eta$。

测地线方程
151
这些分别满足测地线方程
[
\frac{d^2 y^i}{d\lambda^2} + \Gamma^i_{jk}(y)\frac{dy^j}{d\lambda}\frac{dy^k}{d\lambda} = 0 \tag{5.94}
]
及其邻近变体
[
\frac{d^2 (y+\eta)^i}{d\lambda^2} + \Gamma^i_{jk}(y+\eta)\frac{d(y+\eta)^j}{d\lambda}\frac{d(y+\eta)^k}{d\lambda} = 0 . \tag{5.95}
]
将方程(5.95)展开至 (\eta) 的线性阶,并减去方程(5.94),我们得到关于 (\eta) 的线性方程:
[
\frac{d^2 \eta^i}{d\lambda^2} + \Gamma^i_{jk,l} \eta^l \frac{dy^j}{d\lambda}\frac{dy^k}{d\lambda} + 2\Gamma^i_{jk}\frac{dy^j}{d\lambda}\frac{d\eta^k}{d\lambda} = 0 . \tag{5.96}
]
这里我们略去了 (\eta) 的二次及更高阶项,并省略了克里斯托费尔符号(Christoffel symbols)对 (y) 的依赖关系。该方程并非明显几何的或协变的,但可以利用黎曼张量(Riemann tensor)将其改写成更为简洁的形式。

为证明这一点,我们需要曲线 (y(\lambda)) 上协变导数(covariant derivative)的概念。对于场 (V^i),沿曲线的协变导数记作 (\frac{DV^i}{D\lambda}),它是空间中沿曲线方向的协变导数的投影:
[
\frac{DV^i}{D\lambda} = \frac{DV^i}{Dy^j}\frac{dy^j}{d\lambda} = \left(\frac{\partial V^i}{\partial y^j} + \Gamma^i_{jk}V^k\right)\frac{dy^j}{d\lambda} = \frac{dV^i}{d\lambda} + \Gamma^i_{jk}V^k \frac{dy^j}{d\lambda}. \tag{5.97}
]
最后一个表达式包含了沿曲线的 (V^i) 及其导数 (\frac{dV^i}{d\lambda})。因此,它对于仅定义在曲线上而非全空间的矢量量特别有用。这种矢量的一个例子是沿测地线运动的粒子的速度 (\frac{dy^i}{dt})。

测地线运动方程(5.84)可以重新表达为
[
\frac{D}{Dt}\frac{dy^i}{dt} = 0 , \tag{5.98}
]
因此不仅粒子的速率是常数,速度矢量也是协变常矢量。

测地线偏离矢量(geodesic deviation vector) (\eta) 仅定义在测地线上。它沿测地线的协变导数为
[
\frac{D\eta^i}{D\lambda} = \frac{d\eta^i}{d\lambda} + \Gamma^i_{jk}\eta^k \frac{dy^j}{d\lambda}, \tag{5.99}
]

152
弯曲空间
且由于这也是沿测地线的矢量,有进一步的协变导数:
D2ηi
Dλ2

d

dηi
dλ + Γi
jkηk dyj


+ Γi
jk
dηk
dλ + Γk
lmηm dyl

 dyj

d2ηi
dλ2 + Γi
jk,l
dyl
dλ ηk dyj
dλ + 2Γi
jk
dηk

dyj
dλ + Γi
jkηk d2yj
dλ2
+Γi
jkΓk
lmηm dyl

dyj
dλ .
(5.100)
现在可以利用方程(5.96)消去项 d2ηi
dλ2 + 2Γi
jk
dηk

dyj
dλ ,并利用方程(5.94)消去 d2yj
dλ2 。方程(5.100)于是变为
D2ηi
Dλ2 = (Γi
lj,k −Γi
kj,l + Γi
kmΓm
lj −Γi
lmΓm
kj)dyj

dyk
dλ ηl .
(5.101)
涉及克里斯托费尔符号的项恰好组合成黎曼曲率张量,因此最终有
D2ηi
Dλ2 = Ri
jkl
dyj

dyk
dλ ηl .
(5.102)
这一张量方程在所有坐标系中都成立,是测地线偏离方程的协变形式。它将球面上涉及高斯曲率的结果(5.93)推广到任意高维弯曲空间。我们稍后会用这个方程来研究广义相对论中的潮汐力。

5.8 应用

构型空间

弯曲黎曼几何有一些有趣的物理应用,与爱因斯坦的弯曲时空和引力理论毫无关系。

至少在极好的近似下,空间是欧几里得的。当我们对欧几里得空间中 N 个粒子的运动进行建模时,这些粒子的 3N 个笛卡尔坐标的几何仍然是欧几里得的。不过,粒子间的相互作用有时强到使得粒子集体表现得像一个单一物体,其构型由少量集体坐标描述。所有构型的集合构成构型空间,而其几何往往是弯曲的。

一个经典例子是有限大小的刚体,它由无数个单独粒子组成。该物体可以有任意固定的形状。它可以自由运动,如同行星穿过空间,也可以受到约束,就像一个只能在给定平面内摆动的摆。将这样的物体视为刚体是一种近似,当其作为刚体运动的频率远小于弹性、形状变化的振动频率时成立。不用说,作用力必须远小于那些会使它振动或破裂的力。

确定刚体构型所需的最大集体坐标数是六——三个用于质心位置,三个用于物体取向。质心的行为就像单个粒子的位置,而

应用
153
其几何结构是三维空间的平直几何,因此我们假设质心固定并忽略它。朝向由三个角度确定。例如,对于地球,需要指定自转轴在天球上指向的点。观测到该点靠近北极星,并由两个角坐标 ϑ, ϕ 参数化。另一个角度 ψ 参数化地球绕其自转轴的朝向;这个角度在持续增加,周期为24小时。角度 ϑ 和 ϕ 几乎恒定,但它们确实在缓慢变化,时间尺度达数千年。
这三个角度 ϑ, ϕ, ψ 被称为欧拉角 (Euler angles),它们各自具有有限的范围。它们是刚体朝向构形空间上的集体坐标,该空间是一个弯曲的三维黎曼空间,几何上与二维球面相关。
通过仔细选择体轴,我们可以更明确地表示构形空间上的度规。该度规可能相当复杂,但如果物体绕某一轴对称,则会简化。地球,由于其略微扁平的扁球体形状,提供了一个具有启发性的例子。在这种情况下,度规具有如下形式
δs² = I₁(δϑ² + sin² ϑ δϕ²) + I₃(δψ + cos ϑ δϕ)² .
(5.103)
我们是如何得到这个式子的?它通过计算物体的动能推导而来。当物体旋转时,三个角度都是时间的函数。构成物体的所有粒子都在运动,我们可以计算每个粒子的瞬时线速度。然后通过积分,可以求出总动能。结果取决于粒子在物体中的分布方式及其质量,但最终只涉及两个与物质分布相关的常数 I₁ 和 I₃。(如果物体没有旋转对称轴,则还有一个独立的常数 I₂。)这些常数被称为转动惯量 (moments of inertia)。我们发现物体的总动能具有如下形式
K = ½ I₁ [ (dϑ/dt)² + sin² ϑ (dϕ/dt)² ] + ½ I₃ ( dψ/dt + cos ϑ dϕ/dt )² .
(5.104)
去掉 ½ 和时间导数,我们就得到了度规 (5.103)。
对于密度均匀且具有某种对称性的物体,转动惯量的计算并不困难。对于被限制在其自身平面内运动的薄二维物体,情况也会简化,此时只有一个朝向角。在所有情况下,我们都可以从动能中读出一个黎曼度规。
如果物体自由旋转,且没有力作用,那么该物体的运动就是构形空间上以此度规进行的测地运动。这是因为动能 K 就是完整的拉格朗日量 (Lagrangian)。求解这些角度的运动方程是可能的,但有一个更简单的中间步骤,即求解绕每个轴的角速度方程。绕对称轴的运动尤为简单:此时只有一个角度随时间变化,且角速度恒定。一般的运动并非绕对称轴,且轨迹在任何有限时间后都不会闭合。但它仍然是测地运动,因为轨迹的任何一小段始终是该段两端点之间的最短路径。
刚体的拉格朗日量可能除了动能项 K 之外还有一个势能项 V。这会产生一个力,或者更准确地说,一个力矩。标准例子是

154
弯曲空间
下现蜃景
冷空气
光线
来自天空
热空气
虚像
直视
天空
图5.15 蜃景。

对于一个支点固定在桌面上的陀螺,它的位形仍然由三个角度确定,但质心的高度可变,因此存在依赖于其中一个角度的引力势能。
这些概念可以推广到刚性稍弱的物体,例如由柔性关节连接的两个刚体。这种复合物体可以用来模拟分子。同样,从动能可以导出一个黎曼几何。如果需要更多的坐标来完全确定系统在任意时刻的位形,位形空间的维数就会增加。这种几何观点的一个优点是,拉格朗日量和由此得到的动力学与坐标的选择无关。

几何光学
测地线和黎曼几何的一个相当不同的应用,是费马(Fermat)的光线最小传播时间原理。之前在1.1.1节中,我们考虑了两种均匀光学介质,它们以不同的光速在一个平面上相遇。当光线从一种介质进入另一种介质时会发生折射。介质的折射率 n = c/v 是真空光速 c 与介质中光速 v 之比。在我们的单位制中 c = 1 且 v ≤ 1,所以 n ≥ 1,且仅在真空中等于1。现在假设介质的折射率 n(x) 在空间中连续变化。局部光速为 1/n(x),因此光在 x 附近传播无穷小距离 ds 所需的时间为 n(x)ds。
光沿着路径 x(t) 在介质中从 A 传播到 B 所需的总时间为
T =
∫ B
A
n(x(t)) ds =
∫ B
A
n(x(t)) ds
dt dt .
(5.105)
等价地,引入欧几里得度量,它可以写成
T =
∫ B
A
n(x(t))

δij
dxi
dt
dxj
dt dt ,
(5.106)
或者改写为
T =
∫ B
A

n2(x(t)) δij
dxi
dt
dxj
dt dt .
(5.107)

应用
155
图5.16 双曲3-空间中正二十面体蜂窝 {3,5,3} 的庞加莱(Poincaré)球模型。

时间 T 变成了几何修正空间中的距离,该空间的度规张量为 gij(x) = n²(x) δij。费马原理指出,真实的光线就是该度规下的测地线。它们在周围的欧几里得3-空间中通常是弯曲的。
gij(x) 是共形平坦的,因为它只是欧几里得度规张量 δij 乘上了一个共形因子 n²(x),因此克里斯托费尔(Christoffel)符号相对简单。它们是
Γi
jk = 1
n (n,j δi
k + n,k δi
j − n,m δimδjk) ,
(5.108)
决定光线的测地线方程为
d²xi
dt² + 2
n n,j
dxj
dt
dxi
dt − 1
n n,m δimδjk
dxj
dt
dxk
dt = 0 .
(5.109)
这也可以用矢量符号写为
a + 2
n (∇n · v)v − 1
n (v · v)∇n = 0 ,
(5.110)
其中 v 是光的速度,a 是光的加速度。这里的守恒量是 n² v·v,它等于1。

当 n 是离地高度的函数时,由此得到的测地线可以解释蜃景。靠近炎热地面的空气比高处更稀薄。折射率更低,光速更快。梯度 ∇n 指向上方。因此掠射光会向远离地面的方向弯曲,如图5.15所示。当向远处的地面望去时,看到的是明亮的天空而不是黑暗的地面。这看起来就像是天空在一片水面上的倒影。

156
弯曲空间
图 5.17 理想化的鱼眼镜头。
图 5.18 鱼眼镜头拍摄的照片。
我们之前遇到过的共形平坦几何的例子包括 2-球面和 3-球面,以及双曲平面。另一个例子是具有恒定负曲率的双曲 3-空间,其度规是 (5.30) 的简单推广,
δs² = (δx² + δy² + δz²) / (1 − (1/4)(x² + y² + z²))², (5.111)
这里我们已将常数比例因子设为 1。坐标被限制在半径为 2 的球体内部,但真实的几何是无限延伸的。该球体的赤道切片是双曲平面,

延伸阅读
157
并且和之前一样,测地线是与边界球面正交的圆弧段。图 5.16 展示了双曲 3-空间中的一个蜂巢结构,其所有边都是测地线。
这个度规可以解释为描述了一种光学介质,该介质在欧几里得 3-空间中是一个普通的球体,但其折射率为
n(x, y, z) = 1 / (1 − (1/4)(x² + y² + z²)). (5.112)
在球体的正中心,折射率为 1,所以这里的介质接近真空;但在球体边界处,折射率趋于无穷大,因此光在边界处速度降为零。光线遵循双曲 3-空间的圆形测地线,但从一个边界传到另一个边界需要无限长的时间。
对于一个比此稍小的球体,我们在图 5.17 中展示了一组光线,它们全都终止于观察者靠近边界的眼睛。这个球体允许观察所有方向。事实上,它是一个理想化的鱼眼镜头。实际制造的鱼眼镜头由数层圆润的玻璃构成,越往外折射率越高,而光线的路径与图 5.17 所示情况并没有太大区别。图 5.18 展示了一张用鱼眼镜头拍摄的照片。
5.9
延伸阅读
J.M. 李(J.M. Lee),《黎曼流形:曲率导论》(Riemannian Manifolds: An Introduction to Curvature),纽约:施普林格出版社(Springer),1997年。
J. 奥普雷亚(J. Oprea),《微分几何及其应用》(Differential Geometry and its Applications)(第二版),华盛顿特区:美国数学协会(The Mathematical Association of America),2007年。