无标题
2_Motions_of_Bodies-Newton’s_Laws
2
物体的运动——牛顿定律
2.1
引言
在这个城市居住的时代,我们很少能目睹苍穹的全部美丽,观星似乎只是一种昂贵而有趣但终究毫无价值的消遣。然而,我们不应忘记,科学始于天文学。在16世纪最后三十年,第谷·布拉赫(Tycho Brahe)将天文学提升到了一个全新的精度水平。他设计并制造了大型仪器,使他能够对夜空进行系统而精确的观测,在几十年的时间里标绘出行星的位置,并引入了许多如今科学家在收集数据时常规使用的程序,例如寻找误差来源并估计其大小。1601年第谷去世后,约翰内斯·开普勒(Johannes Kepler)潜心对这些观测进行艰苦的分析,寻找能够解释行星运动的模型。经过数年紧张的探索,开普勒于1609年发表了对行星如何绕太阳运动的一种新颖而简洁的描述。他的结论总结为三条定律。第一定律描述了行星轨道的形状,它是一个椭圆,太阳位于椭圆的一个焦点上。第二定律描述了行星在椭圆轨道上运行时,随着它接近和远离太阳,相对速率的变化。第三定律将行星的轨道周期与其到太阳的距离联系起来。
开普勒的定律纯粹是描述性的,他未能找到真正的因果解释。他最好的猜测是,太阳的旋转以某种方式带动着行星绕转。这个问题在17世纪的大部分时间里都没有得到解决。正是渴望找到开普勒定律的力学解释,促使艾萨克·牛顿(Isaac Newton)发展了他的力学体系,并于1687年发表在《原理》(Principia)中。牛顿建立在他人工作的基础上,最著名的是开普勒、伽利略·伽利莱(Galileo Galilei)和杰雷米亚·霍罗克斯(Jeremiah Horrocks),但他个人的成就是里程碑式的。牛顿创立了第一个理性力学,并刺激了整个科学的发展。这带来了一场革命,最终导致了现代世界的诞生。
尽管牛顿是第一个理解微积分的人,但他的《原理》是用经典几何学的语言写成的。不过,我们不会详述牛顿最初的表述方式,而是采用牛顿之后很久才发展起来的数学风格。例如,牛顿是第一个认识到对于速度、加速度和力,它们的方向与它们的大小同样重要,因此必须将它们视为向量(vector)。然而,我们将使用的向量符号直到19世纪末才发展起来。
我们从概述牛顿运动定律开始,并展示如何从最小作用量原理(principle of least action)推导出这些定律。接着,我们将考虑一些重要的例子,出自《物理世界》,尼古拉斯·曼顿与尼古拉斯·米著,牛津大学出版社(2017)。©尼古拉斯·曼顿与尼古拉斯·米。DOI 10.1093/acprof:oso/9780198795933.001.0001
27
在三维空间中的物体运动,并证明如果我们假设太阳与行星之间的吸引力随它们之间距离的平方反比减小,那么开普勒(Kepler)定律便可以从牛顿(Newton)运动定律推出。
2.2 牛顿运动定律 (Newton’s Laws of Motion)
牛顿定律描述一个或多个大质量物体的运动。单个物体具有确定的质量 (m)。物体的内部结构和形状通常可以忽略,此时物体可被视为一个具有确定位置 (x) 的点粒子。随着它的运动,其位置在空间中描绘出一条曲线 (x(t))。稍后我们将证明,尽管复合物体尺寸有限,但它们可以被当作具有一个称为质心的单一中心位置来处理。
牛顿第一定律指出,物体以恒定速度运动是自持的,无需力的作用。速度 (v) 是物体位置 (x(t)) 的时间导数,
[
v = \frac{dx}{dt}. \tag{2.1}
]
在没有力的情况下,速度是常量 (v_0),因此 (\frac{dx}{dt} = v_0),物体位置作为时间的函数为
[
x(t) = x(0) + v_0 t, \tag{2.2}
]
其中 (x(0)) 是初始时刻 (t=0) 的位置。该物体以恒定速率 (|v_0|) 沿直线运动,而若速度为零,则物体静止。
牛顿第二定律定义了我们所说的力的含义。它指出,若一个力作用在质量为 (m) 的物体上,则该物体会加速。加速度 (a) 和力 (F) 是平行的矢量,它们之间的关系为
[
ma = F. \tag{2.3}
]
这是牛顿力学中大多数涉及力的计算的出发点。
牛顿第二定律与微积分密切相关。加速度是速度的时间导数,进而是位置的二阶时间导数,
[
a = \frac{dv}{dt} = \frac{d^2x}{dt^2}. \tag{2.4}
]
在给定力的情况下,方程 (2.3) 就变成了关于物体位置随时间变化的二阶微分方程,
[
m\frac{d^2x}{dt^2} = F. \tag{2.5}
]
如果没有力,则加速度为零,速度恒定,这恰好重述了第一定律,因此第一定律可被视为第二定律的一个特例。
方程 (2.5) 是牛顿力学成功的关键。它具有巨大的预测能力,但为了使用它,我们需要一些关于力 (F) 所取形式的独立信息。对于带电粒子所受的电场力和磁场力,我们可以利用电场和磁场的概念得到这些信息,这一点将在第3章中讨论。弹簧产生的力,以及描述碰撞和摩擦的各种接触力,也可以用简单的代数表达式来表示。至于引力的情况,
28
物体的运动——牛顿(Newton)定律
牛顿指出,只有当太阳与行星之间的作用力遵循反平方定律时,开普勒定律才能得到解释,对此我们稍后会加以说明。
对于地球表面附近的物体,牛顿万有引力定律可以简化,从而容易求出它们的运动。地球对质量为 m 的物体施加的力方向向下,大小为 mg,其中 g = 9.81 m s⁻² 是一个正数常量,它由牛顿万有引力常数 G 与地球的质量和半径组合而成。在这种情况下,牛顿第二定律简化为
ma = −mg
(2.6)
式中 a 是向上的加速度。m 被消去,这对由引力产生的加速度总是成立,因此 a = −g。加速度 a 为负,当然是指向下。g 称为重力加速度。对所有物体它都是相同的,在这种简化情形下与物体的位置无关。
假设运动是纯垂直的,我们来更仔细地考察作为微分方程的方程 (2.6)。消去 m 后,方程 (2.6) 变为
d2z
dt2 = −g ,
(2.7)
其中 z 是物体相对某一参考水平面的高度。其解为
z(t) = −1
2gt2 + u0t + z0 ,
(2.8)
式中 z₀ 和 u₀ 分别是 t = 0 时刻的高度和向上的速度。对于任意的 z₀ 和 u₀,z 对 t 的图线是一条抛物线,若时间区间有限则为抛物线的一部分,如图 2.1 所示。
z0
t
O
z
图 2.1 重力作用下的运动。
我们也可以考虑非垂直运动,例如炮弹这类抛射体的运动。物体在竖直平面内运动,以 z 为竖直坐标,x 为水平坐标。由于引力没有水平分量,物体没有水平加速度,因此 x 与 t 成线性关系。适当选取 x 的原点后,x 就是 t 的某个常数倍,这个倍数即为速度的恒定水平分量。我们假设该倍数不为零。另一方面,运动的竖直部分仍由方程 (2.8) 给出。我们并非将 z 对 t 作图,而是可以
最小作用量原理
29
现在我们来绘制 z 关于 x 的图像。这仅仅需要对 t 轴进行重新标度,因为 x 是 t 的倍数。图 2.1 展示的是物体在 (x, z) 平面内的抛物线轨迹,而不是高度作为时间的函数。
牛顿第三定律指出,每一个作用力都有一个方向相反的反作用力。如果第一个物体对第二个物体施加一个力 F,那么同时第二个物体也对第一个物体施加一个力 −F。这一点可以在台球的碰撞中,以及质量相当的天体(如双星)的运动中观察到。事实上,这正是用来发现邻近恒星星系中存在行星的方法之一:当一颗未见行星绕恒星旋转时,该恒星的视位置会发生振荡。类似地,当一个质量为 m 的物体靠近地球表面时,地球对它施加一个向下的引力 mg,同时该物体对地球施加一个大小相等但向上的引力,尽管这可能微小到难以测量。不过,如果该质量悬挂在一个弹簧上,那么弹簧会对该质量施加一个向上的力 mg 阻止其下落,而该质量则会施加一个向下的力 mg 拉伸弹簧,从而使得 m 能够被测量出来。
我们或许有坚实物观测证据来支持牛顿第三定律,但它成立的深层原因并不是显而易见的。我们将在后文看到,在最小作用量原理的框架下,第三定律可以从一个简单的几何观念推导出来。
2.3 最小作用量原理
大质量物体的运动都有一个共同点。无论是抛向空中的重重球体,还是行星绕太阳的运动,都存在一个与该物体能量相关的量,称为作用量,当沿着物体实际运动的路径计算时,这个量取可能的最小值。作用量在物体的轨迹上取极小值这一事实被称为最小作用量原理。在实践中,该原理被用来推导运动方程,我们很快会看到,这些方程与用更标准方法导出的结果完全相同。最小作用量原理表明,从某种意义上说,我们观察到的实际运动,是所有可能发生的可想运动中的最优运动。
这似乎表明自然界以一种高效的方式运作,以最小的努力依照某种计划行事。当然,自然界并非有意识地“试图”优化其表现,也根本不存在什么计划。实际上,并不需要任何预见性,因为只需要局部信息就足够了,这也是轨迹最优的条件能够重新表达为微分方程的原因。最小作用量原理实际上比牛顿力学更为基本,其适用范围远远超出了牛顿物理学。从根本上说,几乎所有的物理定律——描述从最小基本粒子到膨胀宇宙中星系运动的一切——都可以用某种形式的最小作用量原理来理解。事实上,我们可以把理论物理学家和应用数学家们的终极目标,视为在物理学的每一个分支中,找出作用量所应具有的正确形式。
不考虑最小作用量原理也可以。我们可以仅仅使用运动方程。这是整个物理学中沿用的传统方法,但令人惊讶的是,最小作用量原理似乎比运动方程更加基本。对这一观点的论证,在费曼的一次极负盛名的演讲中得到了充满独特热情的阐述。该论证的一个关键论点在于,最小作用量原理不仅仅是获得经典运动方程的一种技巧,
30
物体的运动——牛顿定律
粒子与场。它在经典理论与量子理论的关系中也扮演着核心角色。
使用最小作用量原理有若干优点。首先是概念上的,它在物理科学的各个领域似乎都是一个基本且统一的原则。其次,它的数学表述基于时空几何,以及速度和能量这些核心概念,而牛顿第二定律中的变量——加速度和力——则成为次要的、派生的概念。这很有用,因为速度比加速度更简单,能量比力更容易从直觉上理解。使用牛顿定律时,总会面临力是如何产生的以及什么决定了它们的形式这类问题。第三个优点是,作用量原理比运动方程更少。一个物体系统的所有运动方程都源于一个单一的原理。同样,电磁场的全部四个麦克斯韦方程也源于一个作用量原理。最后一个优点是,作用量可以使用任何坐标系写出,这使得理解某些类型的运动变得更容易。例如,将运动方程从笛卡尔坐标转换为极坐标相当繁琐,但如果从最小作用量原理出发,极坐标下的方程可以相对容易地获得。
那么缺点是什么呢?嗯,它需要更复杂的数学技术。作用量是能量贡献的组合,对时间进行积分,而推导运动方程的标准方法是变分法,这是函数空间中的微积分,而不是初等微积分。此外,由最小作用量原理导出的运动方程是微分方程,仍然需要求解。
还有一个明显的物理问题,即由最小作用量原理导出的运动方程没有摩擦项,这意味着能量是守恒的,运动会永远持续下去。摩擦必须单独添加,但这实际上利大于弊。在基本层面上,这表达了能量确实守恒的事实。摩擦项是一种处理能量耗散的现象学方法,即能量转移到所考虑系统之外的微观自由度。
变分法听起来可能令人生畏,但幸运的是,最小作用量原理及其推论可以变得更容易理解。在第一章中,我们通过展示在涉及光线的费马原理的某些应用中不需要变分法,已经开始了这条道路。我们使用几何学结合初等微积分获得了物理上重要的结果。很快,我们将对一维运动的物体提出最小作用量原理,并重新推导出牛顿第二运动定律。对于一个简单的例子——在线性势中的运动,它对应于恒定的力,我们可以再次使用初等微积分。扩展这个论证,我们可以继续推导出一般势中的运动方程。为了完整性,我们也给出变分法的推导。
在2.4节中,我们讨论两个相互作用物体的最小作用量原理,这引出了牛顿第三定律和动量守恒定律。我们还表明,对于一个由两个或多个部分组成的复合体,存在一个关于其质心的自然概念。这是通过考虑该物体的总动量而显现出来的。
最小作用量原理
31
2.3.1
一维运动
让我们看看如何利用最小作用量原理推导出牛顿(Newton)第二运动定律。最简单的情形是考虑单个物体的一维运动,比如沿 x 轴的运动。设 x(t) 为该物体的一条可能路径,但不一定是实际经过的路径。物体的速度为
v = dx
dt ,
(2.9)
它也是 t 的函数。
为了建立最小作用量原理,我们假定一个运动的物体具有两类能量。第一类是因其速度而具有的动能。动能与运动方向无关,因此对于速度 v 和速度 −v 是相同的,这就暗示动能是 v² 的某个倍数。它还依赖于别的什么吗?直观上,几个物体的总动能等于各个物体动能之和。N 个相同的物体以相同速度一起运动,其动能是一个物体动能的 N 倍,质量也是一个物体的 N 倍。因此动能正比于质量,也正比于速度的平方。我们假定,一个质量为 m、速度为 v 的物体的动能 K 为
K = 1
2mv2 = 1
2m
dx
dt
2
,
(2.10)
其中引入因子 1/2 是为了便于与牛顿定律衔接。
物体的第二类能量是势能。势能源于环境,与速度无关。它取决于其他物体的存在以及它们彼此相互作用的方式,无论是电的、引力的还是其他形式。我们假定,物体的势能是其位置的函数 V (x)。实际上我们只需要知道物体在每一时刻 t 所在位置 x(t) 处的 V 值,所以严格地,我们写作 V (x(t))。然而,重要的是 V 在物体可能到达的一切位置——即某个范围内的所有 x——都有定义。我们常说物体在势 V 中运动。
势能 V (x) 的形式取决于具体的物理情境,要进行计算就必须知道它,正如使用牛顿第二定律时必须知道力才能解出物体的运动一样。V (x) 有时具有简单的形式。例如,若物体是自由的,与环境没有显著的相互作用,则 V 与位置无关,只是一个常数 V₀。我们稍后将看到,这个常数的数值没有任何物理效应。对于靠近地球表面的物体,我们直觉上知道,将物体举高需要能量,因此物体的势能随高度增加而增大。将物体举高一段高度 h 需要一定的能量,再举高相同的高度 h 还需要同样的能量。同样,将两个质量均为 m 的物体举高 h 所需的能量是将一个质量为 m 的物体举高 h 所需能量的两倍。这便导致如下断言:物体被举高 h 时势能的增加量为 mgh,正比于质量和高度,并乘以一个常数 g。我们之后会看到,g 就是重力加速度。因此,物体在某个参考水平面之上高度为 x 处的总势能为
V (x) = V0 + mgx ,
(2.11)
其中常数 V₀ 同样没有物理效应。(在本节中,为保持一致,我们用 x 作为表示高度的坐标,而不再像之前那样用 z。)对于一个系在……
32
物体的运动——牛顿定律
被拉伸的弹簧,其势能为V(x)=1/2 kx^2,是x的二次函数;在其他情况下,V的形式或是已知的,或是可以假设的。
我们现在考虑物体在初始时刻t0从初始位置x0运动到稍后时刻t1的最终位置x1。我们将采用哈密顿(Hamilton)对作用量的定义,这已成为现在的标准定义,尽管历史上曾有过其他定义。对于每一种可能的运动,作用量S定义为
S = ∫_{t0}^{t1} ( 1/2 m (dx/dt)^2 − V(x(t)) ) dt . (2.12)
被积函数是物体在时刻t的动能减去势能。这里的减号至关重要,它解释了为何我们之前会谈到两种类型的能量。二者的区别在于,一种依赖于速度,另一种则不依赖。作用量有时也写成简洁的形式
S = ∫_{t0}^{t1} (K − V) dt , (2.13)
或者更简明地写为
S = ∫_{t0}^{t1} L dt , (2.14)
其中L = K − V 被称为拉格朗日量(Lagrangian)。作用量是拉格朗日量的时间积分,这不仅适用于单个物体在一维中的运动,也适用于更普遍的情形。
最小作用量原理(principle of least action)现在断言:在所有连接固定端点的可能路径x(t)中,物体实际所走的路径X(t)是使作用量S取最小值的那一条。¹
请注意,我们并不是仅对单个量——比如物体在中间时刻½(t0+t1)的位置——求极小值,而是对无穷多个表征所有可能路径(包含所有可能的摆动)的变量求极小,这是一个微妙得多的问题。为了着手处理,我们必须做出物理上合理的假设:路径x(t)具有一定的光滑性。换言之,可接受的路径是那些加速度保持有限、因而速度连续的路径。图2.2展示了几条典型的可接受路径。
现在我们就能明白,为什么V0——无论是作为一个常数势,还是作为一个附加在非常数势上的常数项,如方程(2.11)中那样——没有任何影响。将它代入积分(2.14)时,它对作用量S的贡献只不过是−(t1 − t0)V0,这本身是一个常数,与路径x(t)无关。寻找使S最小的路径X(t)不会受到这一常数贡献的影响。因此,我们通常会直接略去V0。
2.3.2
一个简单的例子和一种简单的方法
最小作用量原理可以应用的一个简单例子是:势能V(x)是x的线性函数,即V(x)=kx,其中k为常数。我们将确定物体在时间区间−T ≤ t ≤ T内的运动,并假设初始位置为x(−T) = −X,最终位置为x(T) = X。这样选取初始和最终时刻及位置……
¹ 通常情况如此,但有时作用量是取驻值而非极小值。运动方程不受这一区别的影响。
最小作用量原理
33
x0
t0
t1
t
x1
x
图2.2 可能的路径x(t)。
位置的选择可能看起来有些刻意,但通过将时间t和位置x的原点选在初始和最终的时刻与位置的中点(正如这里所做的那样),总是可以简化计算。如此选择,利用了空间和时间的欧几里得对称性。
接下来,考虑从初始位置到最终位置的可能路径x(t)中一个非常有限的类别。假设x(t)的图像是一条经过给定端点的抛物线,如图2.3所示,那么x(t)就是一个形如At² + Bt + C的二次函数。这个表达式中有三个参数,但由于有两个端点约束条件,因此只有一个参数是自由的。为了满足这些约束条件,x(t)必须取如下形式
x(t) = X
T t + 1
2a(t² −T²) 。
(2.15)
X
T 是平均速度,它由端点的x和t值决定。a是自由参数,它等于(恒定的)加速度,因为 d²x
dt² = a。与a成正比的项在端点处为零,因此按要求有 x(−T) = −X 和 x(T) = X。
对于方程(2.15)所给出的路径,其速度为
dx
dt = X
T + at
(2.16)
因此动能为 K =
1
2m
X
T + at
²。在时刻t,势能为kx(t),即k乘以表达式(2.15)。结合动能和势能,我们得到作用量
S =
∫ T
−T
{
1
2m
( X
T + at
)²
−k
( X
T t + 1
2a(t² −T²)
) }
dt ,
(2.17)
这是一个关于t的二次函数的积分。由于积分区间是从−T到T,所有线性项的积分结果为零。
34
物体的运动——牛顿定律
–X
–T
T
t
X
x
图2.3 具有不同加速度的抛物线路径。
移除这些项后,我们有
S
∫ T
−T
[ 1
2m
( X²
T² + a²t²
)
−1
2ka(t² −T²)
]
dt
mX²
T + 1
3ma²T³ + 2
3kaT³ 。
(2.18)
为了满足最小作用量原理,我们必须找到使S取最小值的a值。这是标准的微积分运算。将S对a求导,我们得到
dS
da = 2
3maT³ + 2
3kT³ ,
(2.19)
并令其等于零,从而给出关系式
ma = −k 。
(2.20)
因此,使S最小化的加速度a为−1
mk,将其代入方程(2.15)便得到物体的运动方程:
X(t) = X
T t −k
2m(t² −T²) 。
(2.21)
(对于这个a值,作用量为 S = mX²
T
−k²T³
3m ,但这并不太重要。)
我们可以这样理解方程(2.20)。线性势 V(x) = kx 产生一个力 −k,而方程(2.20)正是牛顿第二定律,其中加速度a为常数且等于−1
mk。对于势 V(x) = V₀ + kx,结果将是相同的。
在这个简单例子中,我们的方法确定了真实的运动。然而,这种方法看起来很不完备,因为我们并没有在所有穿过端点的路径上最小化S,而只是在具有恒定加速度的抛物线路径子类上进行了最小化。下一步就是要证明,这种方法比它表面看起来的要更好,并且将引导我们得到完全一般势 V(x) 的正确运动方程。
最小作用量原理
35
2.3.3 一般势中的运动和牛顿(Newton)第二定律
现在我们来考虑在一维一般势 (V(x)) 中运动的最小作用量原理。作用量 (S) 由方程 (2.12) 给出,仍然带有端点条件 (x(t_0) = x_0) 和 (x(t_1) = x_1)。我们假设存在一条满足这些条件并使 (S) 取极小值的路径 (X(t))。
X
X(T + δ)
T +δ
t
X(T)
T
图 2.4 在极短时间间隔内可能的抛物线路径。
运动 (X(t)) 必然使得在 (t_0) 和 (t_1) 之间的任意更小时间子区间上,作用量都取极小值。否则,我们可以修改该子区间内的路径,从而减小总作用量。因此,让我们关注时间区间 (T) 到 (T + \delta),其中 (\delta) 非常小,并在此子区间上最小化作用量。假设在此区间内的实际运动是从 (X(T)) 到 (X(T + \delta)),且 (X(T + \delta)) 非常接近 (X(T))。由于这些时间和空间间隔非常小,我们可以做一些近似。最简单的近似是假设势 (V) 为常数,且 (X) 随 (t) 线性变化。但这过于简单,我们从中得不到任何东西。更精细的近似是假设 (V(x)) 在 (X(T)) 和 (X(T + \delta)) 之间随 (x) 线性变化,并且路径 (X(t)) 随 (t) 二次变化,因此其图像是一条抛物线,如图 2.4 所示。由于 (V(x)) 是线性的,它具有确定的斜率 (\frac{dV}{dx}),可在 (X(T)) 和 (X(T + \delta)) 之间视为常数。而在该区间内 (X(t)) 是二次的,其图像为抛物线,运动通常具有某个加速度。
现在我们可以利用上一小节中的简单计算。在那里我们证明了,如果势是线性的,斜率为 (k),即 (V(x) = V_0 + kx),那么在抛物线路径中,使作用量取极小值的路径是满足 (ma)(质量乘以加速度)等于 (-k) 的那条。当应用于从 (T) 到 (T+\delta) 的短时间间隔时,这意味着 (ma) 等于 (-\frac{dV}{dx}),即在 (X(T)) 处计算的势的斜率的负值。
这是关键结果。通过在一个短时间间隔内用抛物线近似 (X(t)) 的图像,我们求出了加速度。虽然我们只在一个短间隔内最小化了作用量,但同样的分析适用于任何其他短间隔。一般而言,(-\frac{dV}{dx}) 会随间隔不同而变化,因此加速度也会变化。
36
物体的运动——牛顿定律
如果将加速度写成x对时间的二阶导数,我们就得到从最小作用量原理导出的普遍运动方程
md2x
dt2 = −dV
dx ,
(2.22)
真实的运动X(t)就是这个方程的解。
方程(2.22)具有牛顿第二运动定律的形式。我们把作用于物体的力F等同于−dV
dx 。这其实就是最小作用量原理带给我们的主要启示。势V(x)是基本的输入量,而力F(x)则由它导出。力是势的负导数。它是x的函数,并且需要在物体所在的位置——即x(t)——进行求值。
表达式F = −dV
dx 可能以相关的形式F∆x = −∆V 为人们所熟悉。F∆x是物体移动一小段距离∆x时所做的功∆W。在没有摩擦的情况下,物体的动能增加∆W。对我们而言∆W = −∆V ,所以当物体加速时,动能的增加等于势能的减少。
牛顿第一定律是方程(2.22)的一个特例。如果势V是一个常数V0,那么它的导数为零,因此没有力,运动方程变为
md2x
dt2 = 0 ,
(2.23)
这意味着dx
dt 是常数,物体作匀速运动。即使是在非常数势V(x)中,在任何满足dV
dx = 0的点ex处,也都没有力。这些点是势中物体能够保持静止的可能平衡点。这样的平衡点可能是稳定的,也可能不是。
我们之前论证过,接近地球表面的物体的引力势为V(x) = V0 + mgx,但尚未确认g的解释。对于这个势,−dV
dx = −mg,这正是方程(2.6)中出现的、作用在质量为m的物体上的引力,所以g就是重力加速度。
由于方程(2.22)是普遍的,我们现在可以回过头来检验,我们在2.3.2节处理线性势V(x) = kx时所做的简化,给出的答案是正确的还是错误的。事实上,我们得到的运动方程(2.20)是正确的。这是因为力是常数−k,所以加速度是常数。因此,真实的运动X(t)是t的二次函数,其图像是一条抛物线。
2.3.4
变分法
我们从最小作用量原理出发推导了运动方程(2.22),但我们的方法基于涉及抛物线的计算,并不是最严格的,也不容易推广到更复杂的问题。为了完整起见,我们在这里展示如何利用变分法使作用量S最小化。和之前一样,这个方法会给出真实路径X(t)所遵循的微分方程,也就是牛顿第二运动定律。人们仍需解这个微分方程才能找到X(t)。
回顾一下,对于一条在固定端点x(t0) = x0和x(t1) = x1之间的一般路径x(t),
S =
Z t1
t0
1
2m
dx
dt
2
−V (x(t))
!
dt .
(2.24)
最小作用量原理
37
与之前一样,假设存在一条光滑路径 (x(t) = X(t)),能使作用量取最小值。令 (S_X) 表示这条最优路径的作用量,即有
[
S_X = \int_{t_0}^{t_1}
\left(
\frac{1}{2m}\left(\frac{dX}{dt}\right)^2 - V(X(t))
\right)
dt .
\tag{2.25}
]
现在假设 (x(t) = X(t) + h(t)) 是一条无限接近 (X(t)) 的路径。由于 (h(t)) 是无穷小量,我们可以忽略 (h(t)) 的二次项。(h(t)) 称为路径的变分,而 (X(t) + h(t)) 称为变分后的路径。对于变分后的路径,速度为
[
\frac{dx}{dt} = \frac{dX}{dt} + \frac{dh}{dt}
\tag{2.26}
]
动能为
[
K = \frac{1}{2m}
\left( \frac{dX}{dt} + \frac{dh}{dt} \right)^2 .
\tag{2.27}
]
略去关于 (h) 的二次项,得到
[
K = \frac{1}{2m}
\left(\frac{dX}{dt}\right)^2 + m\frac{dX}{dt}\frac{dh}{dt} .
\tag{2.28}
]
接下来我们对势能做类似分析。对于变分后的路径,(t) 时刻的势能为 (V(X(t) + h(t)))。我们使用通常的微积分近似(如方程 (1.23))
[
V(X(t) + h(t)) = V(X(t)) + V’(X(t)) , h(t) .
\tag{2.29}
]
此处 (V) 是只有一个变量(最初为 (x))的函数,我们对 (x) 求导得到 (V’)。
将动能和势能的结果结合起来,得到变分后路径的作用量 (S_{X+h}) 为
[
S_{X+h} = \int_{t_0}^{t_1}
\left(
\frac{1}{2m}\left(\frac{dX}{dt}\right)^2 + m\frac{dX}{dt}\frac{dh}{dt} - V(X(t)) - V’(X(t)) , h(t)
\right)
dt .
\tag{2.30}
]
右边第一项和第三项既不含 (h) 也不含 (\frac{dh}{dt}),它们正是式 (2.25) 中构成 (S_X) 的项,因此
[
S_{X+h} = S_X + \int_{t_0}^{t_1}
\left(
m\frac{dX}{dt}\frac{dh}{dt} - V’(X(t)) , h(t)
\right)
dt .
\tag{2.31}
]
现在我们对积分中的第一项进行分部积分,使两项都含有公因子 (h(t))。对 (\frac{dh}{dt}) 积分并对 (m \frac{dX}{dt}) 微分,得到
[
S_{X+h} = S_X +
\left[ m\frac{dX}{dt} h(t) \right]_{t_0}^{t_1}
- \int_{t_0}^{t_1}
\left(
m\frac{d^2X}{dt^2} + V’(X(t))
\right)
h(t) , dt .
\tag{2.32}
]
(h(t)) 是一个非常一般的(无穷小)函数,但它在 (t_0) 和 (t_1) 处必须为零,因为最小作用量原理适用于在 (t_0) 和 (t_1) 处端点固定的路径。因此,函数 (m \frac{dX}{dt} h(t)) 在两个端点处均为零,故
[
S_{X+h} - S_X = -
\int_{t_0}^{t_1}
\left(
m\frac{d^2X}{dt^2} + V’(X(t))
\right)
h(t) , dt .
\tag{2.33}
]
在端点之间,(h(t)) 不受任何约束。(我们甚至可以让它变号,如果我们愿意的话。)
38
物体的运动——牛顿定律
由此可知,如果积分中乘以h(t)的括号表达式不为零,我们总能找到某个h(t)使得SX+h −SX为负值²,从而SX+h将小于SX,这与路径X使作用量取极小值的假设相矛盾。因此,只有当括号表达式在t₀到t₁之间的所有时刻t都为零时,SX才是作用量的极小值。换言之,最小作用量原理要求
md²x/dt² + V′(x(t)) = 0 。
(2.34)
这就是实际路径x(t)=X(t)必须满足的微分方程,它与方程(2.22)相同。在变分法的语境中,它被称为与作用量S相关的欧拉-拉格朗日方程(Euler–Lagrange equation)。
如前所述,方程(2.34)是牛顿第二定律的一种表述形式,其中力由下式给出
F(x) = −V′(x) 。
(2.35)
我们从最小作用量原理推导出了牛顿第二定律。然而,这里的基本量不再是力,而是势V。
2.3.5 端点的不重要性
最小作用量原理的一个表面问题是,它似乎要求提前指定初始时刻t₀和最终时刻t₁,并在这些时刻对路径设定端点条件。然而,实际情况并非如此。通常,t₀和t₁并无特殊之处。运动可能在t₀之前就已开始,并可能在t₁之后继续。事实上,让我们假设运动在所有时间上发生,且满足运动方程(2.34)。选择固定端点的问题可以通过以下方式避免。我们形式上定义作用量为
S = ∫ (½m(dx/dt)² − V(x(t))) dt 。
(2.36)
此处没有指定任何端点。我们不能将端点选为−∞和∞,因为那样S通常会无穷大。现在考虑一个路径变分,它将实际运动x(t)=X(t)替换为x(t)=X(t)+h(t),其中h为无穷小量,且仅在某个有限但任意的时间区间I上非零。h还应是连续的,这样它在首次变为非零的时刻以及最后为非零的时刻都不会发生跳变。考虑作用量S在任意包含I的更大时间区间I′上的积分。最小作用量原理要求,在此更大区间I′上定义的S,对于h的任何变分在一阶上保持不变,这意味着实际运动在较小区间I上始终遵守运动方程,因为这是h非零的唯一区间。计算过程与前一节完全相同,并得以成立是因为h在I的端点处为零。反过来,这意味着运动方程在所有时间上都被遵守,因为区间I可以自由选择,且总存在一个包含I的更大区间I′。对I选择的自由性表明我们没有破坏时间平移不变性。
² 这一论断并非完全显然,但若假设括号表达式连续且在某个点非零,则可以严格证明。
多个物体的运动与牛顿第三定律
39
图2.5 科斯塔极小曲面(Costa’s minimal surface),由保罗·尼兰德(Paul Nylander)绘制。该极小曲面原本会向外延伸至无穷,但为清晰起见,这里显示为由三个环所界定的形状。
摆脱预设边界条件这一思路,对于其他变分问题同样有用。我们可以将肥皂膜视为在三维空间中无限延展的极小曲面。最明显的这类曲面是平坦的平面膜,但还有许多更不寻常的例子。我们不能说这些膜的总面积是极小值,因为它们的面积是无穷大。更确切地说,该曲面是在如下意义上极小的:如果我们考虑对膜做一个无穷小的变形,该变形连续且仅在某个有限区域 Σ 内非零,那么作为该变形的结果,膜在一个更大的有限区域 Σ′ 内的面积在一阶近似下不发生变化。这意味着在 Σ 内的每一点,膜都服从我们在 1.1 节末尾所陈述的曲率条件,即曲面的两个主曲率大小相等但方向相反。因为 Σ 是任意选取的,整个膜都服从该曲率条件。图 2.5 展示了这样一个曲面的例子。
2.4
多个物体的运动与牛顿第三定律
现在我们将利用最小作用量原理,为两个在一维空间中运动并通过势相互作用的物体组成的系统推导牛顿第三定律。作用量仍然是单一的量,但现在它涉及两个物体。设这两个物体的可能路径分别为 x(1)(t) 和 x(2)(t),它们的质量分别为 m(1) 和 m(2)。动能为
K = 1/2 m(1) (dx(1)/dt)^2 + 1/2 m(2) (dx(2)/dt)^2. (2.37)
对于势能 V,我们假设背景环境是均匀的,且不产生动力学效应。于是 V 是仅依赖于两物体间距 l = x(2) − x(1) 的某个函数。这是由于欧几里得对称性,在一维情形下该对称性归结为沿 x 轴的平移对称性。因此势能为 V(l) = V(x(2) − x(1))。(通常,V 只依赖于距离的大小 |x(2) − x(1)|,但这并非必要。)
40
物体的运动——牛顿定律
这对物体的作用量为
S =
Z t1
t0
1
2m(1)
dx(1)
dt
2
- 1
2m(2)
dx(2)
dt
2
−V
x(2)(t) −x(1)(t)
!
dt .
(2.38)
两个物体的可能路径是相互独立的,但路径的端点
x(1)(t0)、x(2)(t0) 和 x(1)(t1)、x(2)(t1) 必须事先指定。最小作用量原理指出,两个物体的真实路径(我们记为 X(1)(t) 和 X(2)(t))使 S 达到极小。与之前一样,这一原理将导出运动方程。通过要求在独立的路径变分 X(1)(t) → X(1)(t) + h(1)(t) 和 X(2)(t) → X(2)(t) + h(2)(t) 下,极小化的作用量没有一阶变分,就可以找到这些方程。遵循与单个物体时得到方程 (2.34) 相同的分析过程,我们发现这些方程具有牛顿第二定律的形式,
m(1) d2x(1)
dt2
+ ∂V
∂x(1)
0 ,
m(2) d2x(2)
dt2
+ ∂V
∂x(2)
0 .
(2.39)
这里出现了偏导数,是因为 V 同时依赖于 x(1) 和 x(2),但 V 实际上只是单一变量 l = x(2) − x(1) 的函数。令 V ′ 表示导数 dV
dl 。那么,根据链式法则,
∂V
∂x(2) = V ′ 且
∂V
∂x(1) = −V ′。因此,两个物体的运动方程 (2.39) 简化为
m(1) d2x(1)
dt2
−V ′(x(2) −x(1))
0 ,
m(2) d2x(2)
dt2
+ V ′(x(2) −x(1))
0 .
(2.40)
对于物体 1,力是 V ′(x(2) − x(1)),而对于物体 2,力是 −V ′(x(2) − x(1))。这两个力大小相等、方向相反。这样我们就推导出了牛顿第三定律,并看到它是势能平移不变性的结果,而平移不变性又源于空间的欧几里得对称性。
这就引出了动量,它是质量与速度的乘积。单个物体的牛顿第二定律的形式提示我们,将动量 p 定义为
p = mv = mdx
dt
(2.41)
会很有用。此时,单个物体的运动方程 (2.34) 变为
dp
dt + V ′(x(t)) = 0 .
(2.42)
由于 −V ′ 是作用在物体上的力,方程 (2.42) 表明力等于物体动量的变化率。如果 V ′ 为零,即没有力,那么 p 就是常量,我们就说动量守恒。
多个物体的运动与牛顿第三定律
41
当涉及两个或更多物体时,动量概念更为有用。假设我们将方程(2.40)中的两个式子相加。力项相互抵消,剩下
m(1) d2x(1)
dt2
- m(2) d2x(2)
dt2
= 0 .
(2.43)
对此积分一次,我们得到
m(1) dx(1)
dt - m(2) dx(2)
dt
= 常数 .
(2.44)
用两个物体的动量 p(1) 和 p(2) 表示,即
p(1) + p(2) = 常数 .
(2.45)
这是一个重要的结果。尽管两个物体的相对运动可能很复杂,但总动量 Ptot = p(1) + p(2) 并不随时间改变;它是守恒的。这源于我们导出牛顿(Newton)第三定律时所基于的假设:空间是均匀的,因此物体与环境没有相互作用,仅彼此之间有相互作用。
一种解释是,这两个物体充当了一个复合单体,其总动量等于各组成部分动量之和。该复合体的总动量守恒,这正是对不受外力作用的单个物体所期待的结果。我们可以进一步为复合体确定其作为单个物体时所对应的等效中心位置。注意到
Ptot = m(1) dx(1)
dt - m(2) dx(2)
dt
= d
dt
m(1)x(1) + m(2)x(2) ,
(2.46)
并且复合体的总质量为 Mtot = m(1) + m(2)。因此,我们可写为
Ptot = Mtot
d
dt
m(1)
Mtot
x(1) + m(2)
Mtot
x(2)
.
(2.47)
这就将总动量表示成了单体形式,即总质量与速度 dXCM
dt
的乘积,后者是中心位置
XCM = m(1)
Mtot
x(1) + m(2)
Mtot
x(2) .
(2.48)
的时间导数。XCM 被称为质心。它是各组成部分位置以其质量为权重的平均值,若质量相等则简化为普通平均。由于总动量守恒,XCM 以恒定速度运动。本质上,无论其组成部分的内部运动如何,复合体都遵循牛顿第一定律。
这一分析可以推广到 N 个物体。如果 N 个物体通过依赖于它们各自位置的势 V 相互作用,那么可以从单一的 least action (最小作用量原理) 推导出所有物体的运动方程。每个方程都具有该物体的牛顿第二定律的形式。如果整个系统与
42
物体的运动——牛顿定律
环境,则系统具有平移不变性,且V仅取决于物体的相对位置。在此情况下,作用于N个物体的合力为零,即F(1) + F(2) + · · · + F(N) = 0。这是牛顿第三定律更一般的形式,但它蕴含了通常的第三定律。例如,由所有其他物体施加在第一个物体上的力F(1),与施加在其他物体上的合力F(2) + · · · + F(N)大小相等、方向相反。
我们可以为每个物体定义动量,p(1) = m(1) dx(1)/dt,p(2) = m(2) dx(2)/dt等,以及总动量Ptot = p(1) + p(2) + · · · + p(N)。对于一个孤立系统,其中F(1) + F(2) + · · · + F(N) = 0,Ptot守恒。由此推得,若我们对N个物体定义总质量为Mtot = m(1) + m(2) + · · · + m(N),质心为
XCM = m(1)/Mtot x(1) + m(2)/Mtot x(2) + · · · + m(N)/Mtot x(N), (2.49)
则质心具有恒定的速度。我们可以将这N个物体视为构成一个单一的复合体,其特征由总质量和简单的质心运动描述。总动量为
Ptot = Mtot dXCM/dt. (2.50)
如果这个复合体并非孤立于环境,则合力Ftot将不为零。此时质心的运动方程为
Mtot d²XCM/dt² = Ftot. (2.51)
这一简洁的结论有助于我们理解复合系统的运动,比如一起绕太阳运行的地球和月球。
2.5 单个物体在三维空间中的运动
在大多数实际问题中,我们需要考虑三维空间中的运动。势能V取决于所涉全部物体的位置,因此对于N个物体,V是3N个变量的函数。我们需要能对其中任意变量求导,这要求进一步运用偏导数。
现在让我们仅考虑一个物体。其轨迹为x(t),速度为v(t)。与一维情况相同,物体的动能K正比于其质量及速率平方,
K = ½mv·v = ½m dx/dt · dx/dt. (2.52)
由于点积的关系,即使v的方向改变,K也保持不变。该物体同样具有势能V(x)。
单物体在三维空间中的运动
43
对于在初始点x₀和终点x₁之间、在时间t₀和t₁沿轨迹x(t)运动的物体,其作用量为
S
∫ₜ₀ᵗ¹
(½m dx/dt · dx/dt − V(x(t)))
dt
∫ₜ₀ᵗ¹
(½m (dx₁/dt)² + ½m (dx₂/dt)² + ½m (dx₃/dt)² − V(x₁(t), x₂(t), x₃(t)))
dt .
(2.53)
这与方程(2.38)形式相似,但解释却截然不同。在这里,(x₁(t), x₂(t), x₃(t))是单个物体位置的三个分量,而此前x⁽¹⁾(t)和x⁽²⁾(t)是两个物体(在一维空间中)的位置。数学上这毫无区别,将最小作用量原理应用于作用量(2.53),便可得到运动方程
m d²x₁/dt² + ∂V/∂x₁ = 0 ,
m d²x₂/dt² + ∂V/∂x₂ = 0 ,
m d²x₃/dt² + ∂V/∂x₃ = 0 .
(2.54)
我们可以利用梯度∇的定义(1.26),将这些方程合并为矢量方程
m d²x/dt² + ∇V = 0 ,
(2.55)
这正是牛顿第二定律(2.3),其中力F = −∇V。F并非位置的任意函数,因为并非每个矢量函数F(x)都能表示为标量函数V(x)梯度的负值。方程(2.55)有着恰如其分的几何解释。回想∇V指向势函数V最陡上升的方向,因此力指向最陡下降的方向,其大小与斜率成正比。
物体在三维空间中的动量是p = mv。因此方程(2.55)的另一种表述形式为
dp/dt + ∇V = 0 ,
(2.56)
再次表明力是动量的变化率。
2.5.1 谐振子
矢量微分方程(2.55)通常只能通过数值积分求解,但存在重要的例外。谐振子便是其中一个可解析求解的案例,其势函数V是x₁、x₂和x₃的二次函数。一般的二次函数V(x₁, x₂, x₃) = ½Ax₁² + ½Bx₂² + ½Cx₃² + Dx₁x₂ + Ex₁x₃ + Fx₂x₃处理起来有些棘手。我们可以利用动能K的旋转不变性对其进行简化。总有可能选取一组新的带撇坐标系³,保持K的表达式不变,但消去V中的混合项,使得V(x₁, x₂, x₃) = ½Ax₁² + ½Bx₂² + ½Cx₃²。
³严格来说,这里应使用带撇坐标和系数,然后再略去撇号。
44
物体的运动——牛顿定律
假设A、B和C为正数,因此势能在原点O处有极小值。为简化此例,再设m = 1。作用量为
S = 1
2
Z t1
t0
( dx1
dt
2
+
dx2
dt
2
+
dx3
dt
2
−Ax2
1 −Bx2
2 −Cx2
3
)
dt ,
(2.57)
其中没有坐标的混合项。对S求极小给出运动方程
d2x1
dt2 + Ax1 = 0 ,
d2x2
dt2 + Bx2 = 0 ,
d2x3
dt2 + Cx3 = 0 .
(2.58)
这是三个退耦合的一维谐振子,其通解为
x1(t)
α1 cos
√
At + β1 sin
√
At
x2(t)
α2 cos
√
Bt + β2 sin
√
Bt
x3(t)
α3 cos
√
Ct + β3 sin
√
Ct ,
(2.59)
描述围绕O点稳定平衡的频率为
√
A、
√
B 和
√
C 的振荡。
三维谐振子是一个重要且有用的例子。即使势V不是二次型的,只要它在ex处有一个稳定平衡点,我们往往可以用V的二次近似,并将ex附近的小振幅振荡视为谐振动。
如果系数A、B、C中有一个或多个为负或为零,方程(2.58)的解也不难找到。例如,若A < 0,第一个方程的通解为 x1(t) = α1 exp
√
−At + β1 exp −
√
−At;若A = 0,则 x1(t) = α1t + β1。它们分别描述在不稳定平衡点和中性平衡点附近的运动。
谐振子势的一个特例是
V (x1, x2, x3) = 1
2A(x2
1 + x2
2 + x2
3) = 1
2Ar2 .
(2.60)
这个势具有旋转不变性,或称各向同性。此时只有一个频率
√
A,一般的振荡解可以写成矢量形式
x(t) = α cos
√
At + β sin
√
At .
(2.61)
运动沿α 和 β 张成的平面内的椭圆轨道进行,椭圆中心在O点。适当选择时间起点,可以使α为半长轴,β为半短轴。霍罗克斯(Horrocks)等人将开普勒轨道比作单摆的椭圆轨道,后者在小振荡下由谐振子势描述。关键区别在于,开普勒发现太阳位于椭圆轨道的焦点上,而非中心。
2.6
中心力
现在我们来讨论牛顿(Newton)在《原理》(Principia)中处理的一个关键问题。考虑一个物体在一般的势 V (r) 中运动,该势仅依赖于径向
中心力
45
与点 O 的距离。回忆方程 (1.38) 中 ∇V (r) 的一般形式。利用此式,运动方程 (2.54) 成为
md²x₁
dt² + V′(r)x₁/r = 0 ,
md²x₂
dt² + V′(r)x₂/r = 0 ,
md²x₃
dt² + V′(r)x₃/r = 0 ,
(2.62)
或写成矢量形式,
md²x
dt² + 1/r V′(r)x = 0 .
(2.63)
这表明加速度正比于径向矢量 x,直接指向或背离 O,因此 O 充当力的中心。由于这个原因,V(r) 被称为中心势,相应的力被称为中心力。各向同性谐振子就是一个例子,此时 V(r) = ½ Ar² 且 V′(r) = Ar。
对于在中心势中运动的物体,动能和势能均不因绕 O 的转动而改变,其重要后果是存在一个守恒量——物体的角动量。这是一个矢量 l,利用位置 x 与速度 v 的叉积定义:
l = m x × v = m x × dx/dt .
(2.64)
角动量的另一种表达式为 l = x × p,其中 p = mv 是物体的普通线动量。
为了证明 l 是常矢量,我们对方程 (2.64) 求导,应用莱布尼茨法则,然后利用运动方程 (2.63),最后注意到任何矢量与自身的叉积为零:
dl/dt
m dx/dt × dx/dt + m x × d²x/dt²
m dx/dt × dx/dt − 1/r V′(r) x × x
0 .
(2.65)
因此角动量 l 是守恒的。
角动量守恒的一个直接结果就是轨道是平面的。回想 l = m x × v 意味着 l 正交于 x 和 v。将 l、x 和 v 视为从原点 O 指出来的矢量(必要时可对 v 作平行移动)。由于 l 是常矢量,x 和 v 必定位于通过 O 且与 l 正交的固定平面内,因此若无其他力作用,x 将保持在这个平面内,v 也同样如此。如果我们选择坐标轴,使 3 轴沿 l 方向,那么运动就发生在通过 O 且与 3 轴正交的平面内,该平面内的笛卡尔坐标我们现在记为 x 和 y,于是 x(t) = (x(t), y(t), 0)。开普勒(Johannes Kepler)最早分析行星运动时的发现之一,就是行星的轨道保持在穿过太阳的一个固定平面内。这有时被称为开普勒第零定律。这里我们已看到,对于在任意中心势中运动、并以太阳为力心的行星,该定律都成立。
同样有用的是用极坐标来考虑角动量守恒,此时 x = r cos ϕ,y = r sin ϕ。利用这些坐标,物体变化的位置为
x(t) = r(t) ( cos ϕ(t), sin ϕ(t), 0 ) .
(2.66)
46
物体的运动——牛顿定律
因此,使用莱布尼茨(Leibniz)法则,
dx
dt = dr
dt
cos ϕ(t), sin ϕ(t), 0
- r(t)dϕ
dt
−sin ϕ(t), cos ϕ(t), 0
.
(2.67)
只有右侧第二项对 l 有贡献,因为第一项沿 x 方向,它与 x 的叉积为零。于是我们得到
l = mx × dx
dt = m
0, 0, r2(t) dϕ
dt
.
(2.68)
正如预期,l 沿第三轴方向,且由于 l 守恒,其大小为常量 l。方程 (2.68) 意味着
mr2(t) dϕ
dt = l .
(2.69)
因此,对于中心势中的运动,角速度 dϕ
dt 与到 O 点距离的平方成反比,所以物体远离 O 时角速度比靠近 O 时小。
这个结果有一个简洁的几何解释。到时间 t 为止,矢径扫过的轨道部分面积为
1
2
Z
r2 dϕ = 1
2
Z t
0
r2(t′)dϕ
dt′ dt′ =
l
2mt .
(2.70)
面积扫过的速率,即其时间导数,因此具有恒定值
l
2m。这就是开普勒(Kepler)第二定律。它适用于任何中心势中的轨道,是角动量守恒的结果。
通常,在吸引性中心势中,当 l 不为零时,一般轨道呈图 2.6 所示形式。运动沿平面轨迹进行,该轨迹并不闭合形成重复图形。即便如此,存在一种周期性,称为进动(precession)。从 B 到 C 的运动重复从 A 到 B 的运动,但旋转了某个角度 ϕ0。这种重复无限继续,每次回到轨道最外点时都再旋转 ϕ0 角。
只要 l ̸= 0,轨道就不能穿过 O,因为在 O 处,方程 (2.64) 意味着 l 将为零(因为 x = 0 而 v 有限)。不过注意,若 l 为零,则 x×v = 0,因此 x 和 v 平行。此时运动沿某条固定径向线进行,并可能穿过 O。
2.6.1
圆轨道
当轨道为圆形时,径向距离 r 和角速度 dϕ
dt 保持不变,因此这是考虑有心力运动最简单的情况。让我们找出角速度与力强度之间的关系。
假设轨道为
x(t) = r
cos ϕ(t), sin ϕ(t), 0
,
(2.71)
其中 r 和 dϕ
dt 为常数。
中心力
47
A
B
C
O
ϕ0
ϕ0
图 2.6 轨道的进动。
速度为
v = dx
dt = rdϕ
dt
−sin ϕ(t), cos ϕ(t), 0
,
(2.72)
这是一个与 x 正交因而与轨道相切的矢量。加速度为
a = d2x
dt2 = −r
dϕ
dt
2
cos ϕ(t), sin ϕ(t), 0
,
(2.73)
它是位置矢量 x 的负倍数,因此是指向 O 的矢量。
这确立了一个重要结果:在半径为 r、角速度为 dϕ
dt 的圆轨道上,加速度指向圆心,大小为
|a| = r
dϕ
dt
2
.
(2.74)
对于中心势 V (r),指向 O 的力大小为 V ′(r),因此圆轨道满足运动方程 ma = F,只要
mr
dϕ
dt
2
= V ′(r) .
(2.75)
如果力是吸引的,则 V ′(r) 为正,在任何固定半径 r 处都有解,角速度为
dϕ
dt = ±
1
mrV ′(r)
1
2
,
(2.76)
其中符号决定绕圆运动的方向。角动量的大小为
l = mr2 dϕ
dt =
mr3V ′(r)
1
2 .
(2.77)
48
物体的运动——牛顿定律
φ 的范围是 2π,因此由方程 (2.76),该半径处轨道的周期为
T = 2π
[ 1
mr V ′(r)
]−1/2
.
(2.78)
对于各向同性谐振子,V ′(r) = Ar,故 T 与轨道半径无关,这与熟知的事实一致:对于微小振动,摆的周期与振幅无关。然而,这排除了将谐振子作为行星轨道模型的可能性,因为开普勒(Kepler)第三定律指出,对于半径为 r 的圆轨道,周期 T 正比于 r^{3/2}。开普勒定律意味着 [1/(mr) V ′(r)]^{-1/2} ∝ r^{3/2} 或 V ′(r) ∝ 1/r^2。这是牛顿(Newton)得以推断太阳与行星之间的力按平方反比律减弱的关键。
2.7
吸引的平方反比律力
物理上,中心力最重要的例子是吸引的平方反比律力,它源于势 V (r) = −C/r,其中 C 为正。物体在该势中的运动方程为
m d^2x/dt^2 + (C/r^3) x = 0 .
(2.79)
物体受到指向 O 的大小为 C/r^2 的平方反比律力。牛顿著名的论证是,只有当两个大质量球对称物体之间的引力具有这种形式时,才能解释开普勒关于行星运动的所有定律。若质量分别为 m(1) 和 m(2),间距为 r,则力的大小为
G m(1) m(2) / r^2
(2.80)
其中 G 是牛顿万有引力常数。我们将在 2.10 节中讨论两体在相互引力作用下的运动,但现在先考虑第一个物体远重于第二个物体的简单情形。这样,我们可以认为第一个物体静置于 O 点,而第二个物体围绕它运行。这是行星绕太阳运动的一个合理一级近似。⁴
设 O 处物体的质量为 m(1) = M,绕行物体的质量为 m(2) = m。引力为 (GMm/r^3) x,于是绕行物体的运动方程 (2.79) 变为
d^2x/dt^2 + (GM/r^3) x = 0 .
(2.81)
m 已消去,正如对引力所预期的那样。轨道与 m 无关,尽管角动量和能量等物理量确实依赖于 m。为方便起见,在本节余下部分我们设 m = 1。
我们来求运动方程 (2.81) 的一般轨道。与在任何中心势中一样,角动量矢量 l = x × v 守恒,且运动
⁴ 这仅仅是太阳系运动的一种近似,因为还必须考虑其他行星的引力。如果物体是非球形的,还需要进一步修正。
吸引力的平方反比定律力
逆平方定律力的情形下,还唯一地存在另一个守恒矢量,称为龙格–楞次矢量(Runge–Lenz vector),
[
\mathbf{k} = \mathbf{l} \times \mathbf{v} + \frac{GM}{r} \mathbf{x},
\tag{2.82}
]
它位于运动平面内。
验证 (\mathbf{k}) 守恒比验证 (\mathbf{l}) 守恒稍显复杂。对时间求导,我们得到
[
\frac{d\mathbf{k}}{dt} = -\frac{GM}{r^3} \mathbf{l} \times \mathbf{x} + GM \left( \nabla \left( \frac{1}{r} \right) \cdot \mathbf{v} \right) \mathbf{x} + \frac{GM}{r} \mathbf{v},
\tag{2.83}
]
其中第一项来自对 (\mathbf{v}) 求导并利用运动方程 (2.81),第二项是因为任何空间变量函数 (f) 的时间导数为 (\nabla f \cdot \frac{d\mathbf{x}}{dt} = \nabla f \cdot \mathbf{v})(由链式法则),最后一项直接来自 (\mathbf{x}) 的时间导数。现在我们将 (\mathbf{l}) 替换为 (\mathbf{x} \times \mathbf{v}),并利用方程 (1.39) 代入梯度项,得到
[
\frac{d\mathbf{k}}{dt} = -\frac{GM}{r^3} (\mathbf{x} \times \mathbf{v}) \times \mathbf{x} - \frac{GM}{r^3} (\mathbf{x} \cdot \mathbf{v}) \mathbf{x} + \frac{GM}{r} \mathbf{v}.
\tag{2.84}
]
最后,我们利用双重叉积恒等式 (1.20) 的形式 ((\mathbf{x} \times \mathbf{v}) \times \mathbf{x} = (\mathbf{x} \cdot \mathbf{x})\mathbf{v} - (\mathbf{x} \cdot \mathbf{v})\mathbf{x} = r^2\mathbf{v} - (\mathbf{x} \cdot \mathbf{v})\mathbf{x}),可以看到右侧所有项都互相抵消。因此 (\frac{d\mathbf{k}}{dt} = 0)。
龙格–楞次矢量 (\mathbf{k}) 的守恒是关于平方反比力作用下运动的一个关键事实。其后果是 (\mathbf{k}) 的方向固定,因此不存在进动,更重要的是,有界轨道会闭合形成椭圆。为了证明这一点,我们必须首先回顾椭圆的几何性质。椭圆在 ((X, Y)) 平面上的标准方程,以其中心为原点,为
[
\frac{X^2}{a^2} + \frac{Y^2}{b^2} = 1,
\tag{2.85}
]
其中 (a > b)。椭圆的取向使得 (a) 和 (b) 分别是半长轴和半短轴的长度,如图 2.7 所示。离心率 (e) 通过 (b^2 = (1 - e^2)a^2) 定义,它指定了椭圆偏离圆的程度。椭圆的两个焦点位于 (X) 轴上,在 (X = \pm ea) 处。对于椭圆上的任意一点,到两个焦点的距离之和为 (2a)。
我们需要将位于 (X = ea) 的焦点移到原点,并找出椭圆在该位置下的方程。因此令 (x = X - ea),(y = Y)。代入方程 (2.85),两边乘以 (b^2),然后用 ((1 - e^2)a^2) 替换 (b^2),我们得到
[
(1 - e^2)(x + ea)^2 + y^2 = (1 - e^2)a^2,
\tag{2.86}
]
因此,展开后,
[
(1 - e^2)x^2 + 2e(1 - e^2)ax + (1 - e^2)e^2a^2 + y^2 = (1 - e^2)a^2.
\tag{2.87}
]
50
Chapter 2 物体的运动——牛顿定律
[
\begin{array}{c}
\includegraphics[width=0.45\textwidth]{ellipse_figure.png} % 示意图,此处保留描述
\end{array}
]
图 2.7 椭圆:(F_1) 和 (F_2) 是椭圆的焦点,(a) 是半长轴的长度,(b) 是半短轴的长度。(e) 是离心率。
从等式两边减去项 ((1 - e^2)e^2a^2) 得到
[
(1 - e^2)x^2 + 2e(1 - e^2)ax + y^2 = (1 - e^2)^2 a^2,
\tag{2.88}
]
这可以重新整理为
[
x^2 + y^2 = \left( ex - (1 - e^2)a \right)^2.
\tag{2.89}
]
现在引入极坐标,(x = r \cos \phi) 和 (y = r \sin \phi),并对方程 (2.89) 取平方根,得到椭圆的方程
[
r = -er \cos \phi + (1 - e^2)a,
\tag{2.90}
]
重新整理成最终形式
[
r(1 + e \cos \phi) = (1 - e^2)a.
\tag{2.91}
]
这就是一个焦点在原点的椭圆的极坐标方程。
现在我们可以证明,在平方反比力作用下的轨道是一个椭圆,且一个焦点在力心。回忆一下,轨道在 ((x, y)) 平面内,守恒的龙格–楞次矢量 (\mathbf{k}) 也在该平面内。定义龙格–楞次矢量的方程 (2.82) 涉及速度和位置,但引人注目的是,我们可以直接从中得到一个仅依赖于位置矢量 (\mathbf{x}) 的轨道方程。为此,我们将方程 (2.82) 的两边与 (\mathbf{x}) 点乘,得到
[
\mathbf{k} \cdot \mathbf{x} = (\mathbf{l} \times \mathbf{v}) \cdot \mathbf{x} + GMr.
\tag{2.92}
]
现在,利用恒等式 ((\mathbf{l} \times \mathbf{v}) \cdot \mathbf{x} = \mathbf{l} \cdot (\mathbf{v} \times \mathbf{x})),并将 ((\mathbf{v} \times \mathbf{x})) 替换为 (-\mathbf{l}),我们得到
[
\mathbf{k} \cdot \mathbf{x} = -|\mathbf{l}|^2 + GMr,
\tag{2.93}
]
这就是所需形式的方程,其中速度已消去。
平方反比吸引力
51
如果我们取向坐标轴使得 (\boldsymbol{k}) 沿着负 (x) 轴,那么 (\boldsymbol{k} \cdot \boldsymbol{x} = -kx = -kr \cos \phi),其中 (k) 是 (\boldsymbol{k}) 的大小。将此代入方程 (2.93) 得到 (-kr \cos \phi = -l^{2} + GMr),整理可得
[
r \left( 1 + \frac{k}{GM} \cos \phi \right) = \frac{l^{2}}{GM}.
\tag{2.94}
]
这个轨道方程正是以原点为一个焦点的椭圆的极坐标方程,如方程 (2.91) 所给。偏心率为 (e = \dfrac{k}{GM}),长度参数 (a) 由 ((1 - e^{2})a = \dfrac{l^{2}}{GM}) 给出。这些量分别由龙格–楞次(Runge–Lenz)矢量和角动量矢量的大小决定,而这些大小又由初始条件确定。力心位于原点,即椭圆的一个焦点。因此,平方反比吸引力下的轨道正好具有开普勒(Kepler)在研究行星时所发现的形式。开普勒第一定律指出,行星的轨道是一个椭圆,太阳位于其中一个焦点上。
我们已经推导出了轨道的几何形式,但尚未明确求出物体沿轨道运行的速率。整理方程 (2.94) 得
[
\frac{1}{r} = \frac{GM}{l^{2}} \left( 1 + \frac{k}{GM} \cos \phi \right),
\tag{2.95}
]
再利用极坐标下角动量的公式 (2.69) 有 (\dfrac{\mathrm{d}\phi}{\mathrm{d}t} = \dfrac{l}{r^{2}})。于是将方程 (2.95) 平方并乘以 (l),就得到关于角运动的微分方程
[
\frac{\mathrm{d}\phi}{\mathrm{d}t} = \frac{G^{2} M^{2}}{l^{3}} \left( 1 + \frac{k}{GM} \cos \phi \right)^{2}.
\tag{2.96}
]
这个方程不容易求解。
不过,总的轨道周期却具有简单的形式。由椭圆的极坐标方程 (2.91) 可知,从几何上看,轨道上离原点最远的点出现在 (\cos \phi = -1) 处,距离为 (r_{\max} = (1 + e)a);离原点最近的点出现在 (\cos \phi = 1) 处,距离为 (r_{\min} = (1 - e)a)。对于开普勒轨道,从方程 (2.94) 可以读出 (r_{\max} = \dfrac{l^{2}}{GM - k}) 和 (r_{\min} = \dfrac{l^{2}}{GM + k})。因此
[
\frac{1}{2}(r_{\max} + r_{\min}) = a = \frac{GMl^{2}}{G^{2} M^{2} - k^{2}},
\tag{2.97}
]
且
[
r_{\max} r_{\min} = (1 - e^{2}) a^{2} = b^{2} = \frac{l^{4}}{G^{2} M^{2} - k^{2}}.
\tag{2.98}
]
轨道面积由椭圆面积公式 (A = \pi a b) 给出,因此为
[
A = \pi \frac{GMl^{2}}{G^{2} M^{2} - k^{2}} \left( \frac{l^{4}}{G^{2} M^{2} - k^{2}} \right)^{\frac{1}{2}} = \pi \frac{GMl^{4}}{(G^{2} M^{2} - k^{2})^{\frac{3}{2}}} = \pi \frac{l}{(GM)^{\frac{1}{2}}} a^{\frac{3}{2}}.
\tag{2.99}
]
由方程 (2.70),轨道周期 (T) 等于轨道面积 (A) 除以
52
物体的运动——牛顿定律
面积扫过的速率,1/2 l。因此
T =
2π
(GM)
1/2 a
3/2 .
(2.100)
这就是一般椭圆轨道的开普勒第三定律:轨道周期的平方与轨道半长轴长度的立方成正比。
在太阳系中,太阳作为主导引力天体,M 代表太阳的质量 M⊙。因此,第三定律中与 a
3/2 相乘的常数是
2π
(GM⊙)
1/2 ,对于所有行星、小行星及其他绕太阳运行的天体,这个常数都是相同的。对于圆轨道,半长轴 a 也就是其半径。
2.8
G 与地球的质量
要确定地球、其他行星以及太阳的质量,需要独立测定牛顿常数 G。如果能够在地面实验中测量已知质量和已知间距物体之间的引力,这便有可能实现。牛顿本人认为这样的测量过于困难,但到了18世纪末,一个精确的结果已被获得。
1774年,皇家学会指派皇家天文学家内维尔·马斯基林(Nevil Maskelyne)组织一支探险队,前往苏格兰的希哈利恩山(Schiehallion),以测量组成该山的物质的引力。他们在山附近制作了一个摆,并在山的两侧测量由恒星确定的铅垂线与摆线之间的夹角。选择希哈利恩山是因为其形状简单,使得其质量易于估算,并且它位置相对孤立,因此可以忽略任何邻近山脉的引力效应。即便如此,这次探险也未能测得一个非常精确的 G 值。
1798年,亨利·卡文迪什(Henry Cavendish)采用约翰·米歇尔(John Michell)设计的方法,得出了更好的结果。他使用扭秤来测量铅球之间的引力,装置如图2.8所示。有两个固定的小球形质量 m(2),在它们之间是一个悬挂在细丝上的横梁,横梁两端各有一个大的球形质量 m(1)。每个质量 m(1) 都被拉向离其较近的固定质量 m(2)。这会使细丝扭转,直到达到一个产生等量回复力的平衡位置。这个回复力与扭转角之间存在线性关系,F = cϑ。如果 c 的值已知,那么引力就很容易求得。这个实验的精妙之处在于,横梁的方向会围绕其平衡位置振荡,而振荡周期可以用来确定常数 c。由于力非常小,振荡周期很长——大约20分钟。
有了 c 的值,就可以求得引力。悬挂细丝上的一面镜子使得横梁的方向可以被精确测定,因此可以测量平衡位置处的偏转角 ϑ。这给出了平衡了质量 m(1) 和 m(2) 之间引力 Gm(1)m(2)/d² 的回复力大小,其中 d 是平衡时两质量间的距离。由于 d 和质量已知,G 就可以计算出来。
卡文迪什在他伦敦市中心住宅的客厅里进行了这个实验。相当了不起的是,他得到的值与现今的最佳值误差在1%以内,该值为
G = 6.67 × 10⁻¹¹ m³ kg⁻¹ s⁻² .
(2.101)
复合物体与质心运动
53
m(1)
m(1)
d
ϑ
m(2)
m(2)
d
图 2.8 Michell–Cavendish 实验的示意图。
利用这一结果,我们可以得到地球的质量。接近地球表面的物体向下的加速度为 g = GM
R2 ,其中 M 是地球的质量,R 是其半径。地球的半径自古已知,因此已知 g 和 G 后,便可计算出 M。地球的质量为 M ≃5.97 × 1024 kg,其平均密度为 5.51 × 103 kg m−3。这比地表发现的大多数岩石都致密得多,但与地球具有致密金属核心的事实相符,这一点已被地震学数据和地球磁场表明。
2.9
复合物体与质心运动
当单个物体在有心势中运动时,角动量守恒,但普通的线动量并不守恒,因为力心破坏了平移不变性。另一方面,对于彼此相互作用但不受外力作用的 N 个物体系统,总线动量和总角动量均守恒。我们将在此探讨质心运动对这两种守恒量的贡献。
设这 N 个物体具有随时间变化的位置 x(1), . . . , x(N) 和速度 v(1), . . . , v(N),其中上标是物体的标号。系统的势是某个函数 V (x(1), . . . , x(N))。由欧几里得对称性,将所有物体平移任意矢量 c 后,势不变,因此
54
物体的运动——牛顿定律
V (x(1) + c, . . . , x(N) + c) = V (x(1), . . . , x(N)) 。
(2.102)
对于无穷小 c,利用方程(1.27),这意味着
c · ∇(1)V + · · · + c · ∇(N)V = 0 ,
(2.103)
其中 ∇(k) 是与位置变量 x(k) 相关的梯度算符。由于 c 是任意的,可得
∇(1)V + · · · + ∇(N)V = 0 ,
(2.104)
类似地,将所有物体绕 O 点作无穷小旋转,V 保持不变。无穷小旋转将 x 移至 x + α × x,其中旋转轴沿 α 方向,旋转角为无穷小量 |α|。V 的不变性意味着
α × x(1) · ∇(1)V + · · · + α × x(N) · ∇(N)V = 0 ,
(2.105)
此式可以重新表达(利用方程(1.19))为
α ·
h
x(1) × ∇(1)V + · · · + x(N) × ∇(N)V
i
= 0 。
(2.106)
由于 α 是任意的,
x(1) × ∇(1)V + · · · + x(N) × ∇(N)V = 0 。
(2.107)
现在我们来考虑不变性质(2.104)和(2.107)的推论。运动方程为
m(k) d2x(k)
dt2
+ ∇(k)V = 0 ,
k = 1, . . . , N 。
(2.108)
将它们相加,并利用方程(2.104),我们得到
m(1) d2x(1)
dt2
+ · · · + m(N) d2x(N)
dt2
= 0 。
(2.109)
积分一次得
m(1) dx(1)
dt
+ · · · + m(N) dx(N)
dt
= 常数 。
(2.110)
这个常矢量就是总动量 Ptot,即所有物体的动量 p(k) = m(k) dx(k)
dt 之和。Ptot 与质心运动直接相关,因为
Ptot
d
dt
m(1)x(1) + · · · + m(N)x(N)
Mtot
d
dt
m(1)
Mtot
x(1) + · · · + m(N)
Mtot
x(N)
=
Mtot
dXCM
dt
,
(2.111)
其中
XCM = m(1)
Mtot
x(1) + · · · + m(N)
Mtot
x(N)
(2.112)
是质心。方程(2.111)是方程(2.50)的三维类比。守恒的总动量等于总质量乘以质心速度,因此
复合物体与质心运动
55
这个速度是恒定的。物体之间的相对运动对总动量没有贡献。
为了求总角动量,我们对第k个物体的运动方程(2.108)与位置$\mathbf{x}{(k)}$取叉积,并再次求和,得到
[
m{(1)} \mathbf{x}{(1)} \times \frac{d^2 \mathbf{x}{(1)}}{dt^2} + \cdots + m_{(N)} \mathbf{x}{(N)} \times \frac{d^2 \mathbf{x}{(N)}}{dt^2} = 0
\tag{2.113}
]
其中用到了方程(2.107)。此方程可表示为
[
\frac{d}{dt} \left( m_{(1)} \mathbf{x}{(1)} \times \frac{d\mathbf{x}{(1)}}{dt} + \cdots + m_{(N)} \mathbf{x}{(N)} \times \frac{d\mathbf{x}{(N)}}{dt} \right) = 0,
\tag{2.114}
]
因为所有项 $\frac{d\mathbf{x}{(k)}}{dt} \times \frac{d\mathbf{x}{(k)}}{dt}$ 均为零。积分后得到
[
m_{(1)} \mathbf{x}{(1)} \times \frac{d\mathbf{x}{(1)}}{dt} + \cdots + m_{(N)} \mathbf{x}{(N)} \times \frac{d\mathbf{x}{(N)}}{dt} = \text{常数}.
\tag{2.115}
]
这个常矢量是守恒的总角动量 $L_{\text{tot}}$,它还有另一种表达式
[
\begin{aligned}
L_{\text{tot}} &= m_{(1)} \mathbf{x}{(1)} \times \mathbf{v}{(1)} + \cdots + m_{(N)} \mathbf{x}{(N)} \times \mathbf{v}{(N)} \
&= \mathbf{x}{(1)} \times \mathbf{p}{(1)} + \cdots + \mathbf{x}{(N)} \times \mathbf{p}{(N)} .
\end{aligned}
\tag{2.116}
]
$L_{\text{tot}}$ 是所有 $N$ 个物体的角动量贡献之和。
现在我们可以看到质心的运动如何贡献于总角动量 $L_{\text{tot}}$(回忆一下,质心运动是 $P_{\text{tot}}$ 的全部来源)。首先假设质心静止于 $O$ 且 $P_{\text{tot}}$ 为零。由于物体间的相对运动,由方程(2.116)给出的 $L_{\text{tot}}$ 通常不为零。现在,如果我们通过将 $\mathbf{x}{(k)}$ 移至 $\mathbf{x}{(k)} + \mathbf{X}{\text{CM}}$ 并将 $\mathbf{v}{(k)}$ 移至 $\mathbf{v}{(k)} + \mathbf{V}{\text{CM}}$ 来将此相对运动与质心运动结合起来,其中 $\mathbf{V}{\text{CM}}$ 为常矢量且 $\frac{d\mathbf{X}{\text{CM}}}{dt} = \mathbf{V}{\text{CM}}$,那么新的守恒角动量为
[
\begin{aligned}
L’{\text{tot}} &= \sum_{1}^{N} m_{(k)} (\mathbf{x}{(k)} + \mathbf{X}{\text{CM}}) \times (\mathbf{v}{(k)} + \mathbf{V}{\text{CM}}) \
&= L_{\text{tot}} + \mathbf{X}{\text{CM}} \times \left( \sum{1}^{N} m_{(k)} \mathbf{v}{(k)} \right) + \left( \sum{1}^{N} m_{(k)} \mathbf{x}{(k)} \right) \times \mathbf{V}{\text{CM}} \
&\quad + M_{\text{tot}} \mathbf{X}{\text{CM}} \times \mathbf{V}{\text{CM}} .
\end{aligned}
\tag{2.117}
]
矢量 $\sum_{1}^{N} m_{(k)} \mathbf{v}{(k)}$ 是原来的总动量,它为零,而根据方程(2.112)中质心的定义,我们看到 $\sum{1}^{N} m_{(k)} \mathbf{x}{(k)}$ 是 $M{\text{tot}}$ 乘以原来的质心位置,它也是零矢量。因此
[
L’{\text{tot}} = L{\text{tot}} + M_{\text{tot}} \mathbf{X}{\text{CM}} \times \mathbf{V}{\text{CM}} = L_{\text{tot}} + \mathbf{X}{\text{CM}} \times \mathbf{P}{\text{tot}} .
\tag{2.118}
]
质心的运动对总角动量贡献了 $M_{\text{tot}} \mathbf{X}{\text{CM}} \times \mathbf{V}{\text{CM}}$,并且这一项是常数,因为它的时间导数只涉及 $\mathbf{V}{\text{CM}} \times \mathbf{V}{\text{CM}}$,而它为零。
56
物体的运动——牛顿(Newton)定律
我们得出结论:对于一般的质心运动,由N个物体构成的系统的总角动量L′
tot
包含两个部分,且每一部分都不随时间改变。质心运动的贡献并不十分显著,因为它依赖于我们选为原点的O点。真正有趣的是原本的量Ltot,它是相对于质心的角动量。我们将其称为系统的内禀角动量,或系统的自旋。当我们将来讨论量子力学时,会发现粒子和原子的自旋是量子化的,即它只能取与普朗克常数¯h成正比的离散值。这种自旋不受质心整体运动的影响。
一个处于相对运动中的物体系统,例如一个星系中的恒星或由许多原子组成的固体,可以被视为一个旋转的复合体。如果系统像固体那样作刚性转动,这种理解尤为恰当。固体的自旋角动量与整个物体的角速度及其转动惯量有关。
2.10
开普勒(Kepler)二体问题
在此,我们简要说明两个物体在它们相互的引力作用下,其运动如何转化为我们在2.7节中讨论过的单体有心力问题。
如前所述,设两物体的质量分别为m(1)和m(2)。它们的运动方程为
m(1) d²x(1)/dt² + Gm(1)m(2)/|x(2) −x(1)|³ (x(1) −x(2)) = 0 ,
m(2) d²x(2)/dt² + Gm(1)m(2)/|x(2) −x(1)|³ (x(2) −x(1)) = 0 ,
(2.119)
其中平方反比力大小相等,方向相反。
将这两个方程相加,我们可确证质心具有恒定的速度,而消去重复的质量因子并相减后,得到
d²(x(2) −x(1))/dt² + G(m(1) + m(2))/|x(2) −x(1)|³ (x(2) −x(1)) = 0 ,
(2.120)
这就是相对运动方程。分离矢量x(2) −x(1)遵循一个吸引性的平方反比有心力方程,如同方程(2.81)那样,但其中的常数GM被替换为GMtot = G(m(1) + m(2))。因此,分离矢量沿一条遵循开普勒三定律的椭圆轨道运动。
相对于质心,第二个物体所走的路径是x(2) −XCM,其中XCM由方程(2.112)定义。该式可简化为
x(2) − (m(1)x(1) + m(2)x(2))/(m(1) + m(2)) = m(1)/(m(1) + m(2)) (x(2) −x(1)) ,
(2.121)
因此第二个物体相对于质心的运动是分离矢量运动的一个缩小版本。假设分离矢量沿着半长轴为a的椭圆运动,那么第二个物体则沿着半长轴为a(2) = (m(1)/Mtot) a的椭圆运动,且质心位于该椭圆的一个焦点上。交换标号(1)和(2),我们看到
开普勒二体问题
57
第一个天体也沿椭圆轨道运动,质心位于椭圆的一个焦点上,但其半长轴为 a(1) = m(2)
Mtot a。将这些表达式结合起来可得
a = a(1) + a(2) ,
a(1)
a(2) = m(2)
m(1) .
(2.122)
开普勒第三定律现在取如下形式
T =
2πa
3
2
(GMtot)
1
2 =
2π(a(1) + a(2))
3
2
G
1
2 (m(1) + m(2))
1
2 .
(2.123)
这些关系已被证明对天体物理学家非常有用。两个此类天体的轨道如图2.9所示。该图表明,当考虑两个天体时,由分离矢量所描绘的椭圆的两个焦点都具有动力学作用。
两体间万有引力作用线
FA
FB
质心
+
+
+
质量较小恒星的轨道
质量较大恒星的轨道
绝对轨道
图2.9 双星系统。
2.10.1
双星
恒星常常存在于双星系统中。许多这类系统已被观测了几十年甚至几个世纪,它们随时间在天空中相对位置的变化也已被绘制成图。如果恒星的轨道平面垂直于我们的视线,且我们知道系统的距离⁵,便有可能确定每颗恒星的质量。知道了系统距离后,通过测量轨道在天空中的视大小,就能很容易地确定轨道的实际大小。如果我们知道每条轨道半长轴的长度,那么恒星质量之比为 m(2)
m(1) = a(1)
a(2) 。然后可以利用开普勒第三定律 (2.123),由观测到的轨道周期以及半长轴之和 a = a(1) + a(2) 得到总质量 Mtot。因此,我们可以分别确定每颗恒星的质量。
⁵在一年当中,由于地球绕太阳公转时位置的改变,恒星的位置会发生轻微移动。这被称为视差,它可以用于测量恒星的距离。
58
物体的运动——牛顿定律
唯一的缺点是,大多数双星轨道并非恰好面向我们,这给该方法带来了一些不确定性。图2.10展示了夜空中最亮的恒星天狼星A(Sirius A)及其暗淡的伴星天狼星B(Sirius B)的轨道,这是经过多年望远镜观测测量得到的。从地球上看,这些轨道呈倾斜视角,因此,尽管轨道看起来是椭圆形的,我们却无法在椭圆焦点处看到系统的质心(在图中为原点)。
–3
–2
–1
1
2
3
4
5
6
7
8
6
角秒
1980
1990
2000
2010
1960 角秒
1900
1910
1920
1930
1940
1950
1960
1970
天狼星A
与
天狼星B
在天空中
“交织”
的运动。
1980
1990
2000
5
4
3
2
1
–1
–2
–3
–4
天狼星B - 碳星
天狼星A
图2.10 天狼星A和B的轨道。
确定邻近双星系统中恒星的质量,对于天体物理学家构建精确的恒星理论极为重要。我们将在第13章中探索这一引人入胜的主题。
2.11
拉格朗日点
对于相互引力的三体问题,一般来说不存在解析解。然而,当其中两个质量远大于第三个时,存在五个点,可将可忽略质量的第三个天体置于这些点上,使其相对于另外两个天体保持位置固定。这些点以18世纪数学家约瑟夫-路易斯·拉格朗日(Joseph-Louis Lagrange)的名字命名为拉格朗日点(Lagrangian points),分别记为L1到L5。它们如图2.11所示。L1到L3是不稳定固定点,而L4和L5是稳定固定点。
我们将假设质量为 m(1) 和 m(2) 的两个天体的轨道是圆形的,且 m(1) ≫ m(2)。此时这两个天体间的距离恒定,且角速度相同且恒定。一个位于该系统拉格朗日点上的检验质量 m(3) 将围绕质心以与另外两个质量相同的角速度运行,因此 dϕ(3)
dt
= dϕ(2)
dt
= dϕ(1)
dt 。
拉格朗日点
59
m(1)
L1
L5
L4
L2
L3
60°
60°
m(2)
图 2.11 m(1) ≫ m(2) 系统中的拉格朗日点。以太阳和地球为例,系统的质心位于太阳体内深处。
拉格朗日点 L1 和 L2
L2 点位于 m(2) 的远侧,并且在 m(1) 的延长线上,如图 2.12 所示。其位置可如下理解。根据开普勒第三定律,比 m(2) 更远离 m(1) 的检验质量通常会有比 m(2) 更长的轨道周期。然而,在 L2 点,m(2) 的引力叠加在 m(1) 的引力之上,从而减小了该处检验质量的轨道周期。在 m(2) 轨道外恰好合适的径向距离 r 处,检验质量的轨道周期与 m(2) 的轨道周期精确匹配。
m(2)
m(1)
m(1)R
m(1)+m(2)
L3
L2
L1
R
XCM
r
r
m
R
m(1)+m(2)
L1
R
XCM
r
图 2.12 拉格朗日点 L1 和 L2,标示了 m(1)、m(2)、XCM 与 L1、L2 之间的距离。
L1 点位于同一条直线上,但在 m(1) 与 m(2) 之间。在这种情况下,m(2) 抵消了 m(1) 的一部分引力,从而增大了检验质量的轨道周期。同样地,在 m(2) 轨道内恰好合适的径向距离 r 处(这里的 r 未必相同,尽管事实上相同),检验质量的轨道周期再次与 m(2) 的轨道周期精确匹配。
现在我们将确定 L2 和 L1 点的距离 r。两者的计算十分相似,因此我们一并处理。设 R = |x(2) − x(1)| 为 m(1) 与 m(2) 之间的距离,则 m(1) 和 m(2) 到质心 XCM 的距离分别为 a(1) = m(2)R / (m(1)+m(2)) 和 a(2) = m(1)R / (m(1)+m(2)),且 R = a(1) + a(2)。因此,检验质量到质心 XCM 的距离为 a(3) = m(1)R / (m(1)+m(2)) + κr,其中在 L2 点 κ = 1,在 L1 点 κ = −1。检验质量绕 XCM 做圆周运动,因此满足方程 (2.75),其中 F = V ′(r) 等于作用在检验质量上的引力之和。由此给出
G m(1) m(3)
(R + κr)² + κ G m(2) m(3)
r²
= m(3)
⎛⎝
m(1)R
m(1) + m(2) + κr
⎞⎠
⎛⎝ dϕ(3)
dt
⎞⎠²
.
(2.124)
第一项是朝向 m(1) 的引力,第二项是朝向 m(2) 的引力,右边的项是质量乘以做圆周运动所需的向心加速度。
在拉格朗日点处,检验质量的角速度等于 m(1) 和 m(2) 的角速度。应用于圆轨道的二体问题开普勒第三定律 (2.123) 给出角速度为
⎛⎝ dϕ(3)
dt
⎞⎠²
⎛⎝ dϕ(1)
dt
⎞⎠²
⎛⎝ dϕ(2)
dt
⎞⎠²
⎛⎝ 2π
T
⎞⎠²
= G(m(1) + m(2))
R³
.
(2.125)
将此式代入方程 (2.124) 并消去公因子 G m(3),我们得到
m(1)
(R + κr)² + κ m(2)
r²
⎛⎝
m(1)R
m(1) + m(2) + κr
⎞⎠
m(1) + m(2)
R³
.
(2.126)
当 m(1) ≫ m(2) 时,上式简化为
m(1)
(R + κr)² + κ m(2)
r²
≃ (R + κr) m(1)
R³ ,
(2.127)
经整理各项后,变为
m(1)
⎧⎨⎩
1
R²
⎡⎣
1 + κr
R
⎤⎦⁻²
− 1
R² − κr
R³
⎫⎬⎭
≃ −κ m(2)
r²
.
(2.128)
对于 m(1) ≫ m(2),显然 R ≫ r,因此 (1 + κr/R)⁻² ≃ 1 − 2κr/R + … ,于是
−m(1)
⎛⎝ 3κr
R³
⎞⎠
≃ −κ m(2)
r²
.
(2.129)
κ 抵消,距离 r 为
r ≃
⎛⎝
m(2)
3 m(1)
⎞⎠¹⁄³
R ,
(2.130)
对于 L2 和 L1 均相同。
太阳的质量为 1.99 × 10³⁰ kg,地球的质量为 5.97 × 10²⁴ kg,由此得出 r 值为 0.01R。地球与太阳之间的平均距离 R 约为 1.5 × 10⁸ km,因此 r 为 1.5 × 10⁶ km,大约是月球到地球平均距离的四倍。
拉格朗日点
61
图2.13 从日地L1点观测,月球正越过地球表面。该照片由NASA深空气候观测站(DSCOVR)拍摄。
地球。L1位于地球轨道内侧,与地日连线直线上距离为r处,而L2则位于地球另一侧同等距离处,远离太阳。这两个位置适合放置各类空间探测器。例如,太阳与日光层观测站(SOHO)部署在L1点,而威尔金森微波各向异性探测器(WMAP)则部署在L2点,以最大限度地减少从地球、月球和太阳接收到的微波辐射。图2.13为从L1点拍摄的月球与地球照片。
拉格朗日点 L3
L3位于m(2)的正对面,在其轨道的远侧,如图2.11所示。L3刚好在m(2)的轨道外侧,尽管L3到m(1)的距离小于R。这是可能的,因为m(2)的轨道半径为
m(1)R
m(1)+m(2) < R。若L3与m(1)的距离为R−r,则L3与m(2)的距离为2R−r。L3到二体质心XCM的距离等于到m(1)的距离加上m(1)到XCM的距离,即R −r +
m(2)R
m(1)+m(2) 。为求r,我们将L3处试验质量所受的引力与维持其在相同角速度下做圆周运动所需的力匹配,因此有
m(1)
(R −r)2 +
m(2)
(2R −r)2 =
(
R −r +
m(2)R
m(1) + m(2)
) m(1) + m(2)
R3
.
(2.131)
62
物体运动——牛顿定律
采用与之前相同的近似,即m(1) ≫m(2) 且 R ≫r,我们保留与m(2)R和m(1)r成正比的项,而略去与m(2)r成正比的项,得到
m(1)
R2
(
1 + 2r
R
)
- m(2)
4R2 ≃
(
(R −r)(m(1) + m(2)) + m(2)R
) 1
R3 .
(2.132)
归并各项后,我们得到结果
3m(1)r
R3
≃7m(2)
4R2 ,
因此
r ≃7
12
m(2)
m(1) R .
(2.133)
因而L3的轨道半径,即L3到XCM的距离为
a(3) ≃R −7
12
m(2)
m(1) R +
m(2)R
m(1) + m(2) ≃R + 5
12
m(2)
m(1) R .
(2.134)
拉格朗日点 L4 与 L5
点L4与L5各自处于等边三角形的一个顶点,而m(1)与m(2)构成该三角形的另两个顶点,如图2.11所示。由对称性,对两点位置的考量相同。我们考虑L4。通过图2.14可以理解其位置。a(2)是m(2)受m(1)引力吸引的加速度。类似地,a(1)是m(1)受m(2)引力吸引的加速度,因此
|a(1)|
|a(2)| =
m(2)
m(1) 。质量m(1)和m(2)围绕它们的质心XCM运转。m(1)的轨道半径为a(1) =
m(2)R
m(1)+m(2) ,m(2)的轨道半径为a(2) =
m(1)R
m(1)+m(2) 。这些半径的比值为
a(1)
a(2) = m(2)
m(1) = |a(1)|
|a(2)| .
(2.135)
这是理解L4位置的关键关系,因为它意味着加速度矢量的大小|a(i)|与位移矢量的大小a(i)成正比,如图2.14所示。
L4到m(2)的距离与m(1)到m(2)的距离相同,因此位于L4的试验粒子受m(2)作用的加速度a(3)(2)与m(1)受m(2)作用的加速度大小相等,即
|a(3)(2)| =
|a(1)|。类似地,L4到m(1)的距离与m(2)到m(1)的距离相同,因此
|a(3)(1)| =
|a(2)|。由于加速度矢量与位移矢量成正比,试验粒子的合加速度a(3)指向二体系统的质心,如图2.14所示。
此外,在L4处的试验粒子角速度与m(1)和m(2)的角速度相同,我们将马上证明。m(2)做圆周运动,因此其加速度大小为
|a(2)| = a(2)
(dϕ(2)
dt
)2
,
(2.136)
类似地,|a(1)| = a(1) (dϕ(1)
dt )2 和 |a(3)| = a(3) (dϕ(3)
dt )2,其中a(3)是L4到质心的距离。
能量守恒
63
m(1)
m(2)
a(1)
a(2)
a(3)
a(3)(1)
a(3)(1)
XCM
L4
图 2.14 拉格朗日点 L4。
从图中可以看出,
|a(1)|
a(1) = |a(2)|
a(2) = |a(3)|
a(3) ,
因此
dϕ(1)
dt
= dϕ(2)
dt
= dϕ(3)
dt
.
(2.137)
在太阳-木星系统的 L4 和 L5 点发现了若干小行星。这些天体被称为特洛伊族小行星 (trojans)。据信,在太阳-海王星的 L4 和 L5 点也存在着大量特洛伊族小行星。
2.12
能量守恒
我们迄今忽略的一个重要问题是总能量及其守恒。直接从最小作用量原理 (principle of least action) 来理解能量守恒有些微妙。相反,利用运动方程会更容易。让我们从一个物体在一维运动的例子开始,其运动方程为
md2x
dt2 + dV
dx = 0 。
(2.138)
两边乘以 dx
dt ,我们得到
md2x
dt2
dx
dt + dV
dx
dx
dt = 0 ,
(2.139)
该方程可以表示为一个全导数,
d
dt
1
2m
dx
dt
2
- V (x(t))
!
= 0 。
(2.140)
64
物体的运动——牛顿定律
因此
1
2m
dx
dt
2
- V (x(t)) = 常数 。
(2.141)
这个常数就是该物体守恒的总能量,记作 E。注意总能量是动能与势能之和,E = K + V。这里的符号是加号,而不是出现在拉格朗日量 L = K − V 中的减号。
对于在三维空间中受一般力 F(x) 作用的物体,能量不一定守恒。然而,如果力来源于势能 V (x)——如果运动方程由最小作用量原理导出则总是如此——那么力具有形式 F(x) = −∇V (x)。在这种情况下,同样存在一个守恒的总能量 E = K + V。因此,任何可以表示为 F = −∇V 的力都被称为保守力 (conservative)。
能量守恒的证明与一维情形几乎无异。我们将运动方程 (2.55) 与 dx
dt 点乘,得到
md2x
dt2 · dx
dt + ∇V · dx
dt = 0 。
(2.142)
第一项是动能 K = 1
2m dx
dt · dx
dt 的时间导数,第二项是势能 V (x) 的全时间导数。这源于
V (x(t + δt)) ≃V
x(t) + dx
dt δt
≃V (x(t)) + ∇V · dx
dt δt 。
(2.143)
因此总能量
E = K + V = 1
2mdx
dt · dx
dt + V (x(t))
(2.144)
的时间导数为零。
对于一个由 N 个相互作用的物体组成的系统,总能量同样是守恒的,前提是力来源于一个单一的势能函数 V,这也恰恰是运动方程能够从最小作用量原理导出的条件。守恒的能量就是 N 个物体的动能与系统势能之和,
E =
N
X
1
1
2m(k) dx(k)
dt
· dx(k)
dt
+ V (x(1), . . . , x(N)) 。
(2.145)
与动量和角动量守恒的情况类似,考察质心运动对总能量的贡献是富有启发性的。假设初始时质心静止于 O 点,总能量由表达式 (2.145) 给出。现在给各物体的速度叠加上一个质心速度 VCM。势能 V 不受质心运动影响,因为它只依赖于物体的相对位置。新的总能量为
E′
N
X
1
1
2m(k)
dx(k)
dt
- VCM
·
dx(k)
dt
摩擦与耗散
65
PN
1 m(k) dx(k)
dt
如果质心最初静止,则为零。
我们看到守恒的能量(2.146)式是两部分之和,且每一部分自身都不随时间变化。第二部分是复合物体整体的动能。第一部分是相对于质心的总能量。这个能量称为物体系统的内能。当我们从热力学角度讨论能量时,关注的将是内能,而质心运动没有热力学意义。例如,气体分子的温度取决于气体的内能,不受质心运动的影响。
2.13 摩擦与耗散 (Friction and Dissipation)
在真空中运动的物体,比如太阳系中的行星和航天器,或者粒子加速器中的基本粒子,受到的摩擦可以忽略不计。但在大气中下落的物体、在桌面上滑动或滚动的物体,以及机动车辆都会受到摩擦。
摩擦力是一种复杂的力,通常作用于物体表面,其效应是耗散物体的机械能。物体的动能与势能之和不再守恒,因为一部分能量以热的形式在物体内部和周围介质中耗散掉。我们不会详细讨论这种能量耗散,不过热作为一种能量形式将在第10章讨论。这里我们只探讨摩擦力影响运动的最简单方式。
物体所受的摩擦力取决于物体相对于与其表面接触的介质的速度。假设介质静止。在最简单的模型中,摩擦力与物体的速度成正比,且方向相反。受到摩擦的一维运动物体的运动方程(2.22)式变为
md2x
dt2 = −dV
dx −µdx
dt .
(2.147)
µ是一个正常数,称为摩擦系数。这个简单的模型在有限的速度范围内成立。在高速下,摩擦力通常随速度增加得更快,而在极低速度下,新的粘性表面力起主导作用。
在一些特殊情况下,我们可以很容易地求解运动方程(2.147)。如果V为常数,那么没有摩擦时物体以恒定速度运动,但存在摩擦时,解为
x(t) = x0 + mu0
µ
1 −e−µ
m t
,
(2.148)
其中x0和u0是t = 0时的位置和速度。物体最终停在位置x0 + mu0
µ,但需要无穷长的时间。实际上,由于粘性力的存在,物体经过有限时间后就会停止。另一个例子是物体在重力作用下在大气中下落。此时−dV
dx = −mg,物体很快趋近一个终极速度,不再加速。终极速度为−mg
µ。
对于摩擦引起的能量耗散率,有一个颇为普遍的结果。考虑在三维空间中的N个物体,它们通过势V相互作用,并假设每个物体都受到一个与自身速度成正比的摩擦力。运动方程为
66
物体的运动——牛顿(Newton)定律
方程(2.108)的修改版本,
m(k) d2x(k)
dt2
- ∇(k)V = −µdx(k)
dt
,
k = 1, . . . , N .
(2.149)
将这些方程中的每一个与速度 dx(k)
dt 点乘,并相加,我们得到
dE
dt = −µ
N
X
1
dx(k)
dt
· dx(k)
dt
(2.150)
其中 E = K + V 是机械能 (2.145)。因此,只要任何物体仍在运动,机械能 E 就总是减少。方程 (2.150) 的右边与总动能 K 差别不大。事实上,如果所有 N 个物体具有相同的质量 m,那么能量耗散率可以表示为
d
dt(K + V ) = −2µ
m K .
(2.151)
2.14
进一步阅读
J.B. Barbour, The Discovery of Dynamics (动力学的发现), Oxford: OUP, 2001.
T.W.B. Kibble 和 F.H. Berkshire, Classical Mechanics (经典力学) (5th ed.), London: Imperial College Press, 2004.
L.D. Landau 和 E.M. Lifshitz, Mechanics: Course of Theoretical Physics, Vol. 1 (力学:理论物理学教程,第1卷), Oxford: Butterworth-Heinemann, 1981.
要获得一个用于最小化一维运动粒子作用量的动手工具,可以查看
E.F. Taylor 和 S. Tuleja 的 Principle of Least Action Interactive (最小作用量原理互动程序),该程序可在此处获取:
www.eftaylor.com/software/ActionApplets/LeastAction.html