无标题
title: “后费曼物理学讲义:基础物理的启发之旅”
author:
- Nicholas Manton
- Nicholas Mee
date: 2026-05-02
language: zh-CN
rights: “翻译仅供个人学习使用”
…
Preface
序言
撰写这本书是一大乐事。它使我们有机会深入思考物理学的所有主要分支,以及它们如何联合起来,构成一幅关于物理世界的连贯图景。最终呈现的,是一部既简明扼要又全面透彻的物理学全景观览。数学是描述我们周围世界诸多现象的自然语言,正如理查德·费曼(Richard Feynman)和吉姆·阿尔-哈利利(Jim Al Khalili)等众多评论者所强调的,数学对于真正理解物理学至关重要。因此,我们的叙述必然是数学化的。我们清晰阐释了支撑现代基础物理的数学推理,并毫不回避地给出了关键方程及其解。
人们对宇宙的科学解释,从未有过如此强烈的求知欲。我们的目标是为基础物理学提供一次启迪人心的巡礼,任何至少学过高中物理和数学的人都能理解。对于那些刚刚走出校门的读者,这本书可以让他们一窥大学物理课程中的大部分内容。本书也适合那些在大学修读过科学或工程数学课程,并希望了解基础物理学直至当前研究前沿的读者。它或许也会吸引那些希望更多了解物理的数学家和计算机科学家。
解释物理世界是许多代人共同努力的成果。今天最优秀的理论,是建立在过去伟大理论的基础之上的。因此,若对牛顿(Newton)、麦克斯韦(Maxwell)、爱因斯坦(Einstein)以及众多为人类理解宇宙作出贡献的科学家所建立的经典物理学没有良好的理解,几乎不可能真正欣赏现代物理学。出于这个原因,书中的许多内容可能看起来是历史性的。然而,这些材料是以现代的风格呈现的,可能与它们最初的表述形式大不相同。我们研究方法的一个关键特征,是一种贯穿《物理世界》全书、如同主旋律般的统一思想——这就是变分原理,其中最重要的例子便是最小作用量原理(principle of least action)。几乎所有成功的物理理论都可以用这一思想来表述,它正是现代物理学的核心。我们的旅程还将带我们领略近年来的科学亮点,包括WMAP和Planck卫星对宇宙微波背景辐射的巡天观测、大型强子对撞机上希格斯玻色子的发现,以及LIGO对引力波的发现。
在此,我们要感谢众多朋友、同事和亲属,是他们鼓励我们写这本书。我们尤其要感谢约翰·巴罗(John Barrow)和乔纳森·埃文斯(Jonathan Evans)的鼓励与建议。
v
vi
尼克·曼顿(Nick Manton)感谢安东尼·查尔斯沃思(Anthony Charlesworth)、海伦娜·艾塔(Helena Aitta)、罗杰·休曼(Roger Heumann)和艾伦·史密斯(Alan Smith)对本书的讨论和兴趣。他也感谢他的母校达利奇公学(Dulwich College)和查特豪斯公学(Charterhouse)的物理学会,为他提供了向高中毕业班(第六学级)学生讲解最小作用量原理(principle of least action)的机会。他特别感谢直到最近还在达利奇任教的阿拉斯代尔·肯尼迪(Alasdair Kennedy)。他还感谢安妮莉(Anneli)和本(Ben)的鼓励,以及他们在多轮写作和编辑过程中表现出的耐心。
尼克·米(Nick Mee)感谢父母长久以来的支持。他非常感谢约翰·伊斯特伍德(John Eastwood)在众多书籍签售活动中的协助,包括2013年10月在剑桥举行的公众天文学会(Society for Popular Astronomy)年会,那次活动促成了他与尼克·曼顿的一次偶然相遇,并最终促成了本书的撰写。同时,他也要感谢乔纳森·埃文斯(Jonathan Evans)在此次活动期间在冈维尔与凯斯学院(Gonville and Caius College)的热情款待。他还感谢马克·希基(Mark Sheeky)和黛布拉·南丁格尔(Debra Nightingale)的帮助和启发。他热忱感谢他通讯组的所有成员和博客读者给予的鼓励和热情。他特别感谢安吉(Angie)在又一个漫长项目中所表现出的耐心和坚韧。
我们感谢牛津大学出版社(Oxford University Press)的松克·阿德隆(Sonke Adlung)和阿尼娅·沃伦斯基(Ania Wronski)亲自参与将本书付梓,以及苏甘尼亚·卡伦巴耶拉姆(Suganiya Karumbayeeram)及其同事在本书制作过程中的贡献。我们也感谢姆海里·格雷(Mhairi Gray)编制了索引。我们要向在撰写本书过程中所参考其著作的众多作者表示感激。在每章末尾,我们都设有“扩展阅读”(Further Reading)部分,列出了一些关键的书籍和论文。
前言
0_Introduction
0
引言
我们生活在一个迷人世界中,各个尺度上都充满着引人注目的现象。我们正在膨胀的宇宙中充满了数以万亿计的星系,每个星系中心都栖息着一个超大质量黑洞。爆炸的恒星用生命的尘埃播撒星系,而八分钟路程外,一个炽烈的核熔炉释放出能量,使地球保持绿色、生机勃勃、充满生命。我们这颗大理石纹般的、多水的地球可能是独一无二的,也可能是众多演化出智慧生命的天体之一。在更小的尺度上,所有可见物质仅由少数几种基本粒子类型构成,但这些粒子组合成一百多种不同的原子,这些原子又以无数种方式键合在一起。
也许最令人惊讶的是,我们对这些能了解到如此之多,以及如今理解的精确程度。利用天然和人造材料,我们可以制造出令人惊叹的设备,这些设备改变了我们的生活,帮助我们更深入地探究宇宙的奥秘。一些重要的物理现象处于我们可观测的极限。偶尔发生的黑洞碰撞在时空结构中产生微小的涟漪,我们用最灵敏的仪器探测到它们。基本粒子中包括难以捉摸的中微子,它们每天大量穿过我们身体,但只在巨大的地下探测器中被偶尔捕捉到。在人类历史的大部分时间里,人们在日常生活中对物理世界知之甚少。我们确实有幸生活在这样一个时代,它的如此多的秘密正在被揭示。
作为物理学家,我们被永不停歇的好奇心所驱使,去探寻和解释自然的内在运作。这传统上是哲学家的领域,但精巧的理性论证只能带我们走这么远。真正的洞察力建立在实验研究和优美数学模型这两大支柱之上。正如理查德·费曼(Richard Feynman)所说:“如果你想了解自然,欣赏自然,就必须理解她所说的语言。”因此,我们在《物理世界》(The Physical World)中采用了一种毫不掩饰数学的风格。
我们将探索物理学的理论基础,并呈现这门学科本质统一性的宏伟愿景。我们的目标是提供一个广泛的物理学概览,为深入探究各章节所涵盖的主题提供必要的背景和动力。我们全面涵盖了物理定律,但在用相对简单的应用来说明这些定律时有所取舍。在选取材料时,我们融合了几条信息线索:基本定律及其所基于的哲学原理、定律的数学描述、定律的实验基础、定律的历史发展、我们当前理解的不足之处,以及尚待回答的悬而未决的问题。我们遵循阿尔伯特·爱因斯坦(Albert Einstein)的格言:“解释应尽可能简单,但不要更简单”,以提供一个
The Physical World. Nicholas Manton and Nicholas Mee, Oxford University Press (2017).
c⃝Nicholas Manton and Nicholas Mee. DOI 10.1093/acprof:oso/9780198795933.001.0001
2
引言
本书旨在诚实地阐述现代物理学家如何理解他们的学科。我们的目标是呈现一幅引人入胜的物理学图景,以清晰解释每一步骤的风格,简明地推导重要结果。书中数学的水平与《费曼物理学讲义》(Feynman Lectures on Physics)大致相当。我们假设读者熟悉代数,包括矩阵及其行列式,使用笛卡尔坐标和极坐标的几何,基础微积分,以及复数。
在第1章中,我们涵盖一些入门概念:矢量、物理学中变分原理的运用,以及偏微分。我们给出了偏导数易于理解的导论,因为它们是物理学大多数基本方程的基本组成部分,这些方程包括麦克斯韦电磁场方程组、量子力学的薛定谔方程和狄拉克方程,以及广义相对论的爱因斯坦方程。第2章讲述牛顿动力学,以及牛顿万有引力定律在太阳系天体运动中的应用。第3章主要讲述由麦克斯韦方程组描述的电磁场。
粒子和场是经典物理学的关键概念,但牛顿定律与麦克斯韦方程组彼此并不完全相容。爱因斯坦在构思其狭义相对论时解决了这个问题,如第4章所述。在狭义相对论中,通过引入时空这一新颖观念,空间和时间被统一了起来;但随之又出现了一个更深层的问题,因为狭义相对论与牛顿的引力理论不相容。爱因斯坦完成了他的革命,他表明一个相容的粒子、场和引力的理论需要时空是弯曲的,正如他的广义相对论所描述的那样。第6章专门讨论这一理论及其非凡的推论,例如黑洞的存在。为了激发本章中的某些想法,我们的讲述之前先在第5章讨论了弯曲空间,包括一些物理应用。弯曲空间比弯曲时空更容易形象化。
第7章和第8章是关于量子力学的,这是20世纪另一个革命性的思想,对于理解原子尺度上的各种现象至关重要。第9章将量子力学应用于材料的结构和性质,并解释了化学和固态物理学的基本原理。第10章是关于热力学的,它建立在温度和熵的概念之上。我们讨论若干实例,包括引发量子革命的黑体辐射分析。第11章纵览原子核,介绍其性质和行为。利用高能粒子束对原子核进行研究,得以更深地进入物质结构并探求其终极构造单元。第12章探索粒子物理学,并包含量子场论、标准模型和希格斯机制的简短描述。
全书之中,我们精心挑选了能够洞悉基本物理学的应用。第13章关于恒星就是一个延伸的实例,它汇集了物理学诸多分支的思想:引力、量子力学、热力学、核物理和粒子物理。第14章关于宇宙学,纵览始于大爆炸的宇宙整体的结构和演化。我们以第15章作结,该章讨论了遗留下来的一些基本问题,例如量子力学的诠释,以及粒子的终极本性。也简要探索了一些令人兴奋但带有猜测性的思想,以期更好地理解粒子,并将引力与粒子物理中的力统一起来。这些思想包括超对称、孤子和弦论。
延伸阅读
3
在《物理世界》(The Physical World)一书中,我们着重强调了物理学中变分原理的应用,特别是最小作用量原理(principle of least action),这一方法处于现代理论物理的核心,却在大多数入门介绍中被忽视。我们认为这一概念理应得到更广泛的认知。将作用量(action)引入到理论物理的前沿,是费曼(Feynman)的伟大成就之一。我们对于最小作用量原理如何奠定牛顿(Newton)运动定律的基础,给出了一个简洁且略有新意的解释,并简要说明了作用量在电磁理论与广义相对论中的作用。我们对量子力学的处理方式是传统的,基于薛定谔方程(Schrödinger equation),但我们也讨论了作用量的角色,以及这如何引出费曼的路径积分方法。
尽管本书主要涉及业已确立的物理学,我们仍描述了许多关键领域的最新进展,例如天体物理学、相对论、核物理与粒子物理。这些进展包括引力透镜、超大质量黑洞、石墨烯、玻色–爱因斯坦凝聚体(Bose–Einstein condensates)、超重核、暗物质、中微子振荡,以及希格斯玻色子(Higgs boson)与引力波的发现。
0.1
延伸阅读
R.P. 费曼(R.P. Feynman),《费曼物理学讲义》(Feynman Lectures on Physics)(新千年版),纽约:Basic出版社,2010年。
M. 朗盖尔(M. Longair),《物理学中的理论概念:对物理理论推理的另一种观点》(Theoretical Concepts in Physics: An Alternative View of Theoretical Reasoning in Physics)(第二版),剑桥:剑桥大学出版社(CUP),2003年。
R. 彭罗斯(R. Penrose),《通往实在之路:宇宙法则的完整指南》(The Road to Reality: A Complete Guide to the Laws of the Universe),伦敦:Vintage出版社,2005年。
1_Fundamental_Ideas
1
基本思想
1.1
变分原理
我们日常生活中的许多活动都旨在优化某个量。我们经常尝试以最小的努力或尽可能快地完成任务。举一个简单的例子:我们可能会规划一次驾车旅行以最小化旅行时间,选择一条较长的路线以便在高速公路上行驶得更快。图1.1是城镇A和B之间的示意道路图。普通道路上的速度是50 mph,而经过F、G和H的高速公路上的速度是70 mph。最短旅行时间是沿路线AFGB的1 hr 24 mins,尽管这不是最短的路线。
A
5
F
75
B
10
15
G
70
14
H
图1.1 道路图,距离以英里计。普通道路上的速度是50 mph,高速公路上是70 mph。
值得注意的是,许多自然过程也可以类似地看作是在优化某个量。我们说它们满足一个变分原理。一根在两个点之间拉伸的弹性带沿着一条直线;这是最短路径,也最小化了弹性带的能量。我们可以如下理解为什么直线是最短路径。首先我们需要假设最短路径确实存在。在当前情况下这是显然的,但还有更复杂的优化问题不存在最优解。现在假设最短路径上某处有一段弯曲。任何弯曲段都可以近似为一个圆的一部分,如图1.2所示,并且利用一点三角学知识,我们可以验证直线段CD比圆弧CD短。实际上,圆弧的长度是2Rα,而直线段的长度是2R sin α,更短。因此,最短路径在某处是弯曲的这一假设是矛盾的。所以最短路径是直的。

《物理世界》(The Physical World)。尼古拉斯·曼顿 (Nicholas Manton) 和尼古拉斯·米 (Nicholas Mee),牛津大学出版社 (2017)。
© 尼古拉斯·曼顿和尼古拉斯·米。DOI 10.1093/acprof:oso/9780198795933.001.0001
变分原理
5
R
C
2α
D
图1.2 路径的任何弯曲部分都可以用圆的一部分来近似。穿过该圆的直弦比弯曲路径短。

肥皂膜是另一个熟悉的、能量优化的物理例子。尽管它最初可能在振动,但肥皂膜最终会静止下来,处于静止状态。此时它的能量是其恒定的表面张力与面积的乘积,因此当面积最小时能量最小。对于三维空间中的任何光滑曲面,有两个主曲率半径,r1和r2;对于最小面积曲面,两个曲率半径相等,但指向相反的方向。曲面的每个区域都呈马鞍形,如图1.3所示。我们可以从物理上理解为什么表面张力会产生这种效果。在曲面的每个小面元上,两个曲率产生力。如果它们大小相等方向相反,则它们抵消,面元处于平衡。因此,物理中的能量和力的概念与几何中的最小面积概念之间有着密切的联系。我们将在第5章进一步讨论曲面的几何。

图1.3 肥皂膜是最小面积曲面。两个曲率半径相等,但曲率方向相反。一个方向的曲率产生的力与另一个方向的曲率产生的力平衡。

6
基本思想
1.1.1
几何光学——反射与折射
费马原理 (Fermat’s principle) 在光学领域是物理学中最早发现的最优化原理。它由皮埃尔·德·费马 (Pierre de Fermat) 于1662年提出。几何光学研究的是理想化的、无限细的光束,即光线。在现实世界中,使用抛物面镜或让光通过带有窄缝的屏幕,可以获得接近理想光线的狭窄光束。即使光不受这种物理限制,它仍然可以被视为沿不同方向传播的光线的集合。
费马原理指出,光线在给定两点A和B之间所取的路径,是使总传播时间最小的路径。这条路径可能是直线,也可能在穿过不同介质时发生弯折甚至弯曲。一个基本假设是,在给定介质中,光线具有确定的、有限的速度。在均匀介质中,例如空气、水或真空,传播时间等于路径长度除以光速。由于速度恒定,时间最小的路径也就是最短路径,即从A到B的直线路径。因此,光线在均匀介质中沿直线传播,这一点很容易验证。从位于A的光源以正确方向出发的光线将到达B;尽管光源可能向四面八方发光,但A和B之间连线上的任何一处小障碍物都会阻挡光线到达B,并在那里投下阴影。
费马原理可以用来理解光学的两个基本定律——反射定律和折射定律。首先考虑反射。假设在均匀介质中有一面长的平面镜,光源位于A点,光接收点B与A在镜子的同侧,如图1.4所示。考虑所有从A到B且只经镜面反射一次的可能光线。若要使光从A到B的传播时间最小,反射前后的路径段必须是直线。我们需要知道的是反射点X的位置。

A
a
b
x
B
X
0
X
(L -X )
镜子
L
ϑ
ϕ
图1.4 光线在镜面上的反射。

图中的坐标将x轴沿镜面设置,反射点X位于x = X处。考虑图中的各个长度,暂时忽略角度ϑ和ϕ。利用毕达哥拉斯定理确定路径长度,我们发现光经X点从A到B的时间为
变分原理
7
T = 1
c
p
a² + X² +
p
b² + (L −X)²
,
(1.1)
其中 c 是光沿两段直线路径的速度。T 对 X 的导数为
dT
dX = 1
c
X
√a² + X² −
L −X
p
b² + (L −X)²
!
,
(1.2)
当此导数为零时,旅行时间取极小值,从而得到关于 X 的方程:
X
√a² + X² =
L −X
p
b² + (L −X)² .
(1.3)
此时角度的概念就派上用场了,因为方程 (1.3) 等价于
cos ϑ = cos ϕ ,
(1.4)
这可以从图 1.4 中看出。因此 ϑ 和 ϕ 相等。我们并未明确求出 X,但这并不重要。重要的结果是:入射光线与反射光线在镜面处与法线的夹角相等。这就是反射的基本定律。事实上,通过化简方程 (1.3) 或考虑 cot ϑ = cot ϕ,我们得到 X/a = (L−X)/b,从而很容易解出 X。

折射现象与此大同小异。在折射中,光线从光速为 c₁ 的介质进入光速为 c₂ 的另一个质。折射的几何关系与反射有所不同,但差异并不显著,我们采用类似的坐标(见图 1.5)。根据费马原理 (Fermat’s principle),从 A 到 B(或从 B 到 A)的实际光线的路径是使传播时间取极小值的路径。注意,除非 c₁ = c₂,否则这条路径绝非从 A 到 B 的最短路径(即两点间的直线)。最小时间路径存在一个弯折,正如我们之前考虑的高速公路旁路线一样。从 A 到 X 和从 X 到 B 的光线必须是直线,因为每段路径完全处于单一介质内且以单一速度传播。因此,光从 A 行至 B 的总时间为

T = 1
c₁
p
a² + X² + 1
c₂
p
b² + (L −X)² .
(1.5)
同样,当 T 对 X 的导数为零时,时间 T 取极小值,即
dT
dX = 1
c₁
X
√a² + X² − 1
c₂
L −X
p
b² + (L −X)² = 0 .
(1.6)
由此得到关于 X 的方程:
1
c₁
X
√a² + X² = 1
c₂
L −X
p
b² + (L −X)² .
(1.7)
我们并非真正想解出此方程,而是希望用更几何化的方式表达它。借助图 1.5 中的角度 ϑ 和 ϕ,该方程变为

1
c₁
cos ϑ = 1
c₂
cos ϕ ,
(1.8)
8
基本概念
X
0
介质2
光速 c2
介质1
光速 c1
X
ϕ
ϑ
(L - X)
L
x
b
a
A
B
图1.5 光线的折射。c2(介质2中的光速)小于c1(介质1中的光速)。

或更实用的形式
cos ϕ = c2
c1
cos ϑ 。
(1.9)
这就是威里布罗德·斯涅尔(Willebrord Snell)折射定律。¹ 它将光线的角度与光速之比 c2 和 c1 联系起来。即使光速未知,斯涅尔定律也可以通过实验检验。为此,必须改变光束击中表面的角度,使 A 点和 B 点不再固定。当 cos ϕ 相对于 cos ϑ 绘图时,得到的图形是一条过原点的直线。
假设光线从空气进入水中。水中的光速小于空气中的光速,因此 c2 小于 c1,且 cos ϕ 小于 cos ϑ。所以 ϕ 大于 ϑ。如图1.5所示,容易验证,结果是光线向水面法线方向弯折进入水中。

斯涅尔定律有许多有趣的推论。它是诸如光聚焦和透镜系统等应用的关键。它也解释了全内反射现象。当一束源自 B 点(位于光速较慢的介质中)的光线以较小的角度 ϕ 射向表面,使得 cos ϕ 接近 1,从而导致 cos ϑ > 1 时,全内反射就会发生。此时角度 ϑ 无解,因此光线无法穿越表面进入介质1,整束光都被内部反射回来。全内反射的临界入射角 ϕc 取决于两种介质中的光速之比。方程(1.9)表明
¹ 斯涅尔定律用光线与表面法线(垂直线)之间的夹角 ϕ′ = π/2 − ϕ 和 ϑ′ = π/2 − ϑ 表示可能更常见,此时其形式为 sin ϕ′ = (c₂/c₁) sin ϑ′。
变分原理
9
即 cos ϕc = c2 c1。这一结果对光纤中光信号传输等应用至关重要。
最初,折射定律是用方程(1.9)右端的折射率之比来表达的。正是通过考察费马原理(Fermat’s principle),物理学家意识到该比值可以理解为光速之比。后来,当可以直接测量光在各种介质中的速度时,人们发现光在真空中传播速度最快,在空气中仅略慢一点。然而,在水或玻璃等密度更大的材料中,光速要慢得多,大约慢20%–40%。真空中的光速是一个绝对常数,为299,792,458 m s⁻¹,通常近似为3×10⁸ m s⁻¹。在稠密介质中,光速可能依赖于波长,因此当光线从空气进入玻璃或水时,不同颜色的光会偏折出不同的角度,这就是为何折射后的白光光束进入玻璃棱镜或水滴时会分解。
1.1.2 变分原理的适用范围
我们已经简要领略了如何将某些数学形式的自然定律用变分原理来表述。这些原理实际上要普适得多,在整个物理学中随处可见。无论是粒子的运动、场的波形、量子态,还是时空本身的形状,我们都发现自然过程总是在优化某个物理量。通常这意味着该量取极大值或极小值,但也可能是鞍点。²最重要的这类量被称为作用量(action),许多物理定律都可以表述为最小作用量原理(principle of least action)。分析这些原理的恰当数学工具称为变分法(calculus of variations)。它是普通微积分的推广,带有自己额外的工具,我们将在后文介绍。
早在18世纪,让·勒朗·达朗贝尔(Jean le Rond D’Alembert)、莱昂哈德·欧拉(Leonhard Euler)和约瑟夫-路易·拉格朗日(Joseph-Louis Lagrange)就意识到牛顿运动定律可以从最小作用量原理推导出来。19世纪30年代,威廉·罗文·哈密顿(William Rowan Hamilton)完善了这一方法。我们现在知道,关于电场和磁场的麦克斯韦方程组也来自电磁作用量原理,1915年大卫·希尔伯特(David Hilbert)证明了爱因斯坦新发现的、用弯曲时空描述引力的方程也源于一个作用量原理。甚至经典物理与量子力学之间的关系,也是通过作用量原理才能最好地理解。这一思想由保罗·狄拉克(Paul Dirac)首创,并由费曼(Feynman)完善。如今,作用量原理被视为概括粒子与场行为的最佳方法。
以这种方式表述物理理论的一个优点是,最小作用量原理简洁且易于记忆。例如,在麦克斯韦对电磁学的原始表述中,关于电磁场的方程有20个。在由约西亚·威拉德·吉布斯(Josiah Willard Gibbs)提出的现代矢量记法下,麦克斯韦方程组为四个,再补充以带电粒子的洛伦兹力定律(Lorentz force law)。而作用量则不同,它是从电磁场和带电粒子轨迹构造出的单一量,我们将在第3章中加以描述。在建立更复杂的基本粒子规范理论(gauge theories)(见第12章)乃至弦理论(string theory)等更高深的理论时,这种简洁性至关重要。
² 地形中的鞍点是指高度的驻点,类似于山口,但既非极大值也非极小值。
10
基本思想
在第2章中,我们将回到这些思想,并展示如何从最小作用量原理(principle of least action)出发来理解牛顿力学。通过考虑物理物体在空间中运动的所有可能的无穷小变化,我们将推导出牛顿运动定律。不过,我们首先必须用数学来描述这种运动发生的舞台。
1.2
欧几里得空间与时间
我们熟悉的3维欧几里得空间(Euclidean space),简称3-space,常记为R³,是物理世界戏剧上演的舞台。这出戏剧在时间中展开,但在非相对论物理学中,时间与空间并未统一,因此我们暂时不需要对时间进行几何描述。3-space具有欧几里得对称性,包括旋转和平移,其中平移是不带旋转的刚性移动。最基本的几何概念是两点之间的距离,并且这个距离在平移和旋转下保持不变。以不依赖于位置和方向的方式来表述物理定律是很自然的。这样,当整个物理系统被平移或旋转时,定律的形式不会改变。这赋予了这些定律一种几何意义。
P
x
O
A
B
x₁
x₂
x₃
1-轴
2-轴
3-轴
图1.6 用矢量x表示点P。

空间中的一个点最容易用笛卡尔坐标(Cartesian coordinates)来描述。为此需要选取一个原点O,以及一组相互正交(即成直角)的坐标轴。每个点P唯一地由三个实数表示,合起来写成一个矢量x = (x₁, x₂, x₃)。通常,我们不区分一个点和代表它的矢量。如图1.6所示,要从O到达P,先沿1-轴移动距离x₁到A,然后平行于2-轴移动距离x₂到B,最后平行于3-轴移动距离x₃到P。O本身用矢量(0, 0, 0)表示。

x的长度或大小是从O到P的距离,记为|x|。这个距离可以利用毕达哥拉斯(Pythagoras)定理计算。OAB是一个直角三角形,所以从O到B的距离是√(x₁² + x₂²),又因为OBP也是一个直角三角形,所以距离
欧几里得空间与时间
11
从 O 到 P 的距离是
p
(x2
1 + x2
2) + x2
3。因此距离的平方为
|x|2 = x2
1 + x2
2 + x2
3 ,
(1.10)
这是毕达哥拉斯(Pythagoras)定理的三维形式。如果绕 O 作旋转,距离 |x| 保持不变。
将 x 变到 x′ 的旋转可以是主动的,使得 x′ 与 x 是真正不同的点。或者,旋转可以是被动的,即坐标轴旋转,但点 x 实际上没有改变。所发生的一切只是 x 相对于旋转后的轴获得一组新的坐标 x′ = (x′
1, x′
2, x′
3)。在两种情况下 |x′| = |x|。
点 x 和 y 之间距离的平方为
|x −y|2 = (x1 −y1)2 + (x2 −y2)2 + (x3 −y3)2 .
(1.11)
这个距离不受旋转和平移的影响。平移将所有点平移一个固定矢量 c,因此 x 和 y 被平移到 x + c 和 y + c。差值 x −y 不变,因此 |x −y| 也不变。
y
x
O
ϑ
图 1.7 两个矢量的点积为 x · y = |x||y| cos ϑ。

当考虑一对矢量 x 和 y 时,引入它们的点积是很有用的
x · y = x1y1 + x2y2 + x3y3 .
(1.12)
一个特例是 x · x = x2
1 + x2
2 + x2
3 = |x|2,将 x 的长度的平方表示为 x 与其自身的点积。x · y 是否受旋转影响并不是显而易见的。然而,如果我们展开方程 (1.11) 右边的项,我们得到
|x −y|2 = |x|2 + |y|2 −2x · y ,
(1.13)
由于 |x|、|y| 和 |x −y| 都不受旋转影响,x · y 也必定不受影响。我们可以利用这个结果得到 x 和 y 点积的一个更方便的表达式。将其应用于边长分别为 |x|、|y| 和 |x −y| 的三角形,如图 1.7 所示,我们可以重新整理表达式 (1.13),然后利用余弦定理得到

x · y = 1
2(|x|2 + |y|2 −|x −y|2) = |x||y| cos ϑ ,
(1.14)
其中 ϑ 是矢量 x 和 y 之间的夹角。
由此可知,如果 x · y = 0,并且矢量 x 和 y 的长度不为零,那么 cos ϑ = 0,因此 x 与 y 之间的夹角为 ϑ = ± π
2,这两个矢量是正交的。
12
基本思想
例如,笛卡尔坐标轴的基向量 (1, 0, 0)、(0, 1, 0) 和 (0, 0, 1) 全都是单位长度,且它们中任意两个的点积都为零,因此它们是正交的。
关键的是,在欧几里得三维空间中,向量的长度以及它们之间的夹角在任何所有向量一同旋转的变换下都是不变的,这就是为什么点积是一个有用的构造。像 x · y 这样不受旋转影响的量被称为标量(scalars)。
还有一个进一步的、同样有用的构造。从两个向量 x 和 y 可以构造出第三个向量,即它们的叉积(cross product)x × y,如图 1.8 所示。其分量为

x × y = (x₂y₃ −x₃y₂, x₃y₁ −x₁y₃, x₁y₂ −x₂y₁) 。
(1.15)
叉积之所以有用,是因为如果 x 和 y 都绕任意轴旋转,那么 x × y 也会随之一起旋转。(如果有人发明了 x 和 y 的另一种向量积,其分量为 (x₂y₃, x₃y₁, x₁y₂),那么它就不会具有这种旋转性质,也就几乎没有什么几何意义。)与点积 x · y 不同,叉积 x × y 在旋转下并非不变。我们称它在旋转下与 x 和 y 协变(covariantly)。“协变”的意思是“随之而变”或“以相同方式变换”,这是一个在物理学中经常出现的概念。
O
x
y
x×y
ϑ
图 1.8 叉积 x × y 是一个长度为 |x||y| sin ϑ 的向量。

我们可以通过考虑 x × y 与第三个向量 z 的点积来验证 x × y 的这种旋转协变性。利用方程 (1.15) 和 (1.12),我们得到
(x × y) · z = x₂y₃z₁ −x₃y₂z₁ + x₃y₁z₂ −x₁y₃z₂ + x₁y₂z₃ −x₂y₁z₃ 。
(1.16)
这个结果一般不为零,但如果 z = x 或 z = y,则容易看出上述六项两两抵消,结果为零。这意味着 x × y 与 x 正交,也与 y 正交,如图 1.8 所示。因此,当受到旋转作用时,x × y、x 和 y 的方向必然全部一起转动。现在我们只需检验的是

欧几里得空间与时间
13
x × y 的长度在旋转下是不变的。用分量表示,x × y 的平方长度为
|x × y|² = (x₂y₃ − x₃y₂)² + (x₃y₁ − x₁y₃)² + (x₁y₂ − x₂y₁)² ,
(1.17)
经过一点代数运算,它可以重新表达为
|x × y|² = (x · x)(y · y) − (x · y)² .
(1.18)
右边只包含旋转不变的量,因此 |x × y| 同样是不变的。右边可以用长度和角度表示为 |x|²|y|² − |x|²|y|² cos² ϑ,这简化为 |x|²|y|² sin² ϑ。因此向量 x × y 的长度为 |x||y| sin ϑ。
当交换 x 和 y 时,两个量 x·y 和 x×y 具有相反的对称性。x·y = y·x,但 x×y = −(y×x),这从方程 (1.12) 和 (1.15) 可以清楚地看出。后一个关系意味着对于任意 x,有 x×x = 0。
由三个向量 x、y 和 z,可以构造出两个有用的几何量。一个是标量 (x×y)·z。它具有一些良好的对称性,可以利用方程 (1.16) 来验证,特别地
(x × y) · z = x · (y × z) .
(1.19)
另一个几何量是双重叉乘 (x × y) × z,它是一个向量。它可以通过一个重要恒等式用点乘来表示:
(x × y) × z = (x · z)y − (y · z)x .
(1.20)
这个恒等式在旋转下是协变的,利用叉乘定义 (1.15) 很容易检验。为了对其形式获得一些直观理解,注意到 x × y 正交于 x 和 y 张成的平面,再与 z 取叉乘得到的是一个正交于 x×y 的向量,因此回到该平面内。所以 (x×y)×z 必须是 x 和 y 的线性组合。这个向量也必须正交于 z,而恒等式右边显然满足这一点,因为
((x·z)y − (y·z)x)·z = (x·z)(y·z) − (y·z)(x·z) = 0 .
(1.21)
我们之所以较为详细地讨论了 x·y 和 x×y 的这些性质,是因为物理定律需要以一种当整个物理系统被旋转或平移时不会改变的方式来表达。更为重要的是,如果被动地旋转坐标轴或平移原点,物理定律也不应改变。因此点乘和叉乘在物理情境中频繁出现,例如在能量和角动量的公式中。在下一节,我们将遇到一个用 ∇ 表示的偏导数向量,当我们看到它出现在电磁理论中的 ∇·E 和 ∇×E 这样的表达式中时(其中 E 是电场向量),不应感到惊讶。我们将在第 3 章定义并使用这些量。
从几何学上讲,在我们于第 4 章讨论相对论之前,关于时间没有太多需要补充。在非相对论物理中,我们使用另一个笛卡儿坐标 t 来表示时间。给定时间 t₁ 和 t₂,有物理意义的是它们之间的间隔 t₂ − t₁。
14
基本思想
物理上具有意义。物理现象不受时间平移的影响。如果一个过程可以从t₁开始并在t₂结束,那么它同样可以从t₁ + c开始并在t₂ + c结束。假设某个系统在t = 0时开始,并在t = T时回到相同状态。那么它将重复,并在t = 2T、t = 3T等时刻再次回到相同状态。这一特性有着我们非常熟悉的实际应用,那就是时钟。
1.3
偏导数
三维空间中的物理学常常涉及多元函数。当一个函数依赖于多个变量时,我们需要考虑它对所有这些变量的导数。假设φ(x₁, x₂, x₃)是定义在欧几里得三维空间(Euclidean 3-space)中的一个光滑函数。偏导数
∂φ/∂x₁正是对x₁的普通导数,而将x₂和x₃视为固定或常量。它可以在任意点x = (x₁, x₂, x₃)处求值。通过固定x₂和x₃,本质上就是将φ视为沿通过x点且平行于1-轴的直线上关于x₁的函数,而偏导数∂φ/∂x₁正是沿这条直线的普通导数。偏导数∂φ/∂x₂和∂φ/∂x₃在x点处的定义类似,分别沿通过x点且平行于2-轴和3-轴的直线求导。
对于显式已知的函数,求其偏导数很容易。例如,若φ(x₁, x₂, x₃) = x₁³x₂⁴x₃,那么∂φ/∂x₁可通过求x₁³的导数并将x₂⁴x₃视为常数得到,对∂φ/∂x₂和∂φ/∂x₃也类似处理。因此
∂φ/∂x₁ = 3x₁²x₂⁴x₃, ∂φ/∂x₂ = 4x₁³x₂³x₃, ∂φ/∂x₃ = x₁³x₂⁴. (1.22)
回顾一下,通过使用函数f(x)的普通导数,记作f’(x),我们可以在δx很小时求得f(x + δx)的近似值:
f(x + δx) ≃ f(x) + f’(x)δx. (1.23)
类似地,通过使用偏导数∂φ/∂x₁,我们得到
φ(x₁ + δx₁, x₂, x₃) ≃ φ(x₁, x₂, x₃) + (∂φ/∂x₁)δx₁. (1.24)
通过组合φ在x点的三个偏导数,我们得到更强的结果
φ(x₁ + δx₁, x₂ + δx₂, x₃ + δx₃)
≃ φ(x₁, x₂, x₃) + (∂φ/∂x₁)δx₁ + (∂φ/∂x₂)δx₂ + (∂φ/∂x₃)δx₃. (1.25)
这给出了φ在靠近x的任意点x + δx处的近似值。
这里有一个隐含的假设,即∂φ/∂x₂在点(x₁ + δx₁, x₂, x₃)处的值与其在点(x₁, x₂, x₃)处基本相同,对∂φ/∂x₃也类似。这正是我们之前假设φ是光滑函数的原因。
φ的偏导数集合构成一个矢量(vector),记作∇φ:
∇φ = { ∂φ/∂x₁, ∂φ/∂x₂, ∂φ/∂x₃ }. (1.26)
偏导数
15
类似地,δx = (δx1, δx2, δx3) 是一个矢量。方程(1.25)可以更简洁地写为
φ(x + δx) ≃ φ(x) + ∇φ · δx ,
(1.27)
这个结果我们将反复使用。右边是一个真正的点积,当坐标轴旋转时它保持不变。∇φ 被称为 φ 的梯度(gradient)。
理解函数的一个好方法是通过它的等值面。对于三维空间中的函数 φ,等值面就是 φ 为常数的曲面。如果 δx 是穿过点 x 的等值面的任意切向量,那么 φ(x + δx) − φ(x) 在 δx 的一阶近似下 ≃ 0,因此 ∇φ · δx = 0。所以 ∇φ 与 δx 正交,这意味着 ∇φ 是一个垂直于等值面的矢量,如图 1.9 所示。事实上,∇φ 指向 φ 最陡上升的方向,其大小就是沿该方向 φ 随距离增加的速率。这印证了“梯度”这个名称。

∇φ
图 1.9 曲线代表 φ 的等值线。箭头表示梯度 ∇φ。

可能存在某些点 x,使得三个偏导数都为零,即 ∇φ = 0。此时 x 是 φ 的一个驻点(stationary point)。该驻点究竟是极小值、极大值还是鞍点,取决于 φ 在 x 处的二阶偏导数。
φ 有九个可能的二阶偏导数;它们包括 ∂²φ/∂x²₁、∂²φ/∂x₁∂x₂、∂²φ/∂x₂∂x₁ 和 ∂²φ/∂x²₂。混合偏导数 ∂²φ/∂x₁∂x₂ 是先对 x₂ 求导,然后再将结果对 x₁ 求导得到的;而 ∂²φ/∂x₂∂x₁ 的求导顺序则相反。
例如,对于函数 φ(x1, x2, x3) = x3_1x4_2x3,我们有
∂²φ/∂x²₁ = 6x1x4_2x3 , ∂²φ/∂x₁∂x₂ = 12x2_1x3_2x3 ,
∂²φ/∂x₂∂x₁ = 12x2_1x3_2x3 , ∂²φ/∂x²₂ = 12x3_1x2_2x3 .
(1.28)
注意,这两个混合偏导数实际上是相等的。这是一个重要而且普遍成立的结果。
16
基本概念
1-轴
2-轴
(x1, x2)
(x1, x2+δx2)
(x1+δx1, x2)
(x1+δx1, x2+δx2)
图 1.10 一个无穷小矩形,显示了可以在其上计算函数 φ 的四个位置。

要证明这个结果,我们需要考虑图 1.10 所示的 φ 取值矩形,并用两种方法估计下式:

φ(x1 + δx1, x2 + δx2, x3) − φ(x1 + δx1, x2, x3) − φ(x1, x2 + δx2, x3) + φ(x1, x2, x3) . (1.29)
一种估计是沿垂直边作差的差:
{φ(x1 + δx1, x2 + δx2, x3) − φ(x1 + δx1, x2, x3)} − {φ(x1, x2 + δx2, x3) − φ(x1, x2, x3)}
≃ ∂φ/∂x₂ (x1 + δx1, x2, x3) δx2 − ∂φ/∂x₂ (x1, x2, x3) δx2
≃ ∂²φ/∂x₁∂x₂ (x1, x2, x3) δx1δx2 .
(1.30)
另一种估计,通过重新组合括号,是沿水平边作差的差:
{φ(x1 + δx1, x2 + δx2, x3) − φ(x1, x2 + δx2, x3)} − {φ(x1 + δx1, x2, x3) − φ(x1, x2, x3)}
≃ ∂φ/∂x₁ (x1, x2 + δx2, x3) δx1 − ∂φ/∂x₁ (x1, x2, x3) δx1
≃ ∂²φ/∂x₂∂x₁ (x1, x2, x3) δx1δx2 .
(1.31)
由于这两式 (1.30) 和 (1.31) 的左边是相同的,因此混合偏导数必定相等。这个结果称为混合(二阶)偏导数的对称性,因为在交换求导次序时存在对称性。我们以后将利用这一点,例如,在研究麦克斯韦(Maxwell)方程组和推导各种热力学关系时。
φ 的二阶偏导数有一个特别重要的组合,称为 φ 的拉普拉斯算子(Laplacian),记作 ∇²φ。它是
∇²φ = ∂²φ/∂x²₁ + ∂²φ/∂x²₂ + ∂²φ/∂x²₃ ,
(1.32)
偏导数
17
它是一个标量,在坐标轴旋转时保持不变。如果把
[
\left( \frac{\partial}{\partial x_1}, \frac{\partial}{\partial x_2}, \frac{\partial}{\partial x_3} \right)
]
视为一个导数向量,并写成
[
\nabla^2 \phi = \left( \frac{\partial}{\partial x_1}, \frac{\partial}{\partial x_2}, \frac{\partial}{\partial x_3} \right) \cdot \left( \frac{\partial \phi}{\partial x_1}, \frac{\partial \phi}{\partial x_2}, \frac{\partial \phi}{\partial x_3} \right),
\tag{1.33}
]
或者更紧凑地写成 (\nabla^2 \phi = \nabla \cdot \nabla \phi),其标量性质就很明显了。更正式地,(\nabla^2 = \nabla \cdot \nabla)。对于我们熟悉的例子 (\phi = x_1^3 x_2^4 x_3),
[
\nabla^2 (x_1^3 x_2^4 x_3) = \frac{\partial^2}{\partial x_1^2}(x_1^3 x_2^4 x_3) + \frac{\partial^2}{\partial x_2^2}(x_1^3 x_2^4 x_3) + \frac{\partial^2}{\partial x_3^2}(x_1^3 x_2^4 x_3) = 6x_1 x_2^4 x_3 + 12 x_1^3 x_2^4 x_3,
\tag{1.34}
]
这是一个典型的非零结果。然而,有许多函数的拉普拉斯量是零,例如 (x_1^2 - x_2^2) 和 (x_1 x_2 x_3)。
在三维空间中,我们经常需要求一个仅依赖于到原点 (O) 的径向距离 (r) 的函数 (f(r)) 的梯度或拉普拉斯量。这里 (r^2 = x_1^2 + x_2^2 + x_3^2)。这些计算可能有点繁琐,因为 (r) 涉及平方根,但如果使用 (r^2) 来计算会简单些。我们先求梯度。根据链式法则,
[
\nabla (r^2) = 2r \left( \frac{\partial r}{\partial x_1}, \frac{\partial r}{\partial x_2}, \frac{\partial r}{\partial x_3} \right) = 2r \nabla r.
\tag{1.35}
]
另一方面,直接对 (x_1^2 + x_2^2 + x_3^2) 求偏导数可得
[
\nabla (r^2) = (2x_1, 2x_2, 2x_3) = 2\mathbf{x}.
\tag{1.36}
]
比较这两个表达式,我们得到
[
\nabla r = \frac{\mathbf{x}}{r} = \hat{\mathbf{x}}.
\tag{1.37}
]
(\mathbf{x}) 是大小为 (r) 的矢量,(\hat{\mathbf{x}}) 是在每一点(除 (O) 外)都沿径向向外的单位矢量。我们也可以通过注意到 (r) 的等值面是以 (O) 为中心的球面,且 (r) 随到 (O) 距离的增加率处处为 1 来理解方程 (1.37)。方程 (1.35) 很容易推广。对于一般的函数 (f(r)),链式法则给出
[
\nabla (f(r)) = f’(r) \nabla r = f’(r) \frac{\mathbf{x}}{r} = f’(r) \hat{\mathbf{x}}.
\tag{1.38}
]
这个结果最重要的例子是
[
\nabla \left( \frac{1}{r} \right) = -\frac{1}{r^2} \hat{\mathbf{x}},
\tag{1.39}
]
在考虑静电学和引力的平方反比律力时这个结果很有用。
18
基本概念
接下来,我们来求 (f(r)) 的拉普拉斯量。我们有 (\nabla (f(r)) = \frac{1}{r} f’(r) \mathbf{x}),所以
[
\nabla^2 (f(r)) = \nabla \cdot \nabla (f(r)) = \nabla \cdot \left( \frac{1}{r} f’(r) \mathbf{x} \right).
\tag{1.40}
]
根据通常的莱布尼茨(Leibniz)法则,最后一个表达式有两项贡献。其中一项是 (\nabla) 作用在函数 (\frac{1}{r} f’(r)) 上,给出贡献
[
\left( \frac{1}{r} f’’(r) - \frac{1}{r^2} f’(r) \right) \frac{\mathbf{x}}{r} \cdot \mathbf{x} = f’’(r) - \frac{1}{r} f’(r),
\tag{1.41}
]
这里我们再次应用了结果 (1.38)。另一项是点积,其中 (\nabla) 的分量 (\left( \frac{\partial}{\partial x_1}, \frac{\partial}{\partial x_2}, \frac{\partial}{\partial x_3} \right)) 分别作用在 (\mathbf{x}) 的三个分量 ((x_1, x_2, x_3)) 上,给出数字 3,因此第二项贡献是 (\frac{3}{r} f’(r))。把这两项相加,结果是
[
\nabla^2 (f(r)) = f’’(r) + \frac{2}{r} f’(r).
\tag{1.42}
]
最重要的例子是
[
\nabla^2 \left( \frac{1}{r} \right) = \frac{2}{r^3} + \frac{2}{r} \left( -\frac{1}{r^2} \right) = 0.
\tag{1.43}
]
这个方程在除 (O) 以外的所有点都成立。(\frac{1}{r}) 在 (O) 处无穷大,因此它在 (O) 的梯度没有定义,其拉普拉斯量也没有定义。我们说 (\frac{1}{r}) 在 (O) 点奇异。仅依赖于变量 (r) 且拉普拉斯量(除可能在 (O) 点外)为零的最一般的函数是 (\frac{C}{r} + D),其中 (C) 和 (D) 是常数。
1.4 (\mathrm{e})、(\pi) 与高斯积分
超越数 (\mathrm{e}) 和 (\pi) 在整个数学和物理学中出现,在下文中也将频繁使用。指数函数 (\mathrm{e}^x)(常写作 (\exp x))及其复数对应 (\mathrm{e}^{\mathrm{i}x}) 也将经常出现。(\mathrm{e}) 和 (\pi) 之间有两个引人注目的关系。一个是著名的欧拉(Euler)关系
[
\mathrm{e}^{\mathrm{i} \pi} = -1,
\tag{1.44}
]
另一个是高斯积分公式
[
\int_{-\infty}^{\infty} \mathrm{e}^{-x^2} ,dx = \sqrt{\pi}.
\tag{1.45}
]
我们将在本节解释这些关系,并描述实指数函数和复指数函数的两个基本物理应用。
指数函数由以下级数定义
[
\mathrm{e}^x = 1 + x + \frac{1}{2} x^2 + \frac{1}{6} x^3 + \cdots + \frac{1}{n!} x^n + \cdots,
\tag{1.46}
]
对所有 (x) 都是正的。显然 (\mathrm{e}^0 = 1)。欧拉常数 (\mathrm{e}) 定义为 (\mathrm{e}^1),即级数在 (x=1) 时的和。它的数值是 (\mathrm{e} = 2.718\dots)。通过逐项展开,可以验证
[
\mathrm{e}^{x+y} = \mathrm{e}^x \mathrm{e}^y,
\tag{1.47}
]
这是指数函数的关键性质。这个性质使得将 (\mathrm{e}^x)(作为级数)与 (\mathrm{e}) 的 (x) 次幂等同起来是自洽的。举例来说,(\mathrm{e}^2)(作为级数)等于…
e, π 与高斯积分
19
(两个级数的乘积)所以 e² = e × e。对级数(1.46)逐项求导,很容易看出
d
dx(eˣ) = eˣ 。
(1.48)
这个简单公式的重要性将在第1.4.1节中阐述。
指数函数向虚数宗量的推广使用同样的级数展开来定义:
eⁱˣ = 1 + ix − ½ x² − ⅙ i x³ + ··· + iⁿ/n! xⁿ + ··· ,
(1.49)
其中 i² = −1。该展开的实部和虚部正是众所周知的 cos x 和 sin x 的级数展开:
cos x = 1 − ½ x² + 1/24 x⁴ + ··· ,
(1.50)
sin x = x − ⅙ x³ + ··· ,
(1.51)
因此
eⁱˣ = cos x + i sin x 。
(1.52)
现在,cos π = −1 而 sin π = 0,所以若将值 x = π 代入该表达式,我们就得到了欧拉关系式 eⁱᵖ = −1。将其升至 2n 次幂,我们看到一个推论是对任意整数 n 都有 e²ⁿⁱᵖ = 1。
1.4.1 放射性衰变
2
1
0
放射性原子核
数目
N₀
0
3
4
5
6
7
8
样品年龄 (τ½)
½ N₀
图1.11 放射性衰变。
20
基本思想
放射性于1896年由亨利·贝克勒尔(Henri Becquerel)发现。当放射性原子核衰变时,它会变成另一种原子核。放射性原子核数目 N 的变化率由以下定律描述:
dN/dt = −λ N ,
(1.53)
其中 λ 称为衰变常量。放射性呈指数衰减,因为微分方程(1.53)的解为
N = N₀ e^(−λ t) ,
(1.54)
其中 N₀ 是 t = 0 时放射性原子核的初始数目。该解如图1.11所示。取对数,我们得到
ln(N/N₀) = −λ t 。
(1.55)
半数原子核衰变所需的时间 τ_½ 被称为放射性物质的半衰期。它由 ln(½) = −λ τ_½ 给出,因而
τ_½ = ln 2 / λ 。
(1.56)
我们也可以算出放射性原子核的平均寿命 t̄。所有 N₀ 个原子核最终都会衰变,因此我们可以对衰变时刻求平均,得到
t̄ = 1/N₀ ∫₀^(N₀) t dN
= −1/(λ N₀) ∫₀^(N₀) ln(N/N₀) dN
= −1/(λ N₀) [N ln N − N − N ln N₀]₀^(N₀)
= 1/λ ,
(1.57)
其中第二行我们用方程(1.55)替换了 t。
放射性为文物年代测定提供了极为有用的工具。如果我们知道某样品物质最初含有 N₀ 个放射性原子核,而现在含有 N 个,那么我们就可以确定从该物质形成以来所经过的时间 t:
t = 1/λ ln(N₀/N) = (τ_½ / ln 2) ln(N₀/N) 。
(1.58)
根据不同的时间尺度,可以使用不同的放射性原子核。例如,铀-238的半衰期约为45亿年,已被用于测定陨石年代,从而确定太阳系的年龄;碳-14的半衰期为5730年,被用于测定考古遗迹的年代。
e, π 和高斯积分
21
x
图 1.12 平面波 ei(kx−ωt) 以速度 ω/k 沿 x 方向传播。随着时间的推移,固定位置处的波振幅保持不变,而波的相位则绕圆周旋转。图中展示了该波分解为其实部和虚部,它们是两个相互垂直的正弦波,相对相位差为 π/2。
1.4.2 波与周期函数
我们可以将随位置 x 和时间 t 变化、向 x 正方向传播的波表示为 ei(kx−ωt),其中 k 和 ω 为正,如图 1.12 所示。根据欧拉关系,在 kx 相差 2π 整数倍的位置,波是相同的,因此波长为 2π/k。类似地,在 ωt 相差 2π 整数倍的时间,波也是相同的,因此周期为 2π/ω。k 和 ω 分别称为波的波数和角频率。
波的相位在 kx−ωt 等于常数的位置保持不变。因此,相位在一个以速度 ω/k 移动的点 x 处保持恒定,这就是波的速度。如果 k 为负而 ω 仍为正,则波向相反方向传播。
波的实部和虚部分别是 cos(kx −ωt) 和 sin(kx −ωt)。它们被称为正弦波,但其中一个是相对于另一个有 π/2 的相移。许多类型的波,例如电磁波和流体表面的波,都是实数的,但在量子力学中,自由运动粒子的波函数是一个复波。
1.4.3 高斯积分
高斯函数 e−x2 的积分(如图 1.13 所示)不能用标准函数表示,因此从 −∞ 到 X 的不定积分不是初等的。另一方面,从 −∞ 到 ∞ 的定积分的值为
I = ∫_{-∞}^{∞} e^{-x^2} dx = √π 。 (1.59)
这是最简单的高斯积分。它在物理学中经常出现,我们稍后会用到它。
22
基本思想
0
0.2
0.4
0.6
0.8
e –x^2
1.0
–1
–2
–3
1
2
3
图 1.13 高斯函数。
I 可以通过一个相当巧妙的技巧来计算。我们首先考虑它的平方,
I^2 = ∫_{-∞}^{∞} e^{-x_1^2} dx_1 ∫_{-∞}^{∞} e^{-x_2^2} dx_2 。 (1.60)
这可以表示为二维积分
I^2 = ∫_{R^2} e^{-x_1^2 - x_2^2} d^2x , (1.61)
其中积分区域是整个平面 R^2。现在转换到极坐标。令 r 为径向坐标,ϑ 为角坐标。那么,根据毕达哥拉斯定理 r^2 = x_1^2 + x_2^2,积分测度为 d^2x = r dr dϑ。于是
I^2 = ∫_{0}^{2π} ∫_{0}^{∞} e^{-r^2} r dr dϑ = 2π ∫_{0}^{∞} e^{-r^2} r dr 。 (1.62)
ϑ 的范围是 2π,因为从几何上看,2π 是单位圆的周长。额外的因子 r 使得对 r 的积分成为初等积分,结果为
I^2 = 2π [ -½ e^{-r^2} ]{0}^{∞} = π , (1.63)
因此 I = √π,如所断言。
更一般的高斯积分是
I(α) = ∫{-∞}^{∞} e^{-αx^2} dx = 1/√α ∫_{-∞}^{∞} e^{-y^2} dy = √(π/α) , (1.64)
其中我们使用了代换 y = √α x。另一个有用的技巧允许我们计算高斯函数乘以 x 的偶次幂的积分序列。对积分 I(α) 关于 α 求导会带下一个因子 −x^2,因此
∫_{-∞}^{∞} x^2 e^{-αx^2} dx = - dI(α)/dα = - d/dα √(π/α) = 1/(2α) √(π/α) 。 (1.65)
e、π与高斯积分
23
再一次对α求导,我们得到
∫ ∞
−∞
x⁴e^{-αx²} dx = −d/dα ( √π / (2α^{3/2}) ) = (3/(4α²)) √(π/α) . (1.66)
我们可以继续对α求导,以计算所有形如 ∫ ∞_{−∞} x^{2n} e^{-αx²} dx 的积分。
如果高斯函数乘以x的奇次幂,被积函数是奇函数,在 x → −x 变换下是反对称的,因此 ∫ ∞_{−∞} x^{2n+1} e^{-αx²} dx = 0。当下限为0时,这些积分可以通过代换 y = x²,然后分部积分来计算,得到
∫ ∞0 x^{2n+1} e^{-x²} dx = 1/2 ∫ ∞_0 y^n e^{-y} dy = [ −1/2 y^n e^{-y} ]0^∞ + (1/2)n ∫ ∞_0 y^{n-1} e^{-y} dy = (1/2)n ∫ ∞_0 y^{n-1} e^{-y} dy . (1.67)
重复这一步骤n次,我们得到 ∫ ∞_0 y^n e^{-y} dy = n! ∫ ∞_0 e^{-y} dy = n!,因此
∫ ∞_0 x^{2n+1} e^{-x²} dx = 1/2 n! . (1.68)
基本的高斯积分和这些变形在物理学的许多领域中都很有用,尤其是在量子力学和量子场论中。
通过考虑I的n次幂,我们还可以得到一些有趣的几何结果,
I^n = ∫ ∞{−∞} e^{-x_1^2} dx_1 ∫ ∞{−∞} e^{-x_2^2} dx_2 ··· ∫ ∞_{−∞} e^{-x_n^2} dx_n , (1.69)
它可以重新表示为一个n维积分
I^n = ∫_{R^n} e^{-x_1^2 - x_2^2 - \cdots - x_n^2} d^n x . (1.70)
现在转换到n维球极坐标 r, Ω,其中Ω共同表示n−1个角坐标。根据n维空间中的勾股定理(Pythagoras’ theorem),r² = x_1² + x_2² + ··· + x_n²,积分测度 d^n x 变为 r^{n-1} dr dΩ,其中dΩ表示n维空间中单位球面的体积元,即单位 (n−1)-球面。于是
I^n = ∫ ∫ ∞_0 e^{-r²} r^{n-1} dr dΩ . (1.71)
对dΩ的积分是单位 (n−1)-球面的总体积,而剩下的径向积分是上面考虑过的高斯积分之一。
例如,在 I³ 的情形中,径向积分与积分(1.65)形式相同,但下限为0(且α=1)。其值为 1/4 √π,是整个高斯积分的一半,因此
I³ = 1/4 √π A (1.72)
其中A是单位2-球面的面积,即我们熟悉的球面。我们知道 I = √π,所以 I³ = π√π,因此 A = 4π,这就是我们熟知的球面面积的结果。
24
基本思想
球面。注意,在这个计算中,使用高斯积分,我们无需显式选择角坐标即可求出A。
通过类似的计算,我们可以得到一个不太为人所知的结果,即四维空间中单位球面的体积,即3-球面。正如2-球面是包围三维球体的二维曲面,3-球面则是包围四维空间球体的三维体积。方程(1.71)变为
I4 = V
Z ∞
0
e−r2 r3 dr ,
(1.73)
其中V是单位3-球面的体积。利用I4 = π2以及n=1时的积分(1.68),即R ∞
0
e−r2 r3 dr = 1
2,我们求出V = 2π2。
1.4.4
最陡下降法
在许多物理应用中,我们会遇到无法精确计算的积分,其中被积函数是某种高斯函数变体与另一个函数的乘积。我们将在第11章考虑核聚变时看到这样的例子。在这种情况下,基本的高斯积分可以用来估计这些更复杂的积分。假设g(x)在α和β之间于x0处有一个最大值;那么,由于g′(x0) = 0且g′′(x0) < 0,我们可以在x0附近使用展开g(x) ≃g(x0) −1
2|g′′(x0)|(x −x0)²。这意味着积分
I =
Z β
α
F(x) exp(g(x)) dx
(1.74)
可以近似为
I ≃exp(g(x0))
Z β
α
F(x) exp
−1
2|g′′(x0)|(x −x0)2
dx .
(1.75)
进一步,如果F(x)在x0附近变化缓慢,那么它可以被视为常数F(x0)并从积分中提出,得到
I ≃F(x0) exp(g(x0))
Z β
α
exp
−1
2|g′′(x0)|(x −x0)2
dx .
(1.76)
由于被积函数集中在x0点附近,我们可以将积分限扩展到±∞,而不会显著影响积分值,所以
I
≃
F(x0) exp(g(x0))
Z ∞
−∞
exp
−1
2|g′′(x0)|(x −x0)2
dx
F(x0) exp(g(x0))
s
2π
|g′′(x0)| ,
(1.77)
其中最后一步我们用到了高斯积分(1.64)。
这被称为最陡下降近似。只要二阶导数g′′(x0)的绝对值很大,并且g和F在x0附近的泰勒展开中的高阶项可以被忽略,这个近似就是准确的。
进一步阅读
25
1.5
进一步阅读
关于变分原理及其历史的概述,参见
D.S. 莱蒙斯(D.S. Lemons),《完美形式:变分原理、方法及其在基础物理学中的应用》(Perfect Form: Variational Principles, Methods, and Applications in Elementary Physics),普林斯顿:普林斯顿大学出版社(PUP),1997年。
H.H. 戈尔茨坦(H.H. Goldstine),《变分法史:从十七世纪到十九世纪》(A History of the Calculus of Variations: from the 17th through the 19th Century),纽约:施普林格(Springer),1980年。
关于本书所用数学的全面概览,请查阅
K.F. 赖利(K.F. Riley)、M.P. 霍布森(M.P. Hobson)和S.J. 本斯(S.J. Bence),《物理与工程数学方法》(Mathematical Methods for Physics and Engineering)(第3版),剑桥:剑桥大学出版社(CUP),2006年。
2_Motions_of_Bodies-Newton’s_Laws
2
物体的运动——牛顿定律
2.1
引言
在这个城市居住的时代,我们很少能目睹苍穹的全部美丽,观星似乎只是一种昂贵而有趣但终究毫无价值的消遣。然而,我们不应忘记,科学始于天文学。在16世纪最后三十年,第谷·布拉赫(Tycho Brahe)将天文学提升到了一个全新的精度水平。他设计并制造了大型仪器,使他能够对夜空进行系统而精确的观测,在几十年的时间里标绘出行星的位置,并引入了许多如今科学家在收集数据时常规使用的程序,例如寻找误差来源并估计其大小。1601年第谷去世后,约翰内斯·开普勒(Johannes Kepler)潜心对这些观测进行艰苦的分析,寻找能够解释行星运动的模型。经过数年紧张的探索,开普勒于1609年发表了对行星如何绕太阳运动的一种新颖而简洁的描述。他的结论总结为三条定律。第一定律描述了行星轨道的形状,它是一个椭圆,太阳位于椭圆的一个焦点上。第二定律描述了行星在椭圆轨道上运行时,随着它接近和远离太阳,相对速率的变化。第三定律将行星的轨道周期与其到太阳的距离联系起来。
开普勒的定律纯粹是描述性的,他未能找到真正的因果解释。他最好的猜测是,太阳的旋转以某种方式带动着行星绕转。这个问题在17世纪的大部分时间里都没有得到解决。正是渴望找到开普勒定律的力学解释,促使艾萨克·牛顿(Isaac Newton)发展了他的力学体系,并于1687年发表在《原理》(Principia)中。牛顿建立在他人工作的基础上,最著名的是开普勒、伽利略·伽利莱(Galileo Galilei)和杰雷米亚·霍罗克斯(Jeremiah Horrocks),但他个人的成就是里程碑式的。牛顿创立了第一个理性力学,并刺激了整个科学的发展。这带来了一场革命,最终导致了现代世界的诞生。
尽管牛顿是第一个理解微积分的人,但他的《原理》是用经典几何学的语言写成的。不过,我们不会详述牛顿最初的表述方式,而是采用牛顿之后很久才发展起来的数学风格。例如,牛顿是第一个认识到对于速度、加速度和力,它们的方向与它们的大小同样重要,因此必须将它们视为向量(vector)。然而,我们将使用的向量符号直到19世纪末才发展起来。
我们从概述牛顿运动定律开始,并展示如何从最小作用量原理(principle of least action)推导出这些定律。接着,我们将考虑一些重要的例子,出自《物理世界》,尼古拉斯·曼顿与尼古拉斯·米著,牛津大学出版社(2017)。©尼古拉斯·曼顿与尼古拉斯·米。DOI 10.1093/acprof:oso/9780198795933.001.0001
27
在三维空间中的物体运动,并证明如果我们假设太阳与行星之间的吸引力随它们之间距离的平方反比减小,那么开普勒(Kepler)定律便可以从牛顿(Newton)运动定律推出。
2.2 牛顿运动定律 (Newton’s Laws of Motion)
牛顿定律描述一个或多个大质量物体的运动。单个物体具有确定的质量 (m)。物体的内部结构和形状通常可以忽略,此时物体可被视为一个具有确定位置 (x) 的点粒子。随着它的运动,其位置在空间中描绘出一条曲线 (x(t))。稍后我们将证明,尽管复合物体尺寸有限,但它们可以被当作具有一个称为质心的单一中心位置来处理。
牛顿第一定律指出,物体以恒定速度运动是自持的,无需力的作用。速度 (v) 是物体位置 (x(t)) 的时间导数,
[
v = \frac{dx}{dt}. \tag{2.1}
]
在没有力的情况下,速度是常量 (v_0),因此 (\frac{dx}{dt} = v_0),物体位置作为时间的函数为
[
x(t) = x(0) + v_0 t, \tag{2.2}
]
其中 (x(0)) 是初始时刻 (t=0) 的位置。该物体以恒定速率 (|v_0|) 沿直线运动,而若速度为零,则物体静止。
牛顿第二定律定义了我们所说的力的含义。它指出,若一个力作用在质量为 (m) 的物体上,则该物体会加速。加速度 (a) 和力 (F) 是平行的矢量,它们之间的关系为
[
ma = F. \tag{2.3}
]
这是牛顿力学中大多数涉及力的计算的出发点。
牛顿第二定律与微积分密切相关。加速度是速度的时间导数,进而是位置的二阶时间导数,
[
a = \frac{dv}{dt} = \frac{d^2x}{dt^2}. \tag{2.4}
]
在给定力的情况下,方程 (2.3) 就变成了关于物体位置随时间变化的二阶微分方程,
[
m\frac{d^2x}{dt^2} = F. \tag{2.5}
]
如果没有力,则加速度为零,速度恒定,这恰好重述了第一定律,因此第一定律可被视为第二定律的一个特例。
方程 (2.5) 是牛顿力学成功的关键。它具有巨大的预测能力,但为了使用它,我们需要一些关于力 (F) 所取形式的独立信息。对于带电粒子所受的电场力和磁场力,我们可以利用电场和磁场的概念得到这些信息,这一点将在第3章中讨论。弹簧产生的力,以及描述碰撞和摩擦的各种接触力,也可以用简单的代数表达式来表示。至于引力的情况,
28
物体的运动——牛顿(Newton)定律
牛顿指出,只有当太阳与行星之间的作用力遵循反平方定律时,开普勒定律才能得到解释,对此我们稍后会加以说明。
对于地球表面附近的物体,牛顿万有引力定律可以简化,从而容易求出它们的运动。地球对质量为 m 的物体施加的力方向向下,大小为 mg,其中 g = 9.81 m s⁻² 是一个正数常量,它由牛顿万有引力常数 G 与地球的质量和半径组合而成。在这种情况下,牛顿第二定律简化为
ma = −mg
(2.6)
式中 a 是向上的加速度。m 被消去,这对由引力产生的加速度总是成立,因此 a = −g。加速度 a 为负,当然是指向下。g 称为重力加速度。对所有物体它都是相同的,在这种简化情形下与物体的位置无关。
假设运动是纯垂直的,我们来更仔细地考察作为微分方程的方程 (2.6)。消去 m 后,方程 (2.6) 变为
d2z
dt2 = −g ,
(2.7)
其中 z 是物体相对某一参考水平面的高度。其解为
z(t) = −1
2gt2 + u0t + z0 ,
(2.8)
式中 z₀ 和 u₀ 分别是 t = 0 时刻的高度和向上的速度。对于任意的 z₀ 和 u₀,z 对 t 的图线是一条抛物线,若时间区间有限则为抛物线的一部分,如图 2.1 所示。

z0
t
O
z
图 2.1 重力作用下的运动。

我们也可以考虑非垂直运动,例如炮弹这类抛射体的运动。物体在竖直平面内运动,以 z 为竖直坐标,x 为水平坐标。由于引力没有水平分量,物体没有水平加速度,因此 x 与 t 成线性关系。适当选取 x 的原点后,x 就是 t 的某个常数倍,这个倍数即为速度的恒定水平分量。我们假设该倍数不为零。另一方面,运动的竖直部分仍由方程 (2.8) 给出。我们并非将 z 对 t 作图,而是可以
最小作用量原理
29
现在我们来绘制 z 关于 x 的图像。这仅仅需要对 t 轴进行重新标度,因为 x 是 t 的倍数。图 2.1 展示的是物体在 (x, z) 平面内的抛物线轨迹,而不是高度作为时间的函数。

牛顿第三定律指出,每一个作用力都有一个方向相反的反作用力。如果第一个物体对第二个物体施加一个力 F,那么同时第二个物体也对第一个物体施加一个力 −F。这一点可以在台球的碰撞中,以及质量相当的天体(如双星)的运动中观察到。事实上,这正是用来发现邻近恒星星系中存在行星的方法之一:当一颗未见行星绕恒星旋转时,该恒星的视位置会发生振荡。类似地,当一个质量为 m 的物体靠近地球表面时,地球对它施加一个向下的引力 mg,同时该物体对地球施加一个大小相等但向上的引力,尽管这可能微小到难以测量。不过,如果该质量悬挂在一个弹簧上,那么弹簧会对该质量施加一个向上的力 mg 阻止其下落,而该质量则会施加一个向下的力 mg 拉伸弹簧,从而使得 m 能够被测量出来。
我们或许有坚实物观测证据来支持牛顿第三定律,但它成立的深层原因并不是显而易见的。我们将在后文看到,在最小作用量原理的框架下,第三定律可以从一个简单的几何观念推导出来。
2.3 最小作用量原理
大质量物体的运动都有一个共同点。无论是抛向空中的重重球体,还是行星绕太阳的运动,都存在一个与该物体能量相关的量,称为作用量,当沿着物体实际运动的路径计算时,这个量取可能的最小值。作用量在物体的轨迹上取极小值这一事实被称为最小作用量原理。在实践中,该原理被用来推导运动方程,我们很快会看到,这些方程与用更标准方法导出的结果完全相同。最小作用量原理表明,从某种意义上说,我们观察到的实际运动,是所有可能发生的可想运动中的最优运动。
这似乎表明自然界以一种高效的方式运作,以最小的努力依照某种计划行事。当然,自然界并非有意识地“试图”优化其表现,也根本不存在什么计划。实际上,并不需要任何预见性,因为只需要局部信息就足够了,这也是轨迹最优的条件能够重新表达为微分方程的原因。最小作用量原理实际上比牛顿力学更为基本,其适用范围远远超出了牛顿物理学。从根本上说,几乎所有的物理定律——描述从最小基本粒子到膨胀宇宙中星系运动的一切——都可以用某种形式的最小作用量原理来理解。事实上,我们可以把理论物理学家和应用数学家们的终极目标,视为在物理学的每一个分支中,找出作用量所应具有的正确形式。
不考虑最小作用量原理也可以。我们可以仅仅使用运动方程。这是整个物理学中沿用的传统方法,但令人惊讶的是,最小作用量原理似乎比运动方程更加基本。对这一观点的论证,在费曼的一次极负盛名的演讲中得到了充满独特热情的阐述。该论证的一个关键论点在于,最小作用量原理不仅仅是获得经典运动方程的一种技巧,
30
物体的运动——牛顿定律
粒子与场。它在经典理论与量子理论的关系中也扮演着核心角色。
使用最小作用量原理有若干优点。首先是概念上的,它在物理科学的各个领域似乎都是一个基本且统一的原则。其次,它的数学表述基于时空几何,以及速度和能量这些核心概念,而牛顿第二定律中的变量——加速度和力——则成为次要的、派生的概念。这很有用,因为速度比加速度更简单,能量比力更容易从直觉上理解。使用牛顿定律时,总会面临力是如何产生的以及什么决定了它们的形式这类问题。第三个优点是,作用量原理比运动方程更少。一个物体系统的所有运动方程都源于一个单一的原理。同样,电磁场的全部四个麦克斯韦方程也源于一个作用量原理。最后一个优点是,作用量可以使用任何坐标系写出,这使得理解某些类型的运动变得更容易。例如,将运动方程从笛卡尔坐标转换为极坐标相当繁琐,但如果从最小作用量原理出发,极坐标下的方程可以相对容易地获得。
那么缺点是什么呢?嗯,它需要更复杂的数学技术。作用量是能量贡献的组合,对时间进行积分,而推导运动方程的标准方法是变分法,这是函数空间中的微积分,而不是初等微积分。此外,由最小作用量原理导出的运动方程是微分方程,仍然需要求解。
还有一个明显的物理问题,即由最小作用量原理导出的运动方程没有摩擦项,这意味着能量是守恒的,运动会永远持续下去。摩擦必须单独添加,但这实际上利大于弊。在基本层面上,这表达了能量确实守恒的事实。摩擦项是一种处理能量耗散的现象学方法,即能量转移到所考虑系统之外的微观自由度。
变分法听起来可能令人生畏,但幸运的是,最小作用量原理及其推论可以变得更容易理解。在第一章中,我们通过展示在涉及光线的费马原理的某些应用中不需要变分法,已经开始了这条道路。我们使用几何学结合初等微积分获得了物理上重要的结果。很快,我们将对一维运动的物体提出最小作用量原理,并重新推导出牛顿第二运动定律。对于一个简单的例子——在线性势中的运动,它对应于恒定的力,我们可以再次使用初等微积分。扩展这个论证,我们可以继续推导出一般势中的运动方程。为了完整性,我们也给出变分法的推导。
在2.4节中,我们讨论两个相互作用物体的最小作用量原理,这引出了牛顿第三定律和动量守恒定律。我们还表明,对于一个由两个或多个部分组成的复合体,存在一个关于其质心的自然概念。这是通过考虑该物体的总动量而显现出来的。
最小作用量原理
31
2.3.1
一维运动
让我们看看如何利用最小作用量原理推导出牛顿(Newton)第二运动定律。最简单的情形是考虑单个物体的一维运动,比如沿 x 轴的运动。设 x(t) 为该物体的一条可能路径,但不一定是实际经过的路径。物体的速度为
v = dx
dt ,
(2.9)
它也是 t 的函数。
为了建立最小作用量原理,我们假定一个运动的物体具有两类能量。第一类是因其速度而具有的动能。动能与运动方向无关,因此对于速度 v 和速度 −v 是相同的,这就暗示动能是 v² 的某个倍数。它还依赖于别的什么吗?直观上,几个物体的总动能等于各个物体动能之和。N 个相同的物体以相同速度一起运动,其动能是一个物体动能的 N 倍,质量也是一个物体的 N 倍。因此动能正比于质量,也正比于速度的平方。我们假定,一个质量为 m、速度为 v 的物体的动能 K 为
K = 1
2mv2 = 1
2m
dx
dt
2
,
(2.10)
其中引入因子 1/2 是为了便于与牛顿定律衔接。
物体的第二类能量是势能。势能源于环境,与速度无关。它取决于其他物体的存在以及它们彼此相互作用的方式,无论是电的、引力的还是其他形式。我们假定,物体的势能是其位置的函数 V (x)。实际上我们只需要知道物体在每一时刻 t 所在位置 x(t) 处的 V 值,所以严格地,我们写作 V (x(t))。然而,重要的是 V 在物体可能到达的一切位置——即某个范围内的所有 x——都有定义。我们常说物体在势 V 中运动。
势能 V (x) 的形式取决于具体的物理情境,要进行计算就必须知道它,正如使用牛顿第二定律时必须知道力才能解出物体的运动一样。V (x) 有时具有简单的形式。例如,若物体是自由的,与环境没有显著的相互作用,则 V 与位置无关,只是一个常数 V₀。我们稍后将看到,这个常数的数值没有任何物理效应。对于靠近地球表面的物体,我们直觉上知道,将物体举高需要能量,因此物体的势能随高度增加而增大。将物体举高一段高度 h 需要一定的能量,再举高相同的高度 h 还需要同样的能量。同样,将两个质量均为 m 的物体举高 h 所需的能量是将一个质量为 m 的物体举高 h 所需能量的两倍。这便导致如下断言:物体被举高 h 时势能的增加量为 mgh,正比于质量和高度,并乘以一个常数 g。我们之后会看到,g 就是重力加速度。因此,物体在某个参考水平面之上高度为 x 处的总势能为
V (x) = V0 + mgx ,
(2.11)
其中常数 V₀ 同样没有物理效应。(在本节中,为保持一致,我们用 x 作为表示高度的坐标,而不再像之前那样用 z。)对于一个系在……
32
物体的运动——牛顿定律
被拉伸的弹簧,其势能为V(x)=1/2 kx^2,是x的二次函数;在其他情况下,V的形式或是已知的,或是可以假设的。
我们现在考虑物体在初始时刻t0从初始位置x0运动到稍后时刻t1的最终位置x1。我们将采用哈密顿(Hamilton)对作用量的定义,这已成为现在的标准定义,尽管历史上曾有过其他定义。对于每一种可能的运动,作用量S定义为
S = ∫_{t0}^{t1} ( 1/2 m (dx/dt)^2 − V(x(t)) ) dt . (2.12)
被积函数是物体在时刻t的动能减去势能。这里的减号至关重要,它解释了为何我们之前会谈到两种类型的能量。二者的区别在于,一种依赖于速度,另一种则不依赖。作用量有时也写成简洁的形式
S = ∫_{t0}^{t1} (K − V) dt , (2.13)
或者更简明地写为
S = ∫_{t0}^{t1} L dt , (2.14)
其中L = K − V 被称为拉格朗日量(Lagrangian)。作用量是拉格朗日量的时间积分,这不仅适用于单个物体在一维中的运动,也适用于更普遍的情形。
最小作用量原理(principle of least action)现在断言:在所有连接固定端点的可能路径x(t)中,物体实际所走的路径X(t)是使作用量S取最小值的那一条。¹
请注意,我们并不是仅对单个量——比如物体在中间时刻½(t0+t1)的位置——求极小值,而是对无穷多个表征所有可能路径(包含所有可能的摆动)的变量求极小,这是一个微妙得多的问题。为了着手处理,我们必须做出物理上合理的假设:路径x(t)具有一定的光滑性。换言之,可接受的路径是那些加速度保持有限、因而速度连续的路径。图2.2展示了几条典型的可接受路径。

现在我们就能明白,为什么V0——无论是作为一个常数势,还是作为一个附加在非常数势上的常数项,如方程(2.11)中那样——没有任何影响。将它代入积分(2.14)时,它对作用量S的贡献只不过是−(t1 − t0)V0,这本身是一个常数,与路径x(t)无关。寻找使S最小的路径X(t)不会受到这一常数贡献的影响。因此,我们通常会直接略去V0。
2.3.2
一个简单的例子和一种简单的方法
最小作用量原理可以应用的一个简单例子是:势能V(x)是x的线性函数,即V(x)=kx,其中k为常数。我们将确定物体在时间区间−T ≤ t ≤ T内的运动,并假设初始位置为x(−T) = −X,最终位置为x(T) = X。这样选取初始和最终时刻及位置……
¹ 通常情况如此,但有时作用量是取驻值而非极小值。运动方程不受这一区别的影响。
最小作用量原理
33
x0
t0
t1
t
x1
x
图2.2 可能的路径x(t)。

位置的选择可能看起来有些刻意,但通过将时间t和位置x的原点选在初始和最终的时刻与位置的中点(正如这里所做的那样),总是可以简化计算。如此选择,利用了空间和时间的欧几里得对称性。
接下来,考虑从初始位置到最终位置的可能路径x(t)中一个非常有限的类别。假设x(t)的图像是一条经过给定端点的抛物线,如图2.3所示,那么x(t)就是一个形如At² + Bt + C的二次函数。这个表达式中有三个参数,但由于有两个端点约束条件,因此只有一个参数是自由的。为了满足这些约束条件,x(t)必须取如下形式

x(t) = X
T t + 1
2a(t² −T²) 。
(2.15)
X
T 是平均速度,它由端点的x和t值决定。a是自由参数,它等于(恒定的)加速度,因为 d²x
dt² = a。与a成正比的项在端点处为零,因此按要求有 x(−T) = −X 和 x(T) = X。
对于方程(2.15)所给出的路径,其速度为
dx
dt = X
T + at
(2.16)
因此动能为 K =
1
2m