10_Thermodynamics

10
热力学
10.1
引言
热力学统一了我们对物理世界的理解。它涉及我们称之为固体、液体和气体的整个物质范畴,因此在物理学、化学乃至生物科学中都具有重要意义。其巨大重要性可以从这一事实来判断:当热力学应用于电磁辐射时,触发了量子革命的序幕。热力学描述基本粒子的行为,它也在解释整个宇宙的演化中扮演着至关重要的角色,因为这在很大程度上是物质和辐射在膨胀时空中热的历史。相当令人惊讶的是,热力学对黑洞也有着重要的应用。

正如前几章所展示的,一个或两个物体的动力学很容易用数学来描述。但随着物体数量的增加,计算迅速变得难以处理。然而,当我们达到非常大的数量时,我们会到达另一个简化层次,再次有可能进行精确的统计或概率计算。这就是热力学的领域,也是物理学家常将这一分支学科称为统计力学的原因。每当一个物理系统由众多具有一定独立性、又有一定程度接触的子系统组成时,统计力学就适用了。经典的例子是由大量时不时碰撞的分子所组成的气体。

热力学始于我们对热和冷的感知。我们从日常经验中知道,这些性质与材料中容易观察到的变化相对应。例如,固态铁在熔炉中会从红色变为橙色。气体受热时会膨胀,而液体如水银和水也会膨胀。这些变化可用来标定温度标度,从而使我们能够构建测量温度的设备。传统上,温度是用水银温度计来测量的。如今,温度计通常依赖于与温度相关的材料电学性质的稳定变化。

当两个物体接触时,它们的温度会发生变化,并且经过足够长的时间后,它们会达到一个稳定的状态,称为平衡,此时它们的温度相等。我们总是观察到热量从温度较高的物体流向温度较低的物体,因此较热物体的温度降低,而较冷物体的温度升高。似乎不存在违反这一定律而达到平衡的路径。这引发了热量究竟是什么的问题。

物理世界. 尼古拉斯·曼顿(Nicholas Manton) 和 尼古拉斯·米(Nicholas Mee), 牛津大学出版社 (2017).
© 尼古拉斯·曼顿和尼古拉斯·米. DOI 10.1093/acprof:oso/9780198795933.001.0001

304
热力学
10.1.1
何为热?
18 世纪的自然哲学家们认为热是一种流体,他们称之为热质(caloric)。这一想法的核心是,热物体比冷物体含有更多的热质,当两者接触时,这种流体会从热物体转移到冷物体,从而升高冷物体的温度。热质被想象成一种守恒的流体,可以四处移动,但绝不会产生或消灭。显然,这种过于简单的理论无法解释一些关于热的很明显的事实。(即便如此,该理论的残余仍存留于现代世界中。我们谈论热流,有些人还会计算他们的卡路里。)1798 年,本杰明·汤普森(Benjamin Thompson),也被称为伦福德伯爵(Count Rumford),发表了他的产热实验结果。伦福德测量了由机械功引起的温度变化。他研究的对象之一是炮筒的镗孔加工,这需要多队马匹施加非常大的功。伦福德证明,这一过程中产生的热量可以用来将大量水烧开,而且只要镗孔持续进行,就似乎有取之不尽的热量供应。结论很清楚。热不可能是包含在炮筒金属内部的一种流体,相反,它是由马匹的劳动所驱动的镗孔设备通过摩擦传递给金属的。这表明了产生温度变化的热,与通过多种力的作用传递给材料的能量即机械功之间,存在着紧密联系。因此,很自然地可以假设热是能量的一种形式。

认识到功可以转化为热,对于将能量概念拓展到动能和势能这些力学概念之外至关重要。在诸如燃料燃烧之类的化学反应中,常常会释放出热量,所以能量变化在化学中扮演着重要角色。储存在各种物质中的化学能,可以通过测量化学反应中产生的热量来确定。这让我们兜了一圈又回到了原点,因为伦福德观察到的马匹所产生的能量来自它们的食物,而食物的化学能可以通过直接将其燃烧来测量。物理和化学的能量概念在此于生物过程的领域中统一起来,而且尽管总能量必须守恒,但热本身并不守恒。

理解热与机械能之间关系的需求,随着工业革命期间蒸汽动力发展而变得更加紧迫。在发动机中,热部分地转化为功。热力学正是从对蒸汽机锅炉和活塞中热与功相互作用的理论分析中发展出来的。事实上,热力学(thermodynamics)这个词由两部分构成——它关乎的是温度与动力学之间的关系,也就是热、力和运动之间的关系。

10.1.2
理想气体定律
1662 年,罗伯特·玻意耳(Robert Boyle)发表了他关于气体实验的记述。他证明,在固定温度 T 下,一定质量气体的压强 P 和体积 V 成反比,这一结果此后被称为玻意耳定律(Boyle’s law)。七十年后,数学家丹尼尔·伯努利(Daniel Bernouilli)指出,玻意耳定律可以通过假设气体由不断进行无规则运动的小粒子组成,这些粒子持续地彼此碰撞并与容器壁碰撞来加以解释。这一洞见在超过一个世纪的时间中无人跟进,而后它将成为气体动理学理论(kinetic theory of gases)的基石。

引言
305
在动理学理论中,理想气体被模型化为大量的点粒子,当它们彼此分离时不发生相互作用,而发生完全弹性碰撞。这一模型是对许多实际气体在其沸点以上温度下的有效描述。当气体的密度远低于其液相或固相时,该模型效果良好;而在高压下,当分子间力和分子的有限大小变得重要时,该模型便会失效。氦气提供了理想气体的最佳物理实现,但其他由非极性分子构成的气体,如干燥空气中的氮气和氧气,也是很好的例子。相比之下,水蒸气则不符合,因为水分子是极性的,彼此之间有强烈的相互作用。理想气体的物理性质之间满足如下简单关系,该关系是玻意耳(Boyle)定律的推广:
PV = A(T + T0) .
(10.1)
这被称为理想气体状态方程,实际气体在不同精度下近似遵守此式。该定律的一个重要特征是包含了附加常数温度 T0,其值约为 273°C(摄氏度)。这一常数由实验确定,并且发现对于所有能良好近似为理想气体的气体都是相同的。常数 A 与气体的质量成正比,我们稍后将对其数值进行更精确的说明。

实际上,当用汞温度计测量温度时,理想气体状态方程并不被严格满足。这是因为基于液体(如汞)热膨胀的温标并非完全令人满意。基于固体物理性质(如电阻率)的温标同样如此。液体和固体是由大量原子以复杂方式相互作用而形成的材料。它们的物理性质与温度之间的任何线性关系可能在某个温度范围内很好地近似成立,但期望这样的关系完全精确是不现实的。定义温度的一个更好方法是利用理想气体的性质,此时我们可以将方程(10.1)作为温度的定义。

加上常数 T0 的偏移意义重大。它使我们能够将 Tabs = T + T0 定义为绝对温度,并建立起一个从零向上的绝对温标。这就是开尔文温标,以威廉·汤姆孙(William Thomson)的名字命名,他后来被授予开尔文勋爵(Lord Kelvin)爵位。Tabs 以开尔文度为单位,记作 K。在开尔文温标下,水的冰点约为 273.15 K,沸点约为 373.15 K。反过来,−273.15°C 是温度的绝对零度。在该温度下,理想气体将不施加任何压强。换言之,一个有限的压强会将理想气体压缩到零体积。从现在开始,我们将改变符号,始终用 T 表示绝对温度。因此理想气体状态方程变为
PV = AT .
(10.2)
当然,理想气体是一种数学构造。在现实世界中,我们只能通过测量实际物质的性质来确定温度,但我们知道,在足够低的压强下,所有气体都表现得像理想气体。因此我们可以将温度定义如下:
T = 1/A lim_{P → 0} PV .
(10.3)
实验物理学家已经开发出精巧的制冷技术来降低实际物质样品的温度。随着温度越来越接近绝对零度,这一过程变得越来越困难,但

306
热力学
温度趋近绝对零度,且事实证明不可能达到负的绝对温度,甚至连绝对零度本身也无法达到。

10.1.3 热的微观起源
如果一个热的物体比冷的物体包含更多的能量,人们自然会问这些能量是以何种形式存在的。第一个给出令人信服答案的人是亨利·卡文迪许(Henry Cavendish),他认识到加热固体会加剧构成该固体的粒子的振动。卡文迪许于1810年去世,与他大部分的成果一样,他对这个问题的分析也一直未予发表。然而,到了19世纪中叶,许多研究者也开始持类似观点。麦克斯韦(Maxwell)运用动力学理论,对气体的情况进行了统计上的分析。在理想气体中,粒子间的相互作用被忽略,因此每个粒子的能量仅由其动能 $\frac{1}{2}mv^2$ 组成,其中 $m$ 是粒子的质量,$v$ 是其速率。

麦克斯韦计算出,在室温下,空气中氮分子的平均速率约为 500 m s⁻¹,这比客机的最高速度的两倍还多。显然,空气整体并非以如此高速运动。更确切地说,是内部的分子在快速地但方向随机地运动着,并且它们不断地相互碰撞。动力学理论的成就之一,就是能根据气体组分粒子的速率来预测声音在该气体中的传播速度。¹

10.1.4 冰茶
热量总是从热的物体流向冷的物体,而绝不会从冷的物体流向热的物体,但为什么会这样呢?我们毕生与周遭世界互动的经验告诉我们,如果把冰放入茶中,冰总是会使茶冷却,而绝不会使茶变热。然而,我们从冰箱中取出的冰块含有相当多的热量;例如,它们的温度远比西伯利亚的冬日要高得多。也许这些热量中的一部分可以从冰中释放出来并加入到茶中,从而使茶变热并使冰进一步冷却。虽然这样做会守恒能量,但我们知道这从未发生过。

这一过程的不可能性在19世纪中叶通过引入一个新的量——熵 $S$ 得到了解释。熵的变化等于热量的变化量 $\Delta E$ 除以温度 $T$:
$$\Delta S = \frac{\Delta E}{T}. \tag{10.4}$$
对于给定的热量,高温下的熵变小于低温下的熵变。如果用 $T_h$ 表示高温,$T_l$ 表示低温,那么
$$\frac{\Delta E}{T_h} < \frac{\Delta E}{T_l},$$
所以
$$\Delta S_h < \Delta S_l. \tag{10.5}$$
这意味着当一定量的热量 $\Delta E$ 从热的物体传递到冷的物体时,总熵会增加。如果热量从冷的物体传递到热的物体,那么熵就会减少。我们对这两个过程中的第一个非常熟悉,但第二个过程从未发生过。这一观察结果被概括为以下的表述:

熵与温度
307
在任何允许的过程中,宇宙的总熵必定增加,这一事实最初由19世纪的工程师萨迪·卡诺(Sadi Carnot)在分析蒸汽机时认识到。
通过与能量守恒的比较,可以突出这一概念的目的。如果状态A与状态B具有相同的能量,那么状态A可能演变为状态B,反之亦然。能量守恒定律允许任何一种情况。相比之下,熵只能增加而绝不能减少的定律决定了过程发生的方向。它限制了宇宙演化的可能方式,并以某种方式与时间的流逝及我们对时间方向的感知相关联。然而,熵在引入时,其起源是一个谜。熵总是增加的规则或许提供了一种简洁的方法来判断哪些过程被禁止,但它并没有告诉我们为什么这些过程不被观察到。它们只是被简单地宣布为非法。我们需要找出导致基本热力学量——熵和温度——的微观变量。
如今,熵被认为是热力学中最基本的量。麦克斯韦(Maxwell)证明,我们无需了解每个原子或分子运动的细节,就能从统计上理解热量的总体效应。随机运动的宏观效应由温度的概念捕捉,但热量是一种无序的能量形式,而熵是这种无序性最直接的度量。路德维希·玻尔兹曼(Ludwig Boltzmann)基于经典动力学,将熵解释为由分子的随机速度产生。
然而,经典动力学的精确度是有限的。正如我们所见,当人们试图详细理解分子和原子,或者液体和固体的性质时,就需要量子力学。熵的最简单定义实际上建立在量子态之上。这就是我们接下来要考虑的内容。

10.2 熵与温度
一个简单的热力学系统依赖于两个独立的宏观变量,一个是热学类的,一个是动力学类的。这样的一对变量是温度 ( T ) 和体积 ( V )。其他变量对还包括能量 ( E ) 和压强 ( P )。理论上,最方便的一对是 ( E ) 和 ( V )。此时,( E ) 被称为内能,常记为 ( U )。它与分子不可见的热运动相关,但不包括系统作为一个整体运动时的动能,如果系统恰好处于运动中的话。
热力学变量自然地分为两类,称为强度量和广延量。强度量是系统不依赖于系统大小或物质数量的物理性质。这类变量包括密度、温度和压强。另一方面,广延量是可加的性质,与系统中物质的数量成正比。这类变量包括能量、质量和体积。
我们假设系统由非常大量的分子 ( N ) 组成,处在一个体积为 ( V ) 的容器中。这些分子表现为一个受哈密顿量控制的量子系统,该哈密顿量可能包含描述分子间相互作用的项。每个分子的波函数必须在容器壁处为零,因此在容器外找到粒子的概率为零。这个边界条件意味着能级依赖于 ( V ),但它们在很大程度上并不依赖于容器的形状。
在本节的其余部分,我们将假设体积 ( V ) 是固定的,只考虑改变系统能量所带来的影响。在10.3节,我们将考虑同时改变能量和体积的影响。

308
热力学

单个分子的能级间隔随其能量增加而减小。对于由N个分子组成的系统也是如此,当总能量E增加时,系统的总能级密度以惊人的速度增长。

我们将Ω(E)定义为N粒子系统中能量介于E − ∆E与E之间的独立量子态数目。∆E取非常小的能量,小于实验中可能达到的能量分辨率,但其精确值并不十分重要。粗略地说,Ω就是系统在能量E处的状态数。更精确地有,
Ω(E) = g(E) ∆E , (10.6)
其中g(E)是态密度,即E附近单位能量间隔内的状态数。
在宏观物理系统中,Ω随能量的增长如此之快,以至于我们也可以将Ω(E)定义为能量低于E的量子态数。虽然这听起来颇为不同,但实际上几乎是一样的,因为能量显著低于E的状态数与那些非常接近E的状态数相比,可以忽略不计。这里可以类比高维空间中单位半径球体的表面积。该面积本质上与球体的体积相同,因为几乎所有的体积都非常靠近表面。

统计力学的一个基本假设是:除了能量之外,没有任何东西能显著区分系统的状态。因此,如果系统具有能量E且处于平衡态,那么系统处于该能量下任一可及状态的概率是均等的。于是,所有能量为E的状态均以相同的概率1/Ω(E)出现。这是统计力学的基石。对这一陈述的最好辩护是,它表达了我们对N个粒子微观状态中除总能量之外所有细节的完全无知。因此,除E之外,唯一重要的量就是状态数Ω(E)。这使我们得以把握热系统中无序的概念。

Ω和g都极其巨大;它们指数依赖于N。一个桌面上的系统通常具有超过N = 10²³个分子。任何形如exp cN的数(其中c是一个不大的系数,而N具有如此量级)几乎都难以想象。这种指数依赖性可以这样理解。任何热力学系统都可以视为由接触很弱的子系统构成。例如,一份气体样品可以看作沿一个共同界面接触的两个较小样品。对于相互作用微弱的两个系统,联合系统的量子态可表示为Ψ = Ψ₁Ψ₂,其中Ψ₁遍历系统1可及的所有状态,Ψ₂遍历系统2可及的所有状态。因此,联合系统的状态数为Ω = Ω₁Ω₂。这一乘法规则与Ω指数依赖于粒子数的事实相容,因为如果系统是同类型的,且Ω₁ = exp cN₁,Ω₂ = exp cN₂,其中N₁和N₂分别是两个系统中的粒子数,那么Ω = exp cN,其中N = N₁ + N₂是总粒子数。

我们定义系统的熵S为
S(E) = log Ω(E) , (10.7)
尽管它仍然巨大得难以置信,但已变得更容易处理,因为它大致与N成比例。熵是一个广延的、可加的函数。对式(10.6)取对数,我们²
² 注意,这是针对N粒子系统的,而非如8.2.1节中那样针对单个粒子。

熵与温度
309
我们会发现,实际上 (S(E) = \log \Omega(E) = \log g(E)),因为 (\log \Delta E) 是固定的且不与 (N) 成比例。根据熵的概念,基本假设是:处于能量 (E) 的每个量子态出现的概率为
(\frac{1}{\Omega(E)} = e^{-S(E)})。熵常被描述为无序度的量度。这里所说的无序度,是指系统可及的物理状态数 (\Omega(E)) 的对数,它反映了我们由于对系统微观细节缺乏精确了解而无法区分这些状态的能力。³
熵仅仅是对状态进行计数,它与温度有何关联?让我们考虑两个体积固定但类型未必相同的系统。首先假设这两个系统不接触,它们的能量分别为 (E_1) 和 (E_2),熵分别为 (S_1(E_1)) 和 (S_2(E_2))。组合系统可及的总状态数是两个系统各自可及状态数的乘积,即 (\Omega = \Omega_1 \Omega_2 = e^{S_1(E_1)} e^{S_2(E_2)})。取对数后,总熵为
[
S = S_1(E_1) + S_2(E_2) .
\tag{10.8}
]
接下来,使两个系统足够靠近以形成热接触,允许能量在它们之间流动,但不至于近到交换粒子的程度。总能量 (E = E_1 + E_2) 守恒,因此我们可以将 (E_2) 写为 (E - E_1),从而得到
[
S = S_1(E_1) + S_2(E - E_1) .
\tag{10.9}
]
热接触允许 (E_1) 发生变化。
现在,函数 (\Omega = \Omega_1 \Omega_2) 在某个特定的 (E_1) 值处具有一个极高且极窄的极大值。这是因为 (\Omega) 的巨大指数发生微小的分数变化,就会对 (\Omega) 本身产生巨大影响。因此,对于给定的总能量 (E),组合系统中绝大多数的状态都呈现出以此特定 (E_1) 值进行能量分配的特征。当能量在系统间流动之后,组合系统极有可能占据这些最概然状态之一。在初始的能量流动之后,(E_1) 将不再变化,我们就说此时组合系统已达到平衡。
(S) 在此特定 (E_1) 处同样具有一个极大值,尽管相对于 (\Omega) 而言不那么显著,也不那么尖锐。为了从热力学角度表征这个极大值,我们对 (E_1) 求导。极大值出现在
[
\frac{dS}{dE_1} = \frac{dS_1}{dE_1} + \frac{dS_2}{dE_2} \frac{dE_2}{dE_1} = 0 .
\tag{10.10}
]
由于 (E = E_1 + E_2) 是常数,(\frac{dE_2}{dE_1} = -1),因此平衡条件为
[
\frac{dS_1}{dE_1} = \frac{dS_2}{dE_2} .
\tag{10.11}
]
这为温度的热力学定义提供了动机。对于任何其熵作为能量函数(在给定体积 (V) 下)为 (S(E)) 的系统,定义该系统的温度 (T) 为
[
\frac{1}{T} = \frac{dS}{dE} .
\tag{10.12}
]
这个温度的定义甚至比基于理想气体状态方程的定义更为基本。一个能量为 (E) 的系统的热力学温度 (T),简单来说就是

³ 一个处于能量 (E) 的纯量子态本身并不会演化成无序态,但如果该系统与一个外部环境(即热浴)存在弱耦合,那么随着时间的推移,我们可以预期它会变得无序。

310
热力学
是系统态密度决定的S(E)图线斜率的倒数。T是E的函数。所有实际物理系统都具有S随E增加而增大的性质,因此T恒为正。无序度随能量增加。此外,斜率dS/dE随E递减,故温度随能量升高。方程(10.11)反映了两系统在平衡态具有相同温度的事实。这是温度最基本的性质,被称为热力学第零定律(zeroth law of thermodynamics)。
通过方程(10.12)定义的热力学温度T或许显得过于形式化,但它满足了运用温度和熵的现象学概念所发现的关键性质。从此以后我们将统一使用这一温度概念。
考察趋向平衡过程中能量流动的方向颇具深意。将方程(10.8)对时间求导,并注意到dE₂/dt = -dE₁/dt,可得
dS/dt = (dS₁/dE₁)(dE₁/dt) + (dS₂/dE₂)(dE₂/dt)
= (1/T₁ - 1/T₂) dE₁/dt. (10.13)
然而我们已经论证过,在两独立系统合并为单一系统的任何过程中,能量流动会驱动S趋向最大值,因此熵随时间递增:
dS/dt ≥ 0. (10.14)
因此当T₂ > T₁时dE₁/dt为正,此时E₁增加;若T₁ > T₂则dE₁/dt为负,E₁减少。两种情况下能量都从高温系统流向低温系统。这一表述及更普遍的方程(10.14)即热力学第二定律(second law of thermodynamics)。

热力学温标与理想气体温标的一致性并非显而易见。两者之间可能存在相当复杂的函数关系。所幸事实并非如此——正如我们将在第10.6节展示的,运用熵和温度的定义,通过量子力学第一性原理即可推导出理想气体的压强与熵。我们将发现理想气体温度实际上等同于热力学温度。
S无量纲,因此T具有能量量纲。这本是自然之事,但出于历史原因,实用温度以开尔文(K)计量,需借助转换因子k_B(即玻尔兹曼常数(Boltzmann’s constant))将开尔文温度与焦耳能量相关联。我们将取k_B=1,从而直接以能量单位作为温度单位。在原子物理学中,电子伏特eV是实用的能量单位,1 eV约对应10⁴ K。
使用无穷小量处理更为便利,可将方程(10.12)写作
dE = T dS. (10.15)
当系统能量变化与体积变化完全无关时,这部分能量即被视为热量。因此T dS就是无穷小热量。向系统添加热量时,内能增加导致温度上升。使系统产生单位温度变化(体积V固定)所需的热量称为定容热容量,记作C_V。更精确地说,热容量C_V = dE/dT,由方程(10.15)可得关系式
C_V = T dS/dT. (10.16)

热力学第一定律
311
可以通过例如使用电阻电线圈供热来精确测定加入系统的热量。温度的变化也容易确定,因此CV易于测量。利用方程(10.16)并积分,即可计算熵S,公式为
S(T) −S( eT) =
Z T
e
T
CV
T dT ,
(10.17)
其中eT是某个固定的温度。与熵相关的无序度无法直接测量,因此该公式提供了计算系统熵的实用方法。然而,它留下了未定的可加常数S( eT)。不过,根据量子力学可知,任何量子系统都有唯一的最小能量基态。在绝对零度时,这是系统唯一可及的状态,因此Ω= 1,熵S(0) = log Ω= 0,这就固定了常数。这个关于任何系统在绝对零度时熵趋于零的命题被称为热力学第三定律。在积分(10.17)中取eT = 0,得到
S(T) =
Z T
0
CV
T dT ,
(10.18)
这样便可以通过热容测量来实验确定绝对熵⁴,尽管在实践中可能很难测量或估计直至绝对零度的CV。

10.3 热力学第一定律

热力学第一定律是关于热力学中当系统的能量E和体积V都可变时能量与熵的精确陈述。能量E处的状态数为Ω(E, V ),熵为
S(E, V ) = log Ω(E, V ) 。
(10.19)
温度现在通过偏导数定义,
∂S
∂E

V
= 1
T ,
(10.20)
这里我们采用了标准记号,竖线下标表示求偏导数时固定不变的变量。(在此情形中体积V是固定的。)由于S总是随E增加,可以将E视为两个独立变量S和V的函数。

当气体(或液体)体积增大时,会对周围介质做功,结果气体的部分内能会损失。假设外部压力略小于内部压力,因此膨胀是稳定而非爆炸性的;这样系统在膨胀时保持平衡。进一步假设系统膨胀时没有热量进入或离开。这样的膨胀称为绝热过程,而

⁴还有来自温度T以下相变时潜热的额外贡献。

312
热力学

活塞初始位置
活塞最终位置
面积 A
∆x
∆V = A∆x
图 10.1 活塞。
这种膨胀的一个好例子是,一团空气被风卷起并越过山顶。气压随高度略有下降,因此这团空气膨胀、损失能量并冷却,但在此过程中,它基本上不与周围空气发生热量传递。

压强 P 是气体施加在容器壁或周围气体区域(即使没有分隔壁时)上单位面积的力。气体膨胀时所做的无穷小功为 P dV,其中 dV 是体积的无穷小增量。这是因为 dV 等于面积乘以移动的距离,如图 10.1 所示,所以 P dV 等于压强乘以面积再乘以距离。这又等于力乘以距离,即力所做的功。

在一个不涉及热量的过程中,所做的功必定来自气体的内能 E,因此
dE = −P dV . (10.21)

一个一般的热力学过程同时涉及热量和功,因此系统能量变化的普遍公式为
dE = T dS − P dV . (10.22)
这就是热力学第一定律。

热力学第一定律结合了两个陈述:在 V 固定时,T 是 E 关于 S 的导数;在 S 固定时,−P 是 E 关于 V 的导数。更确切地说,T 和 P 是以下偏导数:
T = ∂E/∂S |_V , P = −∂E/∂V |_S , (10.23)
并且两者同时是 S 和 V 的函数。两个通过薄的可移动隔板接触的系统,只有当它们具有相同的温度和压强时才处于平衡。

方程 (10.23) 有一个有趣的数学推论。混合二阶偏导数总是对称的,特别地,
∂²E/∂V∂S = ∂²E/∂S∂V 。因此,
∂T/∂V |_S = −∂P/∂S |_V . (10.24)

热力学第一定律
313

能量
图 10.2 能级的绝热变化。
这就是麦克斯韦关系(Maxwell relation)的一个例子。

我们将绝热变化定义为不涉及热量的变化。这种变化满足 dS = 0,因此 S 是常数。然而,根据我们的定义,S 是系统可用状态数的对数。这些思想是否一致?答案是肯定的。当气体膨胀时,体积增加,量子能级发生变化。通常,随着体积增加,能级会降低,但量子能级的数量不变,因此 S 保持恒定。能级的流动如图 10.2 所示。随着气体膨胀,初始能量附近众多可用的能级一起移动,变成靠近最终较低能量的相同数量的可用能级。如果系统占据其中一个能级,那么,随着能级的变化,系统将连续地跟随这个能级向下移动,因为在不加热以激发系统的情况下,量子系统在平稳缓慢的变化中不会发生跳跃。因此,熵不会改变。

10.3.1 新变量
我们强调过,一个简单的热力学系统由两个独立变量控制,一个是热学变量,一个是动力学变量。在热力学第一定律 (10.22) 中,独立变量被取为 S 和 V,但还有其他多种选择。一种方便的选择是,将容易测量的温度 T 和体积 V 作为独立变量。如方程 (10.20) 所示,T 与 S 的导数有关,因此这种变量变换需要小心处理。标准步骤是定义一个新的能量函数 F,即亥姆霍兹自由能(Helmholtz free energy,简称自由能),以赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)的名字命名。自由能是
F = E − TS (10.25)
它是 S 和 V 的函数,但可以通过将 E 和 S 用 T 和 V 表示,将其转换为 T 和 V 的函数。F 的无穷小变化为
dF = dE − T dS − S dT
= T dS − P dV − T dS − S dT
= −S dT − P dV , (10.26)

314
热力学
这里我们使用了莱布尼茨法则 d(TS) = T dS + S dT,然后利用热力学第一定律(10.22)替换了 dE。最终的表达式在形式上与第一定律相似,只是用 F 代替了 E。注意到在这个表达式中,只出现了新自变量 dT 和 dV 的无穷小变化。因此,将自由能视为函数 F(T, V ),我们看到
S = −∂F
∂T

V
,
P = −∂F
∂V

T
,
(10.27)
并且由此得出一个新的麦克斯韦关系 ∂S
∂V

T = ∂P
∂T

V。
P dV 是系统膨胀时所做的功。这等于系统在 dT = 0 时膨胀所减少的自由能,因此自由能是在温度保持恒定情况下可用于做功的能量。当然,在系统膨胀时要保持其温度不变,必须供给一些热量。自由能 F 是一个有用的概念,因为正如我们将看到的,它可以通过一种与将 TS 从 E 中减去并更换变量截然不同的方式计算出来。
另一个有用的自变量选择是 S 和 P。同样,定义一个修改过的能量函数是方便的。这就是焓 H,定义为
H = E + PV .
(10.28)
H 的一个无穷小变化是
dH

T dS −P dV + P dV + V dP

T dS + V dP ,
(10.29)
所以当 H 被视为 S 和 P 的函数时,有
T = ∂H
∂S

P
,
V = ∂H
∂P

S
.
(10.30)
在压力恒定的情况下,焓 H 是最有用的热力学能量函数。例如,它适用于处于正常大气压影响下的气体和液体。因此,H 对于化学家特别有意义,因为无论是在实验室还是在工业中,大多数化学反应都是在常压系统中进行的。
T dS 一如既往是热量,因此在恒定压力下,将系统温度升高一个单位所需的热量为
CP = T ∂S
∂T

P
= ∂H
∂T

P
.
(10.31)
CP 是恒压热容。
最后一个修改的能量函数是吉布斯自由能(Gibbs free energy) G,以乔赛亚·威拉德·吉布斯(Josiah Willard Gibbs)命名。(有时也称为吉布斯势,用 Φ 表示)。它结合了

子系统——吉布斯分布
315
从 E 到 F 以及从 E 到 H 的变换。吉布斯自由能定义为
G = E −TS + PV .
(10.32)
利用热力学第一定律和莱布尼茨法则,可求得
dG = −S dT + V dP .
(10.33)
因此 G 很自然地被视为强度变量 T 和 P 的函数,这两个变量都不依赖于系统的大小,并且
S = −∂G
∂T

P
,
V = ∂G
∂P

T
.
(10.34)
G 本身(如同 E、F 和 H)是广延量,意味着它与系统中的分子数 N 成正比。因此 G 可以表示为
G(T, P, N) = N eG(T, P)
(10.35)
其中 eG(T, P) 是每个分子的吉布斯自由能。^5
我们稍后将看到,eG 正是该热力学系统的化学势。每当粒子数可变时,例如在化学反应以及相变分析中,这是一个很有用的概念。

10.4 子系统——吉布斯分布
到目前为止,我们考虑的是一个具有给定能量 E 的宏观系统。熵 S 是该能量下可用量子态数的对数,并且假设在平衡时每个态被占据的概率相等。当系统与另一系统热接触时,能量可以在两系统之间传递,但一旦复合系统达到新的平衡且温度相等,能量的进一步涨落就可忽略不计。

现在我们来考虑初始系统的一个子系统,并假设整个系统已达到平衡。如果子系统是宏观的——例如,初始系统的 1%——那么该子系统将具有确定的能量,涨落可忽略不计。事实上,它的能量和熵将是总量的 1%,且子系统的温度与整个系统的温度相同。如果子系统是微观的,情况会更有趣。

微观子系统的一个例子是气体中的单个原子或分子,或是气体中的杂质粒子。由于子系统与系统的其余部分接触,它会通过与其余部分的碰撞来交换能量,因此它的能量会变化。在任何特定时刻,我们对子系统状态的不完全了解意味着,我们能期望的最佳描述是子系统各态被占据的概率。当系统处于平衡时,即使子系统自身的能量可以涨落,这个概率分布也不会改变。

^5 对 E 来说,类似关系式会是更复杂的表达式,E = N e E(S/N, V/N)。

316
热力学
让我们用一个整数 n 来标记子系统的独立量子态,并用 En 表示第 n 个态的能量。其中一些态在能量上可能是简并的。通常 n 从 0 取到 ∞,不过对于某些自旋系统,范围是有限的。
现在我们要确定子系统处于第 n 个态的概率。这个概率取决于 En 以及系统其余部分的温度 T。假设整个系统是孤立的,并且具有能量 E(0)。根据能量守恒,E(0) 是常数。如果子系统具有能量 En,那么系统其余部分的能量就是 E(0) − En。En 仅是 E(0) 的微观份额,但由于宏观系统的状态数量如此庞大,并且对能量极为敏感,我们必须把这个能量移动考虑进去。系统其余部分可以被视为一个热浴 (heat bath),当子系统具有能量 En 时,它的熵为 S(E(0) − En)。因为 En 很小,我们可以使用一阶泰勒展开 (Taylor expansion):
S(E(0) − En) ≃ S(E(0)) − En dS/dE (10.36)
= S(E(0)) − En/T , (10.37)
其中热浴的温度 T 是在能量 E(0) 处求值的。因此,热浴可用的状态数目为
e^{S(E(0)−En)} = e^{S(E(0))} e^{-En/T}. (10.38)
既然子系统处于一个确定的状态(第 n 个态),这也正是整个系统的状态数目。
现在再回到整个系统,但不固定子系统的状态。整个系统所有可用的状态都是等概率的,而 e^{S(E(0))} 是一个常数,所以子系统处于第 n 个态的相对概率就简单地正比于子系统处于这个态时可用的状态数目。这个概率是
P(En) ∝ e^{-En/T}, (10.39)
这被称为吉布斯分布 (Gibbs distribution),不过路德维希·玻尔兹曼 (Ludwig Boltzmann) 在一个更受限的背景下也知道了这个分布。
比例常数必须确定,以使总概率为 1。因此,我们定义一个量 Z,称为吉布斯和 (Gibbs sum) 或配分函数 (partition function):
Z = ∑_{n=0}^{∞} e^{-En/T}. (10.40)
当子系统是一个温度为 T 的系统的一部分时,它处于能量为 En 的特定状态的正确定归一化概率就是
P(En) = (1/Z) e^{-En/T}. (10.41)
配分函数是一个非常有用的量,值得重视。
需要着重指出,尽管子系统必须与热浴有热接触,但这种接触应当足够弱,以便子系统的能级 En 不致受到显著扰动。

子系统——吉布斯分布

不受接触的影响。换句话说,热浴的唯一作用是确定温度 $T$。如果子系统耦合更强,例如固体中的单个原子,那么它就不能被孤立出来单独考虑。

我们可以对吉布斯分布做一致性检验。一个宏观子系统的行为应该与它被孤立并自身构成一个完整系统时的行为相同。设其能量为 $E$。这样一个宏观子系统具有配分函数,其中求和 (10.40) 可以用积分代替:
$$
Z = \int_{E_{\text{min}}}^{\infty} g(E) e^{-E/T} dE .
\tag{10.42}
$$
$g(E)$ 是态密度,这对宏观子系统是有意义的。将 $g$ 用子系统的熵来表示,可得:
$$
Z = \int_{E_{\text{min}}}^{\infty} e^{S(E) - E/T} dE .
\tag{10.43}
$$
指数部分对 $E$ 有一个极大值,满足
$$
\frac{dS(E)}{dE} - \frac{1}{T} = 0 ,
\tag{10.44}
$$
这便将 $E$ 与温度 $T$ 按我们对任何热力学系统所期望的方式联系了起来。$Z$ 本身完全由该极大值紧邻区域对积分的贡献所主导,因此 $Z$ 可近似为
$$
Z = e^{S(E) - E/T} ,
\tag{10.45}
$$
其中 $S$、$E$ 和 $T$ 由方程 (10.44) 关联。取对数得到
$$
-T \log Z = E - T S(E) ,
\tag{10.46}
$$
而右边正是温度为 $T$ 的宏观系统自由能 $F$ 的定义,所以
$$
F = -T \log Z ,
\tag{10.47}
$$
或等价地,$Z = e^{-F/T}$。因此,与温度为 $T$ 的热浴接触的宏观系统的归一化吉布斯分布 (10.41) 为
$$
P(E) = e^{(F - E)/T} .
\tag{10.48}
$$
这便是系统处于能量为 $E$ 的某个特定微观状态的概率。

事实上,压倒性的概率是发现系统的能量等于热力学平衡值 $E$。对于这个能量,有 $F = E - TS$。因此概率 (10.48) 变为
$$
P(E) = e^{(E - TS - E)/T} = e^{-S} .
\tag{10.49}
$$
然而,由于能量为 $E$ 的状态有 $e^{S(E)}$ 个,某个特定状态被占据的概率确实应为 $e^{-S(E)}$。这样就完成了一致性检验。

对一个与热浴接触的宏观系统,偏离热力学平衡能量 (E) 的涨落是可能发生的,但显著的涨落概率可以忽略。在较低能量时,涨落受熵因子的抑制;在较高能量时则受能量因子的抑制。通过对这些能量涨落进行更精确的分析,可以估算其大小,结果发现它们取决于系统的热容。结论是:热力学温度为 (T) 的宏观系统,无论是否与热浴接触,都具有相同的热力学性质。

方程 (10.47) 表明了配分函数 (Z = \sum_n e^{-E_n/T}) 的用处。它提供了一条最直接的途径,从了解宏观系统的量子态出发,得到该系统的热力学性质。自由能 (F = -T \log Z) 是 (T) 和 (V) 的函数,因为能量 (E_n) 依赖于体积 (V)。根据方程 (10.27),(-F) 对 (V) 的导数就是压强 (P),而用 (T) 和 (V) 表示 (P) 的表达式称为状态方程。(-F) 对 (T) 的导数是熵 (S),再通过方程 (10.16),(S) 对 (T) 的导数决定了热容 (C_V)。对于一个由 (N) 个近似无相互作用的子系统组成的系统,例如 (N) 个原子或分子组成的稀薄气体,配分函数是相当容易计算的,我们将在第 10.6 节中看到这一点。

10.5 麦克斯韦速度分布

麦克斯韦(Maxwell)在推导出温度为 (T) 的理想气体中粒子速度的概率分布时,展示了统计力学的重要性。沿用麦克斯韦的思路,我们可以认为宏观容器中的分子在很好的近似下表现为经典行为。在这个极限下,量子力学预言的离散动量变为准连续的,通常的经典动能公式对每个分子都有效:
[
\varepsilon = \frac{1}{2m}(p_x^2 + p_y^2 + p_z^2) = \frac{1}{2}m(v_x^2 + v_y^2 + v_z^2) \tag{10.50}
]
其中 (\mathbf{v} = (v_x, v_y, v_z)) 是分子的速度,(m) 是其质量。势能取决于容器中分子间的相对位置,但这部分可以分离出来。如果分子间力是吸引力,分子倾向于轻微聚集在一起;如果是排斥力,分子则倾向于均匀散开,但分子的速度不受其空间排列的影响,最重要的是,每个分子的速度可以独立处理。

因此,每个分子速度的概率密度为
[
P(v_x, v_y, v_z) \propto e^{-\frac{m(v_x^2+v_y^2+v_z^2)}{2T}}. \tag{10.51}
]
这就是麦克斯韦分布,它是吉布斯(Gibbs)分布的特殊情况,适用于可用状态正好对应每个分子可能的动能范围的情形。正确归一化的概率密度为
[
P(v_x, v_y, v_z) = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} e^{-\frac{m(v_x^2+v_y^2+v_z^2)}{2T}}, \tag{10.52}
]
满足 (I = \int P(v_x, v_y, v_z) , dv_x dv_y dv_z = 1),这由高斯积分 (1.64) (\int_{-\infty}^{\infty} e^{-au^2} du = \left( \frac{\pi}{a} \right)^{\frac{1}{2}}) 可得。

麦克斯韦速度分布
319
0
0
3
2
5
2
7
2
T
CV
Trot
Tvib
图10.3 在低温下,双原子气体每分子的热容 (C_V) 等于 (\frac{3}{2})。在较高温度下,分子可能被激发到转动状态,热容相应增加。在更高温度下,分子还会被激发到振动状态。

运动方向均等可能,因此分子速率 (v) 的分布比速度分布更有意义。由 (v^2 = v_x^2 + v_y^2 + v_z^2),该概率分布为
[
P(v) = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} 4\pi v^2 e^{-\frac{mv^2}{2T}},
\tag{10.53}
]
平均速率和分布的方差很容易求出。特别是,每个分子的平均动能为
[
\langle K \rangle = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} \int_0^\infty \left( \frac{1}{2}mv^2 \right) 4\pi v^2 e^{-\frac{mv^2}{2T}} dv = \frac{3}{2}T,
\tag{10.54}
]
此结果由高斯积分 (1.66) 得出。

气体中 (N) 个分子的总动能为 (N\langle K \rangle = \frac{3}{2}NT),如果气体由无相互作用、无结构的原子组成,这就是总能量 (E)。此时热容为
[
C_V = \frac{dE}{dT} = \frac{3}{2}N.
\tag{10.55}
]
测量热容是直接的,这为确定气体样品中原子数目提供了一种方法。历史上,这是建立物质原子图像的重要一步。

对于大多数实际气体,总能量还包括另外两种贡献。首先,如果气体不够稀薄,分子间的距离与分子间力的作用范围相当,……

320
热力学
分子间势能,大致为分子尺寸的量级,则必须计入势能。其次,分子的内部结构也可能有贡献,此时就会有与分子转动和振动运动相关的能量。(如果这些能量中的任何一种非常大,分子就会分解为原子,但这只发生在极高的温度下。)必须像方程(10.40)那样计算吉布斯求和,以求出每个分子的配分函数,而这要求对分子的量子态有相当多的了解。然而,在低温下,无结构分子或原子的理想图像成立。随着温度的升高,修正随之而来,首先是最低能量激发态的贡献。通常,分子的转动态能量最低,振动态能量较高,而原子内的电子激发能量更高。随着这些不同的量子态被占据,分子气体的热容随温度升高而增加,如图10.3所示。

10.6 理想气体——状态方程与熵
我们可以利用在8.2.1节提到的相空间中的态密度,计算理想气体的更多性质。单个无结构分子的配分函数z为
z =
∫ e^{-(p_x^2 + p_y^2 + p_z^2)/(2mT)} (d^3x d^3p)/(2πℏ)^3 。
(10.56)
在经典极限下,这个对分子位置和动量坐标的积分,每个空间维度带有一个归一化因子2πℏ,替代了对量子态的求和。指数部分是当只有动能ε有贡献时−ε/T的经典表达式。空间积分给出体积V,动量积分是高斯型的。计算这些积分得到
z = V/(2πℏ)^3 (2πmT)^{3/2} = V ( mT/(2πℏ^2) )^{3/2} 。
(10.57)
对于N个分子,总配分函数为
Z = (1/N!) z^N 。
(10.58)
因子z^N正确地计入了总能量,因为各个分子能量之和为E = ε_1 + ε_2 + ··· + ε_N,而积分遍历所有分子的位置和动量。组合因子N!补偿了对物理上不可区分的态的重复计数。根据量子力学,全同粒子无法被标记,因此分子的排列没有物理效应,如8.7节所讨论的。(这对费米子和玻色子都成立。)

我们感兴趣的是自由能F = −T log Z,而不是Z本身。代入方程(10.58),我们得到
F = −T log( (1/N!) z^N ) = −T( N log z − log N! ) 。
(10.59)

理想气体——状态方程与熵
321
现在,著名的关于 N! 的斯特林(Stirling)近似派上了用场:
N! ≃(2πN)
1
2 N Ne−N ,
(10.60)
而对于统计力学来说,一个足够好的近似是
log N! ≃N log N −N .
(10.61)
(下一项正比于 log N,当 N 的数量级为 10²³ 时可以忽略。)利用这个近似并提取出共同的因子 N,得到
F = −NT(log z + 1 −log N) = −NT log
ze
N

,
(10.62)
其中 e = 2.718 … 是欧拉(Euler)常数,即自然对数的底。代入方程 (10.57) 中的 z,我们发现在体积 V、温度 T 下,由 N 个分子组成的理想气体的自由能为
F = −NT log

V e
N
 mT
2π¯h2
 3
2 !
.
(10.63)
将其分为依赖于分子数密度 N/V 的项和仅依赖于温度的项,得到
F = −NT log
V e
N

−3
2NT log
 mT
2π¯h2

.
(10.64)
自由能是广延量,因为它正比于 N,并且 F/N 仅依赖于强度量 N/V 和 T。如果没有 N! 因子的贡献,情况就不会如此。
现在我们可以计算压强 P 和熵 S。压强为
P = −∂F
∂V

T
= NT
V
.
(10.65)
这就是理想气体的状态方程。它就是理想气体定律 PV = NT,因此方程 (10.2) 中的常数 A 就简单地等于分子数 N。(如果包含玻尔兹曼(Boltzmann)常数,或者将分子数替换为气体的摩尔数,其形式会略有不同。)我们从第一性原理推导出了这个方程,这意味着我们相当抽象的温度定义 (10.12) 与方程 (10.3) 中定义的理想气体温标是一致的。
类似地,熵为
S = −∂F
∂T

V
= N log
V e
N


  • 3
    2N log
     mT
    2π¯h2
    
  • 3
    2N .
    (10.66)
    同样,这是一个广延量,但对温度和密度有着相当复杂的依赖关系。这个 S 的表达式仅在高温下有效,因为它依赖于……

322
热力学
这是对配分函数的经典估计。它不满足热力学第三定律:当 (T = 0) 时 (S = 0)。热容的表达式更简单,为
[
C_V = T \frac{\partial S}{\partial T}\bigg|_V = \frac{3}{2}N , \tag{10.67}
]
正如我们之前所得到的。其他有用的量,如能量、焓以及定压热容 (C_P),都可以轻松计算。

如果分子或原子具有内部结构,但气体仍保持稀薄,那么自由能的第二项对温度的依赖关系会有所不同,因为它源自方程 (10.56) 中的指数,其中会包含额外的项,因此气体的熵和热容会不同。然而,取决于体积的第一项保持不变,因而状态方程仍为 (PV = NT)。两个处于力学平衡和热平衡(即压强和温度相同)且体积相等的理想气体样品,因此含有相同数量的分子,正如阿梅代奥·阿伏伽德罗 (Amedeo Avogadro) 在 19 世纪初首先认识到的那样。通过称量这两个气体样品,可以求出它们分子量的比值。这使得化学家能够确定诸如 O₂、H₂O 和 CO₂ 等简单分子的原子结构。

10.7 非理想气体
分子间相互作用通常比原子间相互作用更为复杂,因此我们现在考虑单原子气体,例如稀有气体,其分子就是单个原子。即使单原子气体也会以多种方式偏离理想行为。随着密度的增加,两个原子靠得很近的几率上升,相互作用势能⁶ 的影响变得更大。在高密度和低温下,原子是费米子还是玻色子也变得重要起来。之前我们考虑了能量为 (\varepsilon) 的单原子态,并假设气体的 (N) 个原子独立地占据这些态。这在高温和低密度下是合理的,因为某个特定态被单个原子占据的概率远小于 1。在这种情况下,费米子和玻色子的行为相似。然而,在低温下,吉布斯分布告诉我们,低能态被占据的概率远大于高能态。最多只有一个费米子原子可以占据一个单原子态,而任意数量的玻色子原子可以占据这样一个态,因此现在组合因子不再是简单的常数 (N!)。无论哪种情况,原子之间都存在一种有效的相互作用,因此吉布斯分布被修改,这影响了气体的热力学性质。

对于接近理想的气体,有一种系统的方法来写状态方程,即按数密度 (N/V) 进行展开。这被称为维里展开 (virial expansion),其形式为
[
P = \frac{NT}{V} \left( 1 + \frac{N B(T)}{V} + \frac{N^2 C(T)}{V^2} + \cdots \right) . \tag{10.68}
]
首项当然给出了理想气体定律。(B(T)) 和 (C(T)) 分别称为第二和第三维里系数 (virial coefficients)。对于经典气体,(B(T)) 可以计算为一个积分,涉及……

⁶ 稀有气体原子之间存在非常弱的范德瓦尔斯力,这是由于原子中电子场的涨落产生的电偶极子所致。

化学势
323
只依赖于一对原子的相互作用势,但通常它对温度的依赖关系并不特别简单。最简单的非理想气体可以模拟为硬球原子气体,每个原子直径为l,因此原子中心不能彼此靠近到小于l的距离。这代表了原子之间的短程硬排斥。由于原子自身占据空间导致体积减小,其压强大于理想气体。对于硬球气体,人们发现第二维里系数与温度无关,等于(\frac{2}{3}\pi l^3)。即使对于硬球气体,(C(T))也更难计算,因为它与三原子相互作用有关。
对于费米子或玻色子气体,即使没有相互作用势因而原子之间没有吸引力或排斥力,维里系数也不为零。人们发现
[
B(T) = \pm \frac{1}{2g}\left(\frac{\pi \hbar^2}{mT}\right)^{\frac{3}{2}} .
]
(10.69)
这里上面的符号对应费米子,下面的符号对应玻色子。g是原子独立自旋态的数目,对于自旋为0的玻色子为1,对于自旋为(\frac{1}{2})的费米子为2。由于泡利(Pauli)不相容原理,费米子的压强高于经典理想气体的压强。对于玻色子则较低。
我们一直在讨论的效应发生在中等密度下,但在高密度下,真实气体通常会液化,至少在足够低的温度下是如此。这种不连续行为是一种相变,理论上更难理解。我们将在10.13节中讨论一些有关相变的内容。

10.8 化学势
一个系统的化学势(\mu),在10.3.1节末尾提到过,是一个与系统粒子数N的变化相关的强度量。在许多情况下,化学势起着重要作用。这些包括化学反应,其中各种化学物质的分子数目可能改变。当考虑气体系统的子体积时,化学势也很有用,因为粒子可以进入或离开。第三个例子是相变,其中粒子从一相转变为另一相。
(\mu)与N的关系颇为类似于T与E的关系。回想一下,孤立系统具有固定的能量E,而温度T是通过熵间接定义的。然而,我们也可以考虑一个与热浴接触而保持固定温度T的系统,此时能量E会调整到给定的温度。类似地,孤立系统通常具有固定的粒子数N,但往往很有用的是,考虑系统通过多孔膜与一个具有固定化学势(\mu)的粒子浴接触,然后N会调整,直到达到这个给定的(\mu)值。
正如我们曾证明两个热接触的系统在温度相等时达到平衡且熵最大一样,可以证明两个自由交换粒子的系统将达到化学势相等的平衡态。现在让我们更精确地定义化学势。

324
热力学
如果我们允许宏观系统的粒子数变化,那么能量是熵、体积和粒子数的函数,E(S, V, N)。于是化学势为
µ = (∂E/∂N){S,V},
(10.70)
这是一个熵 S 和体积 V 均固定的偏导数,并且第一定律推广为
dE = T dS − P dV + µ dN.
(10.71)
项 µ dN 必须包含在所有能量函数中,包括吉布斯自由能 G,因此
dG = −S dT + V dP + µ dN
(10.72)
且 µ = (∂G/∂N)
{T,P}。然而,回忆 G(T, P, N) = N \tilde{G}(T, P),其中 \tilde{G}(T, P) 是每粒子的吉布斯自由能,因此 (∂G/∂N)_{T,P} = \tilde{G}(T, P)。所以系统的化学势并非一个全新的量,而是等于每粒子的吉布斯自由能。总的吉布斯自由能为 G = µN。

现在考虑一个系统(不一定是宏观的)与一个远大于它的热与粒子库相接触,组合系统的总能量和总粒子数具有恒定值 E^{(0)} 和 N^{(0)}。我们关心的是发现该系统处于某个特定量子态的概率,该量子态下系统具有能量 E 并包含 N 个粒子。对于这样一个微观态,库将具有能量 E^{(0)} − E 和粒子数 N^{(0)} − N。与吉布斯分布的推导类似,我们可以对库的熵 S 做线性近似,
S(E^{(0)} − E, N^{(0)} − N) = S(E^{(0)}, N^{(0)}) − E/T + µN/T,
(10.73)
这里我们假设体积固定,并使用了第一定律的形式 dS = dE/T − µ dN/T。因此,组合系统可及的态数为
e^{S(E^{(0)}−E, N^{(0)}−N)} = e^{S(E^{(0)}, N^{(0)})} e^{(\mu N − E)/T},
(10.74)
而系统占据该微观态的概率为
P(E, N) = \frac{1}{Z_G} e^{(\mu N − E)/T}.
(10.75)
这是吉布斯分布在考虑粒子数可变情形下的对应形式。归一化因子 Z_G 确保总概率之和为 1,称为巨配分函数。概率分布 (10.75) 根据 T 和 µ 决定了 E 和 N 的平均值。对于宏观系统,这些平均值就是热力学值。

10.9 低温下的费米子气体和玻色子气体
当温度接近绝对零度时,费米子或玻色子气体表现出引人注目的性质。特别是玻色子,可以发生一种称为玻色–爱因斯坦凝聚的相变。

低温下的费米子与玻色子气体
325
我们假设气体由 N 个全同粒子组成,它们可以是费米子也可以是玻色子,盛放在体积为 V 的盒子中,且彼此之间没有直接相互作用。唯一的相互作用来自全同粒子多粒子波函数的量子性质。没有直接相互作用意味着我们可以处理每个单独粒子的能级,而由于盒子是宏观的,单粒子态具有准连续的能谱 ε。
如果粒子是费米子,一个单粒子态只能有 0 或 1 的占据数;如果是玻色子,则可以是 0 或任意正整数。在此情况下,化学势很有用,因为它避免了复杂的组合计算。我们可以将一个能量为 ε 的单粒子态视为一个与其余气体构成的热源和粒子源相接触的系统,该热源温度为 T,化学势为 µ。该态的占据数是可变的,当占据数为 n 时,系统的能量为 εn = nε,因此 µn − εn = n(µ − ε)。
根据分布 (10.75),令 N = n, E = nε,则能量为 ε 的单粒子态占据数为 n 的归一化概率为
P(n) = 1/z e^{n(µ−ε)/T} , (10.76)
其中 z = Σ_n e^{n(µ−ε)/T}。对于费米子,n = 0, 1,因此求和中仅有两项;对于玻色子,n = 0, 1, 2, …,因此求和是一个无穷几何级数,只要 µ < ε 便收敛且容易求和。这些单粒子配分函数为
z_F = 1 + e^{(µ−ε)/T} (费米子) , (10.77)
z_B = 1 / (1 − e^{(µ−ε)/T}) (玻色子) . (10.78)
10.9.1 费米–狄拉克函数
比这些概率分布更重要的是作为 ε 函数的平均占据数,
n(ε) = 1/z Σ_n n e^{n(µ−ε)/T} . (10.79)
对于费米子,z = z_F,n 取值为 0 和 1,故平均值为
n(ε) = e^{(µ−ε)/T} / (1 + e^{(µ−ε)/T}) = 1 / (e^{(ε−µ)/T} + 1) ≡ n_F(ε) . (10.80)
n_F(ε) 称为费米–狄拉克函数。图 10.4 给出了它在不同温度下的图像。对于能量 ε 小于 µ 的态,分母中的指数项很小,故平均占据数接近于 1;而对于能量大于 µ 的态,指数项很大,平均占据数接近于 0。由于指数与 1/T 成正比,这种过渡在低温下很陡峭,在高温下则比较平缓。零温极限情形是简并费米气体,此时所有低于 µ 的态都被占据,所有高于它的态都空着。此时 µ 是最高占据态的能量,即费米能 ε_F。在有限温度下,占据数在 ε_F 处的尖锐间断被展宽了。

326
热力学
0
–2
T = 0.1
T = 0.5
T = 1.0
–4
–6
–8
0
0.2
0.4
0.6
0.8
nF
1
2
4
6
8
ε –µ
图10.4 费米-狄拉克(Fermi–Dirac)分布函数。
假设盒中单粒子态的密度为g(ε),可能的能量从最小值εmin向上延伸。那么总粒子数N等于平均费米子占据数nF(ε)在整个可用能量范围内对态密度加权的积分,
N =
Z ∞
εmin
g(ε)
e
ε−µ
T

  • 1
    dε .
    (10.81)
    这给出了N作为µ和T的函数。通过反演这个表达式,可以确定µ作为N和T的函数。气体的总能量可由一个类似的积分得到,在被积函数中多一个因子ε。
    对于T = 0时的简并费米气体,所有状态直到费米能量εF都被占据,因此µ = εF,且εF与N的关系为
    N =
    Z εF
    εmin
    g(ε) dε .
    (10.82)
    对于很小的T,µ与εF仅有微小差别,这个差别取决于靠近εF处的态密度g(ε)。
    10.9.2
    简并电子气体的压强
    考虑体积为V的盒子中的N个电子。假设它们的电荷被背景离子的正电荷所屏蔽,因此电子可以被视为无相互作用。设温度很低,电子表现为简并费米气体。电子的动能从0向上延伸,态密度为
    g(ε) =
    V
    2π2
    (
    2m
    ¯h2
    )
    3/2
    ε
    1/2 .
    低于费米能量εF的所有状态都被占据,高于它的所有状态都空着。在8.7.1节中我们计算了简并电子气体的费米能量,也计算了N个电子的总能量,得到
    E = 3(3π2)
    2/3
    5
    ¯h2
    2m
    (
    N
    V
    )
    2/3
    N .
    (10.83)

低温下的费米子和玻色子气体
327
简并电子气的态是N个电子能量最低的态,因此它是零温态。由于该态是唯一的,熵为零。
现在假设体积V变化。熵S保持为零,因此TdS为零,热力学第一定律简化为dE = −PdV。因此,简并电子气的压强为
P = −dE
dV = 2(3π2)
2
3
5
¯h2
2m
N
V
 5
3
.
(10.84)
这种可观的压强,与密度的5/3次幂成正比,是泡利(Pauli)不相容原理的结果。它被称为电子简并压。状态方程为PV = NT的经典理想气体在零温时压强为零,但不相容原理要求几乎所有电子即使在零温下也具有正的动能,并且当体积减小时总能量增加,从而产生压强。这种压强在白矮星的演化中起着至关重要的作用,我们将在第13.7.1节中看到。
10.9.3
电子气的热容
在德鲁德(Drude)理论中,金属中的电子被视为经典的自由粒子气体。尽管这个早期理论取得了一些成功,但其关于电子对金属热容贡献的预测却缺乏实验支持。如果电子真的表现为经典的无相互作用粒子,我们会预期其能谱与第10.5节中讨论的理想气体的能谱相同。对于Ne个电子,热容将为3
2Ne,正如理想气体的方程(10.55)所给出的。在正常室温下,这超过了测量值的100倍。
要精确计算热容,必须使用量子理论。电子是费米子,因此量子态的平均占据数由费米-狄拉克(Fermi–Dirac)函数(10.80)给出。金属中的电子数密度很高,因此电子的费米能量εF远大于室温T。费米-狄拉克函数从1到0的跃变发生在εF附近约为T量级的相对较窄的能量范围内,因此热激发只影响一小部分电子——那些能量接近εF的电子。
我们现在将在远低于εF的温度下计算电子热容。电子费米气体的热力学能量为
Ee =
Z ∞
εmin
εg(ε)nF(ε) dε ,
(10.85)
其中g(ε)是态密度,nF(ε)是费米-狄拉克函数。态密度不依赖于温度,但nF依赖于温度,因此热容为
Ce = dEe
dT =
Z ∞
εmin
εg(ε)∂nF
∂T dε .
(10.86)
在低温下,化学势µ近似为εF,其温度依赖性可以忽略。令x = ε−εF
T
。费米-狄拉克函数则为
nF(x) =
1
ex + 1
.
(10.87)

328
热力学
其对温度 T 的导数为
∂nF
∂T = dnF
dx
∂x
∂T =
ex
(ex + 1)2
ε −εF
T 2
= 1
T
xex
(ex + 1)2 .
(10.88)
最后一个量可以重新表示为
1
T
x
(e
1
2 x + e−1
2 x)2 ,
(10.89)
这是一个关于 x 的奇函数,集中在 x = 0 附近,即集中在 ε = εF 附近。因此在积分 (10.86) 中,我们可以将积分范围拓展到 −∞ 到 ∞,将 g(ε) 视为常数 g(εF),并将能量因子 ε 替换为 (ε − εF) + εF = Tx + εF。常数 εF 由于乘以奇函数,对积分没有贡献。然后将 dε 替换为 Tdx,我们得到
Ce = Tg(εF)
Z ∞
−∞
x2
(e
1
2 x + e−1
2 x)2 dx .
(10.90)
这是一个标准积分,其值为 π2
3 。因此
Ce = π2
3 g(εF) T
(10.91)
在低温下。
在第 8.7.1 节中,我们计算了自由电子的态密度为
g(ε) = (2m3)
1
2
V
π2¯h3 ε
1
2 = 3
2
N(ε)
ε
,
(10.92)
其中 N(ε) 是能量不超过 ε 的电子态总数。因此,费米面处的态密度为 g(εF) = 3
2
Ne
εF ,因为 N(εF) = Ne,代入方程 (10.91) 得到
Ce ≃ π2
2 Ne
T
εF
.
(10.93)
由于室温下金属的 T ≪ εF,该热容远小于经典的 3
2 Ne。
在低温下,金属的热容可以表示为电子贡献与晶格振动贡献之和。晶格贡献和电子贡献的高阶修正都与 T 3 成正比。在低温下,与 T 成正比的电子贡献占主导地位。对于自由电子模型适用的金属,这个简单模型与热容测量值之间有合理的一致性。这些金属是货币金属和碱金属,其电子热容的预测值准确度在 10% – 30% 以内。

费米子气体与玻色子气体在低温下
329
10.9.4
玻色–爱因斯坦函数
对于玻色子粒子,每个单粒子态的平均占据数可以用与费米子相似的方法计算。利用概率分布 (10.76),其中 z = zB 来自方程 (10.78),我们求得平均占据数为
n(ε)

1
zB

X
n=0
n e
n(µ−ε)
T


1 − e
µ−ε
T
 ∞
X
n=0
ne
n(µ−ε)
T

0 + e
µ−ε
T
+ 2e
2(µ−ε)
T
+ 3e
3(µ−ε)
T
+ · · ·
−0
−e
2(µ−ε)
T
−2e
3(µ−ε)
T
−· · ·


X
n=1
e
n(µ−ε)
T
.
(10.94)
对于 µ < ε,该几何级数求和为
n(ε) =
e
µ−ε
T
1 − e
µ−ε
T

1
e
ε−µ
T
−1
≡ nB(ε) .
(10.95)
nB(ε) 称为玻色–爱因斯坦函数(Bose–Einstein function),它与费米–狄拉克函数(Fermi–Dirac function) nF(ε) 的区别仅在于分母中的 +1 换成了 −1。图 10.5 展示了函数 nB,同时也画出了 nF 以作比较。
nB(ε) 分母的形式意味着积分
Z ∞
0
xn−1
ex −1 dx
(10.96)
经常出现在玻色气体理论中,对不同 n。其值为
Z ∞
0
xn−1
ex −1 dx

Z ∞
0
xn−1(e−x + e−2x + e−3x + · · ·) dx

Z ∞
0
xn−1e−xdx +
Z ∞
0
x′
2
n−1
e−x′ 1
2dx′ +
Z ∞
0
x′′
3
n−1
e−x′′ 1
3dx′′ + · · ·

Z ∞
0
xn−1e−x dx

1 + 1
2n + 1
3n + · · ·


Γ(n)ζ(n) ,
(10.97)
其中 Γ(n) = R ∞
0 xn−1e−x dx,ζ(n) = P∞
k=1
1
kn 。Γ(n) 是欧拉伽马函数(Euler gamma function),ζ(n) 是黎曼泽塔函数(Riemann zeta function)。当 n 为正整数时,Γ(n) = (n − 1)!。另一个有用的值是 Γ( 3
2) = 1
2 π
1
2 。以下泽塔函数值也会用到:ζ( 3
2) ≃ 2.612,ζ(3) ≃ 1.202,ζ(4) = π4
90 。
单粒子态的能量范围从 εmin 向上延伸。nB(ε) 仅在 µ 小于所有允许能量 ε 时才有意义,因为平均占据数不能为负。

330
热力学
–2
–3
–4
0
0.5
1
1.5
2
n
2.5
3
–1
0
1
2
3
4
T
ε –µ
图10.5 玻色-爱因斯坦分布函数与费米-狄拉克分布函数(上下曲线)的比较。
当ε≫µ时,它们在渐近意义下相同,因为此时一个态上多重占有的概率可以忽略不计。其渐近形式为麦克斯韦-玻尔兹曼函数e
µ−ε
T
(中间曲线)。
因此µ < εmin。µ的值由总粒子数为N这一要求决定,这同样引出一个积分约束条件
N =
Z ∞
εmin
g(ε)
e
ε−µ
T
−1
dε .
(10.98)
对于小T,玻色-爱因斯坦函数随ε增加而迅速减小,因此若N固定,
µ必随T减小而自下方趋近于εmin。此时大多数粒子占据一个狭窄的激发态能区,其能量等于或略高于εmin。
值得注意的是,存在一个临界温度Tc,低于此温度时,只有有限比例的粒子能处于ε > εmin的态上。其余粒子全部处于能量为εmin的基态。此时基态被宏观地占据。这一现象被称为玻色-爱因斯坦凝聚(Bose–Einstein condensation)。
为求得Tc,我们假设基态是分立的且能量为εmin,但单粒子激发态具有准连续能谱,其态密度为

费米子与玻色子气体在低温下的行为
331
0
1 –
3/2
0
1
1
0
0.5
1
0.6
1.2
1.8
T
Tc
T
Tc
T
Tc
N0
N
N0
N
图10.6 左图:均匀三维盒子中玻色子凝聚体比例N0
N 随约化温度 T
Tc 变化的预测曲线。右图:三维谐振子阱中原子玻色-爱因斯坦凝聚体观测到的凝聚体比例随约化温度的变化。虚线为N0
N = 1 −( T
Tc )3的曲线。
g(ε)。对于质量为m、可在体积为V的盒子中自由运动的非相对论性自旋为0的玻色子,我们可以设εmin = 0。激发态的态密度为
g(ε) =
m3
2
 1
2
V
π2¯h3 ε
1
2 .
(10.99)
当µ = 0时达到临界温度Tc。在此温度下,处于基态的粒子比例基本上仍为零,因此将g(ε)代入方程(10.98)并设µ = 0,可得总粒子数为
N

m3
2
 1
2
V
π2¯h3
Z ∞
0
ε
1
2
e
ε
Tc −1

 mTc
2π¯h2
 3
2
V 2
π
1
2
Z ∞
0
x
1
2
ex −1 dx

2.612 V
 mTc
2π¯h2
 3
2
,
(10.100)
其中我们代入了x =
ε
Tc 以得到n = 3
2 时的标准积分(10.96),然后利用了Γ( 3
2) = 1

1
2 和ζ( 3
2) ≃2.612。因此,玻色-爱因斯坦凝聚的临界温度与数密度之间的关系由下式给出
N
V = 2.612
 mTc
2π¯h2
 3
2
.
(10.101)
在更低的温度下,µ保持为0,处于激发态的粒子数为2.612 V
mT
2π¯h2
 3
2 ,这小于N。其余粒子均处于基态。若以N0(T)表示这些基态粒子数,则总粒子数现在为
N = N0(T) + 2.612 V
 mT
2π¯h2
 3
2
.
(10.102)

332
热力学
1
0
2
温度 /K
2.17 K
液氦-4的比热容
3
图10.7 氦的热容在2.17 K温度处有一个非常尖锐的峰,因其形状而被称为λ峰。
利用表达式(10.100)将N表示为Tc的函数,我们得到
N0(T) = 2.612 V
 m
2π¯h2
 3
2 
T
3
2
c −T
3
2

,
(10.103)
并除以N给出处于基态的粒子分数,
N0(T)
N
= 1 −
 T
Tc
 3
2
.
(10.104)
在图10.6左侧,该分数被表示为T的函数。
在临界温度Tc处发生相变,此时玻色-爱因斯坦凝聚(Bose–Einstein condensation)开始发生,因为基态粒子数N0(T)的导数和热容CV在此处不连续。
玻色-爱因斯坦凝聚在物理系统中并不容易发生,因为大多数天然存在的玻色子原子气体在远高于其临界温度时就会液化,而在液相中原子间的相互作用不再可以忽略。然而,人们认为玻色-爱因斯坦凝聚发生在液氦中,针对的是最丰富的同位素⁴He的原子。氦在达到大约4 K之前一直保持气态,在此温度下液化。在该液体的自然密度下,预测的临界温度Tc约为3 K。处于基态的原子分数无法直接测量,但热容是可以测量的。如图10.7所示,在2.17 K温度处,氦的热容有一个非常尖锐的峰。低于此温度时,氦成为超流体,这一相变被认为与玻色-爱因斯坦凝聚有关。
在超冷碱金属原子系统中,有不容置疑的证据表明存在玻色-爱因斯坦凝聚。利用激光和非均匀磁场,研究人员能够

费米子和玻色子气体在低温下的性质
333
图10.8 玻色-爱因斯坦凝聚体。通过将作为玻色子的铷原子冷却到低于1.7×10⁻⁷ K的温度,卡尔·威曼(Carl Wieman)和埃里克·康奈尔(Eric Cornell)于1995年制备出了第一个真正的玻色-爱因斯坦凝聚体。
将诸如铷-87和钠-23的原子囚禁在谐振子势阱中。通常,大约有10⁴–10⁷个原子被囚禁,其密度远低于液氦的密度。因此,这些原子间的相互作用远弱于液氦中的情形,它们更符合理想玻色气体理论的假设。低密度意味着临界温度Tc在微开尔文范围。Tc可以利用类似于(10.100)的积分来计算,但在谐波阱中态密度⁷正比于ε²而不是ε^(1/2)。在变量变换为x = ε/Tc后,ε² dε → T_c³ x² dx,结果得到表达式N₀/N = 1 − (T/Tc)³,如图10.6右侧所示。利用这些技术,卡尔·威曼和埃里克·康奈尔于1995年首次创建了玻色-爱因斯坦凝聚体(BEC),当时他们将一团铷-87原子云冷却至超低温。这些原子是玻色子,因为它们包含偶数个自旋为½的粒子,即37个电子、37个质子和50个中子。当被冷却到低于1.7×10⁻⁷ K时,大部分铷原子凝聚到同一状态。图10.8中的图形是一幅伪彩色图像,显示了在三种不同温度下铷原子云的空间密度分布,展示了随着温度降低原子逐渐聚集到同一状态。
⁷在三维谐振子的第N能级,能量为ε_N = (N+ 3/2)¯hω,简并度为g(ε_N) = ½(N+1)(N+2),我们将在11.3.2节中证明此点,因此g(ε_N) ∝ (ε_N − ½¯hω)(ε_N + ½¯hω) = ε_N² − ¼ ¯h²ω²。对于大N,我们可以忽略最后一项。

334
热力学
图10.9 左:旋转的钠原子凝聚体中规则的涡旋晶格。使用激光使一个直径60微米、长度250微米的凝聚体旋转起来。右:让凝聚体弹道式膨胀,结果放大了20倍。图像表示穿过密度分布的二维截面,并显示出由涡旋核心导致的密度极小值。所示例子分别含有0, 16, 70和130个涡旋。降低。红色表示低密度,黄色和绿色表示中等密度,高密度由蓝色到白色表示。
激光脉冲可用来使玻色–爱因斯坦凝聚体旋转,这导致在凝聚体内形成承载角动量的涡旋阵列。图10.9显示了一个旋转的玻色–爱因斯坦凝聚体。
10.10
黑体辐射
到目前为止,我们关于费米气体和玻色气体的讨论都是针对由大质量原子或电子组成的、非相对论性运动的气体,但还有一些粒子集合体或许不会被认为是气体,却可以用类似的方法分析其性质。其中之一就是光子气体,我们称之为黑体辐射。这是对一个理想化的完美电磁辐射发射体和吸收体所产生的辐射的称呼。测量得到的黑体谱无法用经典热力学解释,这导致了19世纪末物理学的一场危机,直到量子物理学出现才得以解决。
令人惊讶的是,即使是一个不包含任何物质的空盒子也具有热力学性质。这是因为盒子内的电磁场被构成盒壁的物质以热的方式激发。盒子里充满了光子气体,这些光子不断地被盒壁材料发射和吸收。这些光子迅速达到热平衡,其温度T等于盒子的温度。
化学势µ代表能量对粒子数的导数。µ是将粒子数增加1所需的能量代价。光子的静止质量为零,这意味着发射一个光子所需的能量代价可以任意小;具有无限长波长的光子能量为零。由于光子数不守恒,且光子不断地被发射和吸收,光子化学

黑体辐射
335
因此化学势为 µ = 0。我们可以将整个空间中的电磁场视为一个无限的粒子浴,它使光子的化学势保持为零。

光子是无质量的自旋为1的粒子,因而是玻色子,并具有两个独立的、垂直于传播方向的偏振态。作为相对论性粒子,它们满足关系 E = |p|,这是无质量粒子的方程(4.27)的类似形式。它们之间的相互作用可以忽略不计,因此它们构成理想玻色气体。在一个体积为 V 的有限盒子里,采用周期性边界条件,电磁波模的允许波矢 k 是离散的。k 空间中的波模密度为
2V
(2π)³ ,这是我们在第8.2.1节中推导出的结果,并因两个偏振态而多出一个因子2。在波数 k(波矢的大小)上的密度为 8πk²V
(2π)³ = k²V
π² 。用频率 ω 来处理更为方便,而对电磁波来说 ω 等于 k,因此 ω 的模密度为
g(ω) = ω²V
π² 。
(10.105)

盒子中的每一个电磁辐射模都可以被任意数量的光子占据。如果该模的频率为 ω,则每个光子具有能量 ¯hω,若有 n 个光子,总能量就是 n¯hω。每个模中的平均光子数由 µ = 0 的玻色–爱因斯坦函数给出,
nB(ω) =
1
e
¯hω
T −1

(10.106)

频率 ω 处的光子数密度是一个模中的平均光子数 nB(ω) 与模密度 g(ω) 的乘积,
N(ω) = V
π²
ω²
e
¯hω
T −1

(10.107)

由 N(ω) 乘以 ¯hω 即得到光子的能量密度,
E(ω) = V ¯h
π²
ω³
e
¯hω
T −1

(10.108)

这就是著名的普朗克公式,普朗克(Planck)在此处首次引入了以他名字命名的常数 h。E(ω) 是黑体辐射的谱能量密度。能量密度作为波长的函数,在不同温度下的曲线绘于图10.10中。

现在来确定峰值辐亮度——即 E(ω) 的最大值——如何随温度变化。方便的做法是作代换 x = ¯hω
T ,从而有 E(ω) ∝

eˣ−1 。求导后可知,最大值出现在 3x²(eˣ −1)−x³eˣ = 0 处,或等价地出现在
x
1−e⁻ˣ = 3
处,该方程可通过数值求解给出 x ≃ 2.8214。因此,黑体辐射的峰值辐亮度位于
¯hω_peak ≃ 2.8214 T 。
(10.109)

这种随温度的线性增大被称为维恩位移定律(Wien’s displacement law)。它常以 λ_peak ∝ 1
T 的形式呈现,温度与峰值波长之间的这一关系可从图10.10中看出。而一个热的烹饪锅主要发射红外

336
热力学
1000
波长 (nm)
T = 6000 K
紫外
可见光范围
红外
T = 5000 K
T = 4000 K
T = 3000 K
1500
λ峰值
2000
0
500
强度
图10.10 不同温度下的黑体辐射普朗克公式。
像太阳这样的辐射源,其表面温度约为6000 K,所发出的辐射中有相当大一部分是可见光和紫外光。值得注意的是,温度更高的物体在所有波长上都会辐射出更多的能量,而不仅仅是在峰值区域。在第13章讨论恒星物理时,我们将用到维恩位移定律。
所有模式中的光子总数为N(ω)的积分,
N = V
π²
∫₀^∞
ω²
e^{ħω/T} −1
dω = V T³
π²ħ³
∫₀^∞

eˣ −1 dx ≃2.404 V T³
π²ħ³ ,
(10.110)
其中我们代入了x = ħω/T 以得到n = 3时的积分(10.96),然后利用了Γ(3) = 2和ζ(3) ≃1.202的数值。
黑体辐射的总能量为E(ω)的积分,
E = V ħ
π²
∫₀^∞
ω³
e^{ħω/T} −1
dω = V T⁴
π²ħ³
∫₀^∞

eˣ −1 dx = π²
15
V T⁴
ħ³
.
(10.111)
这里我们使用了n = 4的积分(10.96)以及Γ(4) = 3! = 6和ζ(4) = π⁴/90的数值。结果通常表示为
E = 4σV T⁴ ,
(10.112)
其中σ = π²/(60ħ³) 是斯特藩–玻尔兹曼常数(Stefan–Boltzmann constant)。
在经典物理中,辐射会有无穷多个模式,每个模式携带等量的热能,因此总能量将是无穷大。我们现在知道,电磁辐射是以分立的波包,即光子,形式传播的,这抑制了极紫外模式中的能量,使得量子理论中的总能量有限。

激光器
337
黑体辐射的总光子数N和总能量E与体积成正比,且两者均为有限值。这是普朗克(Planck)引入量子概念后取得的首次成功。

黑体辐射具有更多的热力学性质。在体积固定的情况下,热力学第一定律表明dE = T dS,由E = 4σV T⁴可得dE = 16σV T³ dT,因此dS = 16σV T² dT。积分后得到黑体辐射的熵为
S = 16/3 σV T³,
(10.113)
其中积分常数为零,因为熵在零温时消失。将方程(10.112)中的T代入,我们得到表达式
E = (81/1024 σ)¹/³ V⁻¹/³ S⁴/³。
(10.114)
该式用S和V表示了E。温度为T的黑体内光子产生的辐射压强因此为
P = −∂E/∂V∣_S = 1/(3V) E = 4/3 σT⁴。
(10.115)
当我们考虑恒星内部的辐射压强时,这一结果将在第13章中发挥作用。

同样重要的是黑体表面发射的能量。这可以通过以下方式计算。假设在物体表面附近有一小团温度为T的黑体辐射。能量由以单位速度(光速)沿所有方向随机运动的光子组成。能量密度为4σT⁴,如果所有这些能量都沿垂直于表面的方向离开物体,那么单位面积的能量发射率将是4σT⁴,但只有一半能量向外离开表面,而对于这一半能量,垂直于表面的速度分量在0到1之间变化。垂直于表面的平均速度分量为1/2(cos ϑ在半球0 ≤ ϑ ≤ π/2上的平均值)。因此,单位面积的能量发射率为σT⁴。这被称为斯特藩-玻尔兹曼定律(Stefan–Boltzmann law),它决定了恒星的光度。

10.11 激光器
在本节中,我们将研究黑体辐射与原子中光子吸收和发射的相互作用,并讨论由此物理学原理产生的激光技术。

玻尔(Bohr)提出了原子中的电子存在众多可用能级的概念,处于激发态E₂的电子会自发跃迁至较低能级E₁,并发射一个能量为E₂ − E₁ = ¯hω的光子,其中ω是光子的频率。反之,一个能量恰好为¯hω的光子可以将电子从能级E₁激发到E₂。爱因斯坦(Einstein)意识到,在存在合适能量光子的情况下,电子也可能被诱导跃迁至较低能级。能量为E₂ − E₁ = ¯hω的光子会激发处于激发态E₂的电子,使其发射更多具有相同能量的光子并跃迁至能级E₁。

338
热力学
爱因斯坦(Einstein)的论证基于一个简单的原子模型,该模型用二能级系统描述,其中 E₂ > E₁,每个能级 Eₘ 上的电子布居数为 nₘ。爱因斯坦假定布居数 n₂ 的变化率为
dn₂
dt = −n₂A₂₁ − n₂B₂₁u(ω) + n₁B₁₂u(ω) ,
(10.116)
其中 u(ω) 是单位体积光子的光谱能量密度。此处,−n₂A₂₁ 为自发辐射(spontaneous emission)速率,−n₂B₂₁u(ω) 为受激辐射(stimulated emission)速率,n₁B₁₂u(ω) 为将电子从能级 E₁ 提升至 E₂ 的受激吸收(stimulated absorption)速率。A₂₁ 是与能级半衰期相关的内禀属性,而通过 u(ω),包含 B₂₁ 和 B₁₂ 的项依赖于频率为 ω 的其他光子的存在。对于处于热平衡且与黑体辐射相伴的这类原子气体,两个能级上的电子布居数保持恒定,即 dn₁/dt = dn₂/dt = 0,因此由方程(10.116)得,
(n₁B₁₂ − n₂B₂₁)u(ω) = n₂A₂₁ ,
(10.117)
重新整理后得到
u(ω) = A₂₁
B₁₂
1
( n₁/n₂ − B₂₁/B₁₂ ) .
(10.118)
在温度为 T 的热力学平衡态下,原子布居数之比由吉布斯因子(Gibbs factors)之比给出
n₁
n₂ = e^{−E₁/T} / e^{−E₂/T} = e^{¯hω/T} ,
(10.119)
而 u(ω) = (1/V)E(ω) 由普朗克公式(Planck formula)(10.108)给出,于是我们得到
u(ω) = (¯hω³/π²) · 1/(e^{¯hω/T} − 1) = (A₂₁/B₁₂) · 1/(e^{¯hω/T} − B₂₁/B₁₂) .
(10.120)
此方程只有在 B₁₂ = B₂₁ 时才能成立,据此我们发现了一个令人惊讶的关系:A₂₁/B₂₁ = ¯hω³/π²。

受激辐射是光子玻色性的直接结果。倘若方程(10.116)中没有受激辐射项 B₂₁u(ω),我们就会得到适用于可区分粒子的结果:u(ω) = (A₂₁/B₁₂) e^{−¯hω/T}。通俗地说,玻色子喜欢占据与其他玻色子相同的状态。

我们可以通过考虑几个现实例子来评估受激辐射的重要性。对于波长为 632.8 nm 的红光,ω ≃ 3×10¹⁵ s⁻¹。在室温下,T ≃ 0.025 eV = 4×10⁻²¹ J,因此 ¯hω/T ≃ (10⁻³⁴ × 3×10¹⁵)/(4×10⁻²¹) = 75。由方程(10.120)及 B 系数的相等关系,
A₂₁/(B₂₁u(ω)) = e^{¯hω/T} − 1 ≃ e⁷⁵ ,
(10.121)
所以在室温下,红光的自发辐射远远超过受激辐射。然而,对于 ω ≃ 10¹² s⁻¹,相当于微波谱的高频端,¯hω/T ≃ 0.025。

激光
339
能量
1s
基态
扩散至管壁
通过电流
激发
2p
1.15 µm
3.39 µm
632.8 nm
3p
3s
2s
23S1
21S0
快速辐射
跃迁
He-Ne
碰撞


图10.11 氦原子和氖原子中的能级。粒子数反转发生在氖的3s和2p能级之间。
这给出
A21
B21u(ω) = e0.025 −1 ≃0.025 ,
(10.122)
所以受激辐射压倒了自发辐射。一般地,对于频率远高于黑体谱峰值的辐射,自发辐射将占主导;而对于频率低于黑体谱峰值的辐射,受激辐射将占主导。
看起来自发辐射和受激辐射过程似乎截然不同,但实际上并非如此。即使电磁场不包含任何光子激发,每个模式仍然具有零点能 1 2¯hω,而自发辐射可以看作是由这些零点振荡所激发的辐射。
受激辐射现象赐予我们一项如此重要的技术,以至于其缩写词laser(Light Amplication by the Stimulated Emission of Radiation,受激辐射光放大)已进入我们的日常语言。要产生激光,系统必须偏离热力学平衡,并输入能量以维持电子能级上的粒子数反转。我们稍后将探讨这是如何实现的。在一个二能级系统中,如果我们设法让大多数电子占据能级E2,那么一个自发落到能级E1的电子将发射一个频率为ω的光子,这个光子可能激发同频率的更多光子的发射,并触发光子级联。通过泵浦能量使电子回到能级E2,我们就可以获得频率为ω的光子的连续输出。最重要的是,每个受激发射的光子不仅频率相同、偏振相同,而且与激发波同相,并沿相同方向发射。
最早于1960年演示的实用激光器,是基于以10:1比例混合的氦原子和氖原子气体。如图10.11所示,氦原子具有与氖原子相近的激发态。让电流通过混合气体会激发电子

340
热力学
阳极
氦氖混合气体
激光器放电管
玻璃管
阴极
输出
耦合器

反射镜
图10.12 氦氖激光器。放电管必须很窄,以便氖原子能迅速扩散到管壁,在那里碰撞使得处于氖1s激发态的电子回到基态。

氦原子中的电子。然后氦原子与氖原子发生碰撞,将氖原子的外层电子激发到激发态。(微小的能量差由氦原子的动能提供。)氖的3s态是亚稳态,因此布居数很高,而氖的2p态会迅速衰变到1s态,因此其布居数非常少。只要气体中有电流通过,这种粒子数反转就会持续下去。

为了产生激光,把这种混合气体置于两个高度抛光的镜面之间的狭窄腔室内,这两个镜面构成一个光学谐振腔,如图10.12所示。从氖的3s能级到2p能级的自发衰变会产生光子,这些光子会激发更多的这种跃迁。这些光子束在两端镜面之间来回反射。(任何偏离光束轴线发射的光子都会损失掉。)激光器本质上是一个频率非常高的电磁振荡器。其中一端的镜面部分(99%)镀银,使得一束光子可以逸出。氦氖激光器发出波长为632.8 nm的红光。

作为一种廉价、紧凑而强大的单色光源,它已经得到了许多应用,包括条形码扫描器。现在已经基于各种材料——气体、液体、晶态固体、半导体和绝缘体——开发出了许多其他类型的激光系统。

激光束与白炽灯泡那样的传统光源发出的光非常不同。当钨丝被电流加热时,它发出的辐射具有热辐射谱,能很好地近似遵从普朗克公式。这种辐射是随机过程的结果,向所有方向发射,具有所有可能的偏振态,相位随机分布,因此这种光是非相干的。相比之下,激光中的光子全部同相,沿同一方向以窄束发射,且具有相同的偏振。标准透镜可以将激光器发出的相干光聚焦到一个衍射受限的光斑,其大小取决于波长。很容易获得高达10¹⁷ W cm⁻²的能流密度,与此相比,氧乙炔焰的能流密度为10³ W cm⁻²。这使得激光的应用范围从焊接到核聚变研究不等。激光束的相干性对于许多其他应用至关重要,包括全息照相和引力波干涉仪。其他应用还包括CD和DVD的数据存储与读取、眼科手术、自适应光学导引星、激光印刷以及光纤。目前人们正在投入大量努力开发光子学技术,以作为电子学的替代方案。由于光子以光速传播,并且与其他光子的相互作用可以忽略不计,光子器件有望带来尺寸更小、速度更快的显著优势。

自旋系统中的磁化
341
图 10.13 下:一维反铁磁体的基态。
上:带有两个缺陷的一维反铁磁体。
10.12 自旋系统中的磁化
正如我们在第9章中看到的,在由规则原子晶格构成的晶体固体中,原子通常具有净自旋。因此,每个原子表现得像一个微型磁体,具有磁矩,在某些固体中,这些磁矩会在相邻原子之间产生磁相互作用。人们对于用基于自旋晶格系统的简单模型来解释这类材料的热力学性质和物理特征有着极大的兴趣。让我们考虑自旋为 1/2 的原子,这样只有两个独立的量子自旋态,晶格结构迫使每个自旋沿着其中一条晶轴要么向上要么向下,自旋投影为 +1/2 和 −1/2。自旋的叠加可以忽略不计。于是磁矩将指向上或下,其强度是某个常数乘以自旋投影。
磁力随距离增加而迅速衰减,因此我们将假设对能量的唯一贡献来自相邻晶格位置上的自旋之间的相互作用。在大多数常见材料中,这些微观磁体的行为与我们熟悉的条形磁铁对类似。异极倾向于靠近在一起。在这类材料中,原子自旋的最低能量排列是相邻磁矩反向平行排列。任何平行排列的磁矩都会增加能量。
最简单的这类模型是一条由大量(N+1)个等间距自旋组成的一维链。在基态中,自旋交替排列,如图 10.13(下)所示,该态被称为严格反铁磁有序的。我们将能量归一化使得基态能量为零。激发态中存在缺陷,即相邻自旋沿相同方向排列。图 10.13(上)所示的态有两个缺陷。
我们可以从第一性原理研究该系统的热力学性质。假定一个缺陷使能量增加 ε,并假设仅考虑最近邻自旋相互作用,那么 n 个缺陷的能量为 nε。这 n 个缺陷有 N 个可能的位置,且所有缺陷必须处于不同的位置。假设链左端的自旋固定为向上,那么具有 n 个缺陷的态数 Ω 为组合因子
[
\binom{N}{n} = \frac{N!}{n!(N-n)!},
]
(10.123)

342
热力学
这是从N个位置中选择n个位置的方式数。由于N很大,我们记作
n = αN,其中α是缺陷的分数密度。那么
Ω=
 N
αN


N!
(αN)!((1 −α)N)! .
(10.124)
利用近似 (10.60),log X! = X log X −X,我们得到熵作为α的函数,
S = log Ω

N(log N −1) −αN(log(αN) −1) −(1 −α)N(log((1 −α)N) −1)

N{log N −α log(αN) −(1 −α) log((1 −α)N)}

N{log N −α(log α + log N) −(1 −α)(log(1 −α) + log N)}

−N{α log α + (1 −α) log(1 −α)} ,
(10.125)
用α表示,能量为E = αNε。
在固定N的情况下,对这些表达式关于α求导,得到
dS

−N(log α + 1 −log(1 −α) −1) = N log
 1
α −1

,
(10.126)
dE

Nε .
(10.127)
因此,对于此系统,
1
T = dS
dE = dS


dE = 1
ε log
 1
α −1

.
(10.128)
如果我们将此关系反转,得到
α =
1
e
ε
T + 1 .
(10.129)
这是反铁磁体中相邻自旋对形成缺陷的比例,其中自旋排列一致。在低温T ≪ε下,该比例α ≃ e−ε
T,呈指数级小,因此存在具有严格反铁磁序的大块自旋区域。然而,由于缺陷密度很小,随着N趋于无穷大,不存在长程序。距离链左端很远的自旋向上或向下的概率相等。在高温T ≫ε下,比例α趋近于1/2,缺陷和非缺陷出现的可能性相同。自旋完全随机化,当T →∞时,即使最近邻之间也毫无关联。

这只是晶格自旋最简单的模型。人们还设计了无数其他模型。在一维中,存在铁磁链,其中相邻自旋倾向于同向排列,如图10.14所示。任何一种链都可以受到外磁场的影响,外磁场改变能量并倾向于使自旋沿某个方向排列。上面讨论的自旋链是一个纯热学系统,但通过引入外场,它成为一个热力学系统,其中外场取代了气体中的压强变量,净磁化强度取代了体积。

还可以考虑二维或三维的自旋晶格,并允许自旋投影具有两个以上的值,以模拟自旋大于

关于相变的一点介绍
343
图10.14 下:一维铁磁体的基态。上:带有两个缺陷的一维铁磁体。
1
2。对于立方晶格,相邻自旋之间的耦合可能不同,取决于相邻自旋是平行于自旋投影方向还是垂直于它。
还存在真正的量子自旋晶格,其中每个原子具有自旋
1
2,并且有自旋算符 s,但人们不能直接假定每个自旋要么向上要么向下。每对相邻自旋 s(1) 和 s(2) 的量子哈密顿量可能具有各向同性的形式 c s(1) · s(2),或者更复杂的形式 c1s(1)
x s(2)
x

  • c2s(1)
    y s(2)
    y
  • c3s(1)
    z s(2)
    z 。
    总哈密顿量是所有相邻自旋对上这种项的和。
    这些晶格自旋模型中,有一些具有可以精确计算的热力学性质,特别是二维铁磁伊辛模型(Ising model),其中 c1 = c2 = 0 而 c3 < 0。
    该模型由拉斯·昂萨格(Lars Onsager)使用比我们之前用于一维反铁磁链更复杂的组合方法求解。伊辛模型最引人注目的结果是,在低温下存在无限程的铁磁序,即使没有任何外磁场。这意味着系统的大部分形成一个连通区域,其中所有自旋指向同一方向。缺陷表现为指向相反方向的小自旋岛,随着温度升高,无序度增加。在铁磁体中,在一个临界温度 TCurie,即居里温度(Curie temperature)处,发生相变,无限程序消失。如果某特定自旋向上,那么邻近自旋仍然更可能向上而不是向下,但远处自旋向上的概率随着距离增加趋近于 1
    2。
    10.13
    关于相变的一点介绍
    许多材料的物理特性会在某个精确温度下发生剧烈变化。水结冰和沸腾是这些转变最熟悉的例子,这些转变被称为相变(phase transition)。相变发生在系统的热力学行为出现不连续性,甚至外观也往往发生改变之时。在大气压下,水在273 K(精确到度)结冰成冰,蒸汽在373 K变成液态水。冰明显不同于液态水或蒸汽,因为它是晶态固体,融化1克冰需要334焦耳的热量,这称为潜热(latent heat)。水与蒸汽之间的区别则不那么容易识别。在373 K时水的性质确实存在不连续性,因为在此温度将水转化为蒸汽需要大量的潜热。在大气压下,将1克水从273 K加热到373 K大约需要420焦耳,然后再需要2270

344
热力学


蒸汽
三相点
临界点
P
atm

100
T oC
0
0.006
1
218
0.01
374
图 10.15 水的 T, P 相图示意图。(三相点附近区域已放大,且冰-水共存曲线的斜率被夸大了。)

将水转化为蒸汽所需的焦耳数。这就是为什么将水壶中的水全部烧开需要很长时间。蒸汽的体积也比水的体积大得多,并且蒸汽的熵大于水的熵。

我们遇到过其他类型的相变,例如,玻色气体的玻色-爱因斯坦凝聚(Bose–Einstein condensation),当温度低于临界温度时,有限比例的原子处于单粒子基态。固体材料中还存在与其电性和磁性相关的相变,例如铁磁体的居里温度(Curie temperature),低于该温度时,由于原子自旋的净排列,铁磁材料会自发获得净磁化强度。还有其他相变,其中固体的晶体结构发生转变。例如,铁的晶体结构在1044 K的临界温度下从体心立方转变为面心立方。(有关这些堆积的描述,请参见图9.20。)这与铁在其居里温度1043 K时的铁磁转变有关。其他相变发生在混合物和化学溶液中,例如液晶。另一个例子是超导现象,当某些材料被冷却到临界温度以下时,超导性会突然出现。低于此转变温度时,超导体会排出穿过材料的任何磁场,并且其电阻消失,因此任何电流都将无限期地持续下去。少数能够严格证明会发生相变的模型系统之一是二维伊辛铁磁系统(Ising ferromagnetic system),如前所述。

不同相的一个基本特征是,它们可以在相互接触的系统(例如,水与蒸汽接触)中共存,并且仍然处于平衡状态。我们从一般热力学考虑得知,处于平衡状态的系统必须具有相同的温度、压力和化学势。否则,它们会交换能量或粒子,或者分隔它们的界面会移动。让我们假设自变量是温度和压力,所有其他热力学量都是这些变量的函数。特别是,相 I 和相 II 的化学势是两个不同的函数 μI(T, P) 和 μII(T, P)。然后,在 (T, P) 平面上,当 μI(T, P) = μII(T, P) 时,两相可以在相变曲线上平衡共存。这是一个将 P 与 T 联系起来的单一方程。(μI 是在相 I 区域内定义的函数,但理论上可以将其范围扩展到该曲线之外的相 II 区域,尽管相 I 在那里是不稳定的。类似地,μII 可以扩展到相 I 区域。这与过冷和过热(supercooling and superheating)现象有关。)

图 10.15 是 (T, P) 平面中的典型相图。许多系统具有三个或更多不同的相。三个相只能在 (T, P) 平面中的孤立点具有相等的化学势。三相共存的点称为三相点(triple point)。

如果绘制在 (V, T) 平面中,相图看起来会有所不同。这里,V 表示固定质量物质的总

关于相变的一点知识
345
临界点
过热蒸汽区域
P = 常数
饱和液体-蒸汽区域
V
T
1
I
II
2
压缩液体区域
T
图 10.16 V, T 相图。

体积,因此两相的体积并不相同。典型的液-气相图在 (V, T) 平面中如图 10.16 所示。

346
热力学
沿着固定温度线 ( T = eT ) 向右移动,在区域 I 中,体积在增加但很小,物质为纯液体。压强在降低,但图中未显示。
在曲线 1 上,相变开始,在曲线 1 与曲线 2 之间,存在液态和气态共存并接触的样本。两条曲线之间体积增加,液体比例从 1 减小到 0,但压强和温度保持不变。
在曲线 2 处为纯气体,在区域 II 中,体积继续增加,压强再次降低。
潜热与 ((T, P)) 平面中相分离曲线的斜率之间有一个有趣的关系,称为克劳修斯–克拉佩龙关系 (Clausius–Clapeyron relation)。紧邻曲线左侧和右侧的点代表系统分别处于相 I 和相 II。
在这样两个点上,(T)、(P) 和 (\mu) 的值均相等,并且由于相变中粒子不会产生或消灭,(N) 也具有相等的值。因此吉布斯自由能 (Gibbs free energy),(G = \mu N),在这两点具有相等的值。当系统穿过相分离曲线时,发生不连续跳跃的量是熵 (S) 和体积 (V)。我们将曲线两侧的这些量分别记为 (S_I, V_I) 和 (S_{II}, V_{II})。我们也将两侧的吉布斯自由能记为 (G_I) 和 (G_{II}),尽管它们相等。
现在考虑沿曲线作一无穷小移动 ((dT, dP)) 至相邻的一对邻近点。沿曲线两侧 (G_I) 和 (G_{II}) 的无穷小变化相等。因此,由于 (dG = -S dT + V dP + \mu dN),且粒子数固定,
[
-S_I dT + V_I dP = -S_{II} dT + V_{II} dP ,
\tag{10.130}
]
所以
[
(S_{II} -S_I) dT = (V_{II} -V_I) dP ,
\tag{10.131}
]
这意味着沿曲线,斜率为
[
\frac{dP}{dT} = \frac{S_{II} -S_I}{V_{II} -V_I} .
\tag{10.132}
]
一般来说,(T dS) 是无穷小的热量。在相变中,(T) 恒定,我们可以对此积分并推出 (T(S_{II} -S_I)) 是该相变的潜热 (L)。因此方程 (10.132) 可重新表示为
[
\frac{dP}{dT} = \frac{L}{T(V_{II} -V_I)} ,
\tag{10.133}
]
这就是克劳修斯–克拉佩龙关系(图 10.17)。相变曲线的斜率正比于相变所需的潜热。(L) 和 (V) 都是广延量,因此斜率不依赖于所涉及物质的量。在液体到气体的转变中,(L) 和 (T) 为正且 (V_{II} \gg V_I),故斜率为正,这意味着压强增大时,沸点升高。这就是为何高压锅(蒸汽被部分封闭)能加快烹饪,也是为何在高山上(那里大气压低于海平面)水在低于 373 K 的温度就沸腾的原因。
在冰熔化为水的相变中,液态水的体积小于等质量固态冰的体积。这是冰的晶体结构带来的一个令人惊讶的结果,如 9.4.1 节所述。由于 (L) 和 (T) 为正,克劳修斯–克拉佩龙关系

霍金辐射
347
T+ dT
P + dP
I
GI= GII
GI< GII
GI>GII
II
T
P
图 10.17 克劳修斯-克拉珀龙关系。
这意味着,随着压力降低,熔化温度升高,但效应非常微小,因为 VII 与 VI 非常接近。在约为大气压的百分之一的压力下,水具有三相点。在更低的压力下,液态水不再存在,如图 10.15 所示。
10.14 霍金辐射
在6.11.1节中,我们证明了质量为M的非旋转黑洞的事件视界是一个表面积为
A = 4πr^2_S = 16πG^2M^2 , (10.134)
的球面,其中 rS 是施瓦西半径(Schwarzschild radius)。任何落入黑洞的物质都会增加其质量,同时也增加其面积。如果两个质量为M的施瓦西黑洞合并,产生的质量为2M的黑洞面积为 64πG^2M^2,这大于两个原黑洞面积之和 2 × 16πG^2M^2。这通常是正确的,即使黑洞在旋转或带电也如此。实际上,从非常一般的假设出发,斯蒂芬·霍金(Stephen Hawking)于1971年证明,在任何过程中,宇宙中黑洞事件视界的总面积 A 必定增加:
dA/dt ≥ 0 . (10.135)
这被称为黑洞面积定理(black hole area theorem)。
大约在同一时期,雅各布·贝肯斯坦(Jacob Bekenstein)担心,黑洞似乎提供了一条途径,宇宙可能由此损失部分熵。任何落入黑洞的物质都与它所包含的熵一起,永远无法回到宇宙的其他部分。这似乎是一种减少宇宙熵的方式,这将会违反……

348
热力学
热力学第二定律,这实在令人困惑。到1972年,贝肯斯坦(Bekenstein)意识到,如果有可能为黑洞赋予一个熵值,或许就能找到解决之道。贝肯斯坦注意到霍金的面积定理与热力学第二定律之间的相似性,试探性地提出两者之间可能存在精确的对应关系,即黑洞的面积实际上就是其熵的量度。当物质落入黑洞时,其事件视界的面积会增加。如果将此解释为黑洞熵的增加,那么它或许能补偿宇宙其余部分熵的损失。但这怎么可能呢?黑洞的面积定理是广义相对论中的一个几何结论,而热力学第二定律则是关于热量的统计规律。此外,当时人们认为黑洞本质上没有特征,仅由其质量、角动量和电荷来描述。它们怎么可能具有任何统计性质呢?

霍金起初否定了贝肯斯坦的想法。如果赋予黑洞一个熵,那么黑洞必定表现得像一个具有确定温度的物体,因此它必须发出辐射。这与当时关于黑洞的所有认知相矛盾。在广义相对论中建立黑洞模型时,其温度必须为零,因为虽然辐射可能落入黑洞,但没有任何东西能从中逃逸出来。然而,霍金很快意识到,如果考虑量子力学,情况将大不相同。广义相对论运作得极其出色,它是我们拥有的最佳引力理论,但它是一个经典理论。实际上,世界是量子力学的,因此终极的引力理论必须是一个量子理论。霍金证明,一个量子的黑洞确实会发射辐射,即现在所称的霍金辐射(Hawking radiation),因此具有非零的温度。

霍金的面积定理(10.135)常被称为黑洞力学第二定律,继贝肯斯坦之后,它被视为热力学第二定律(10.14)的类比。进一步追寻这种类比,黑洞力学第一定律,即热力学第一定律(10.22)的类比,应该将黑洞质量(或等价地,其能量)的变化与其事件视界面积的变化及其角动量J的变化联系起来。由面积-质量关系(10.134)可知,对于一个非旋转黑洞,有 dA = 32πG²M dM,因此 dM = (κ/8πG) dA,其中 κ = 1/(4GM)。这就是 J=0 时的第一定律。更一般地,对于旋转黑洞,黑洞力学第一定律为
dM = (κ/8πG) dA + Ω dJ, (10.136)
其中 Ω = a/(2Mr₊) 是事件视界的角速度,其定义见6.11.2节。如果黑洞还带有电荷,第一定律中还会有一项。

κ = 1/(4GM) 被解释为事件视界处的表面引力(surface gravity),它是物体表面所受到的引力加速度 g 在相对论中的推广。⁸ 表面引力 κ 在黑洞的事件视界上必须为常数,这为我们提供了热力学第零定律的类比,其中 κ 的某个倍数扮演着温度的角色。通过运用量子理论研究黑洞的光子发射,霍金计算出了一个黑洞具有霍金温度(Hawking temperature)
T_H = (¯h/2π) κ = (¯h)/(8πGM). (10.137)

⁸ κ 表达式的推导需要严格的广义相对论处理,但我们可以通过考虑史瓦西半径处的牛顿加速度来理解其形式,该加速度为 GM/r_S² = GM/(2GM)² = 1/(4GM)。

霍金辐射
349
由此,根据黑洞力学第一定律(10.136)可得
κ
8πG dA =
TH
4¯hG dA = TH dSBH,因此黑洞的熵为
SBH =
A
4¯hG 。
(10.138)
黑洞的温度,是由远离其事件视界的观测者根据黑洞发射的霍金辐射推断出的温度。所以,尽管黑洞内部可能发生难以置信的剧烈过程,它的温度却可能极低。事实上,恒星质量黑洞的温度低到无法测量。

要理解黑洞质量与其温度之间的联系,最简单的方法是考虑它所发射辐射的波长。根据量子力学,黑洞无法约束波长大于其事件视界的辐射。黑洞内部的电磁场在不断涨落。任何产生的、波长大于史瓦西半径的光子,都可能通过量子力学隧穿效应跑到黑洞外部,并逃逸到远处的观测者那里。如果霍金辐射的典型波长 λH ≃ rS = 2GM,那么其频率 ωH = 2π/λH ≃ π/GM,由此我们可以粗略估算霍金温度。利用将黑体辐射峰值频率与温度关联起来的方程(10.109),我们得到
TH ≃¯hωH
2.8 ≃π
2.8
¯h
GM 。
(10.139)
霍金更精确的计算给出了温度(10.137)。

恒星质量黑洞的史瓦西半径为几千米,因此其霍金辐射的典型波长也是几千米,对应的温度低于 10^−7 K。这个温度如此之低,以至于这样的黑洞不可避免地吸收的辐射多于它发射的辐射。宇宙沐浴在一种称为宇宙微波背景的辐射中,这种辐射产生于大爆炸后不久。它的谱对应约 2.7 K 的黑体温度,远高于恒星质量黑洞的霍金温度。

由于霍金辐射的波长与事件视界的大小相当,史瓦西半径为几百纳米的黑洞将发射可见光谱范围内的辐射,其温度因此在 10^3 K 量级。这对应于质量为 10^20 kg 的黑洞。霍金猜测,这种微型黑洞可能是在大爆炸后不久宇宙极其致密时形成的。如果早期宇宙中的物质分布相当不均匀,一些更致密的区域坍缩形成黑洞,这种情况就可能发生。这些假想的微型黑洞被称为原初黑洞(primordial black holes)。例如,它们可能拥有与一颗小行星相当的质量,却被压缩到比原子还小的区域内⁹。因为温度高,微型黑洞会发射大量辐射,从而逐渐损失质量。随着质量的减小,它们的温度会进一步升高,从而提高其辐射速率。在一个失控的过程中,微型黑洞的温度会在其最后时刻急剧上升,直至它在一阵巨大的辐射爆发中消失。

目前,质量相当于一座山大小、约为 10^11 kg 的原初黑洞,应该正处于爆炸的边缘。质量略大的黑洞将继续以极低的速率发射辐射,
⁹ 一颗直径 1000 km 的大型小行星的质量约为 10^20 kg。

350
热力学
X射线和伽马射线将绵延无数纪元。天文学家搜寻过由微小黑洞爆炸所产生的伽马射线暴,但从未观测到过。无论它们是否真实存在,都毫无疑问的是,该理论的一般原理是正确的,黑洞确实会发出霍金辐射(Hawking radiation)。广义相对论、量子力学和热力学如此紧密交织,使得这些思想必定在宇宙的基本结构中扮演重要角色。这是第一个将量子力学与引力联系起来的结果,这也是它之所以跻身现代物理学最深刻思想之列的原因。黑洞熵的微观起源仍未完全理解,但该熵被认为对应于量子引力微观态数的对数,描述了时空度规的量子涨落。

10.15
进一步阅读
K. 黄(K. Huang),《统计物理学导论》(Introduction to Statistical Physics),伦敦:Taylor and Francis,2001年。
L.D. 朗道(L.D. Landau)和 E.M. 利夫希茨(E.M. Lifschitz),《统计物理学(第一部分):理论物理学教程,第5卷(第三版)》(Statistical Physics (Part 1): Course of Theoretical Physics, Vol. 5 (3rd ed.)),牛津:Butterworth-Heinemann,1980年。
关于相变的综述,请参阅
J.M. 约曼斯(J.M. Yeomans),《相变的统计力学》(Statistical Mechanics of Phase Transitions),牛津:牛津大学出版社(OUP),1992年。
关于玻色-爱因斯坦凝聚的阐述,请参阅
C.J. 佩西克(C.J. Pethick)和 H. 史密斯(H. Smith),《稀薄气体中的玻色-爱因斯坦凝聚》(Bose–Einstein Condensation in Dilute Gases),剑桥:剑桥大学出版社(CUP),2002年。
关于光、光学、黑体辐射和激光的广泛综述,请参阅
I.R. 肯永(I.R. Kenyon),《神奇的光》(The Light Fantastic),牛津:牛津大学出版社(OUP),2008年。