无标题
10_Thermodynamics
10
热力学
10.1
引言
热力学统一了我们对物理世界的理解。它涉及我们称之为固体、液体和气体的整个物质范畴,因此在物理学、化学乃至生物科学中都具有重要意义。其巨大重要性可以从这一事实来判断:当热力学应用于电磁辐射时,触发了量子革命的序幕。热力学描述基本粒子的行为,它也在解释整个宇宙的演化中扮演着至关重要的角色,因为这在很大程度上是物质和辐射在膨胀时空中热的历史。相当令人惊讶的是,热力学对黑洞也有着重要的应用。
正如前几章所展示的,一个或两个物体的动力学很容易用数学来描述。但随着物体数量的增加,计算迅速变得难以处理。然而,当我们达到非常大的数量时,我们会到达另一个简化层次,再次有可能进行精确的统计或概率计算。这就是热力学的领域,也是物理学家常将这一分支学科称为统计力学的原因。每当一个物理系统由众多具有一定独立性、又有一定程度接触的子系统组成时,统计力学就适用了。经典的例子是由大量时不时碰撞的分子所组成的气体。
热力学始于我们对热和冷的感知。我们从日常经验中知道,这些性质与材料中容易观察到的变化相对应。例如,固态铁在熔炉中会从红色变为橙色。气体受热时会膨胀,而液体如水银和水也会膨胀。这些变化可用来标定温度标度,从而使我们能够构建测量温度的设备。传统上,温度是用水银温度计来测量的。如今,温度计通常依赖于与温度相关的材料电学性质的稳定变化。
当两个物体接触时,它们的温度会发生变化,并且经过足够长的时间后,它们会达到一个稳定的状态,称为平衡,此时它们的温度相等。我们总是观察到热量从温度较高的物体流向温度较低的物体,因此较热物体的温度降低,而较冷物体的温度升高。似乎不存在违反这一定律而达到平衡的路径。这引发了热量究竟是什么的问题。
物理世界. 尼古拉斯·曼顿(Nicholas Manton) 和 尼古拉斯·米(Nicholas Mee), 牛津大学出版社 (2017).
© 尼古拉斯·曼顿和尼古拉斯·米. DOI 10.1093/acprof:oso/9780198795933.001.0001
304
热力学
10.1.1
何为热?
18 世纪的自然哲学家们认为热是一种流体,他们称之为热质(caloric)。这一想法的核心是,热物体比冷物体含有更多的热质,当两者接触时,这种流体会从热物体转移到冷物体,从而升高冷物体的温度。热质被想象成一种守恒的流体,可以四处移动,但绝不会产生或消灭。显然,这种过于简单的理论无法解释一些关于热的很明显的事实。(即便如此,该理论的残余仍存留于现代世界中。我们谈论热流,有些人还会计算他们的卡路里。)1798 年,本杰明·汤普森(Benjamin Thompson),也被称为伦福德伯爵(Count Rumford),发表了他的产热实验结果。伦福德测量了由机械功引起的温度变化。他研究的对象之一是炮筒的镗孔加工,这需要多队马匹施加非常大的功。伦福德证明,这一过程中产生的热量可以用来将大量水烧开,而且只要镗孔持续进行,就似乎有取之不尽的热量供应。结论很清楚。热不可能是包含在炮筒金属内部的一种流体,相反,它是由马匹的劳动所驱动的镗孔设备通过摩擦传递给金属的。这表明了产生温度变化的热,与通过多种力的作用传递给材料的能量即机械功之间,存在着紧密联系。因此,很自然地可以假设热是能量的一种形式。
认识到功可以转化为热,对于将能量概念拓展到动能和势能这些力学概念之外至关重要。在诸如燃料燃烧之类的化学反应中,常常会释放出热量,所以能量变化在化学中扮演着重要角色。储存在各种物质中的化学能,可以通过测量化学反应中产生的热量来确定。这让我们兜了一圈又回到了原点,因为伦福德观察到的马匹所产生的能量来自它们的食物,而食物的化学能可以通过直接将其燃烧来测量。物理和化学的能量概念在此于生物过程的领域中统一起来,而且尽管总能量必须守恒,但热本身并不守恒。
理解热与机械能之间关系的需求,随着工业革命期间蒸汽动力发展而变得更加紧迫。在发动机中,热部分地转化为功。热力学正是从对蒸汽机锅炉和活塞中热与功相互作用的理论分析中发展出来的。事实上,热力学(thermodynamics)这个词由两部分构成——它关乎的是温度与动力学之间的关系,也就是热、力和运动之间的关系。
10.1.2
理想气体定律
1662 年,罗伯特·玻意耳(Robert Boyle)发表了他关于气体实验的记述。他证明,在固定温度 T 下,一定质量气体的压强 P 和体积 V 成反比,这一结果此后被称为玻意耳定律(Boyle’s law)。七十年后,数学家丹尼尔·伯努利(Daniel Bernouilli)指出,玻意耳定律可以通过假设气体由不断进行无规则运动的小粒子组成,这些粒子持续地彼此碰撞并与容器壁碰撞来加以解释。这一洞见在超过一个世纪的时间中无人跟进,而后它将成为气体动理学理论(kinetic theory of gases)的基石。
引言
305
在动理学理论中,理想气体被模型化为大量的点粒子,当它们彼此分离时不发生相互作用,而发生完全弹性碰撞。这一模型是对许多实际气体在其沸点以上温度下的有效描述。当气体的密度远低于其液相或固相时,该模型效果良好;而在高压下,当分子间力和分子的有限大小变得重要时,该模型便会失效。氦气提供了理想气体的最佳物理实现,但其他由非极性分子构成的气体,如干燥空气中的氮气和氧气,也是很好的例子。相比之下,水蒸气则不符合,因为水分子是极性的,彼此之间有强烈的相互作用。理想气体的物理性质之间满足如下简单关系,该关系是玻意耳(Boyle)定律的推广:
PV = A(T + T0) .
(10.1)
这被称为理想气体状态方程,实际气体在不同精度下近似遵守此式。该定律的一个重要特征是包含了附加常数温度 T0,其值约为 273°C(摄氏度)。这一常数由实验确定,并且发现对于所有能良好近似为理想气体的气体都是相同的。常数 A 与气体的质量成正比,我们稍后将对其数值进行更精确的说明。
实际上,当用汞温度计测量温度时,理想气体状态方程并不被严格满足。这是因为基于液体(如汞)热膨胀的温标并非完全令人满意。基于固体物理性质(如电阻率)的温标同样如此。液体和固体是由大量原子以复杂方式相互作用而形成的材料。它们的物理性质与温度之间的任何线性关系可能在某个温度范围内很好地近似成立,但期望这样的关系完全精确是不现实的。定义温度的一个更好方法是利用理想气体的性质,此时我们可以将方程(10.1)作为温度的定义。
加上常数 T0 的偏移意义重大。它使我们能够将 Tabs = T + T0 定义为绝对温度,并建立起一个从零向上的绝对温标。这就是开尔文温标,以威廉·汤姆孙(William Thomson)的名字命名,他后来被授予开尔文勋爵(Lord Kelvin)爵位。Tabs 以开尔文度为单位,记作 K。在开尔文温标下,水的冰点约为 273.15 K,沸点约为 373.15 K。反过来,−273.15°C 是温度的绝对零度。在该温度下,理想气体将不施加任何压强。换言之,一个有限的压强会将理想气体压缩到零体积。从现在开始,我们将改变符号,始终用 T 表示绝对温度。因此理想气体状态方程变为
PV = AT .
(10.2)
当然,理想气体是一种数学构造。在现实世界中,我们只能通过测量实际物质的性质来确定温度,但我们知道,在足够低的压强下,所有气体都表现得像理想气体。因此我们可以将温度定义如下:
T = 1/A lim_{P → 0} PV .
(10.3)
实验物理学家已经开发出精巧的制冷技术来降低实际物质样品的温度。随着温度越来越接近绝对零度,这一过程变得越来越困难,但
306
热力学
温度趋近绝对零度,且事实证明不可能达到负的绝对温度,甚至连绝对零度本身也无法达到。
10.1.3 热的微观起源
如果一个热的物体比冷的物体包含更多的能量,人们自然会问这些能量是以何种形式存在的。第一个给出令人信服答案的人是亨利·卡文迪许(Henry Cavendish),他认识到加热固体会加剧构成该固体的粒子的振动。卡文迪许于1810年去世,与他大部分的成果一样,他对这个问题的分析也一直未予发表。然而,到了19世纪中叶,许多研究者也开始持类似观点。麦克斯韦(Maxwell)运用动力学理论,对气体的情况进行了统计上的分析。在理想气体中,粒子间的相互作用被忽略,因此每个粒子的能量仅由其动能 $\frac{1}{2}mv^2$ 组成,其中 $m$ 是粒子的质量,$v$ 是其速率。
麦克斯韦计算出,在室温下,空气中氮分子的平均速率约为 500 m s⁻¹,这比客机的最高速度的两倍还多。显然,空气整体并非以如此高速运动。更确切地说,是内部的分子在快速地但方向随机地运动着,并且它们不断地相互碰撞。动力学理论的成就之一,就是能根据气体组分粒子的速率来预测声音在该气体中的传播速度。¹
10.1.4 冰茶
热量总是从热的物体流向冷的物体,而绝不会从冷的物体流向热的物体,但为什么会这样呢?我们毕生与周遭世界互动的经验告诉我们,如果把冰放入茶中,冰总是会使茶冷却,而绝不会使茶变热。然而,我们从冰箱中取出的冰块含有相当多的热量;例如,它们的温度远比西伯利亚的冬日要高得多。也许这些热量中的一部分可以从冰中释放出来并加入到茶中,从而使茶变热并使冰进一步冷却。虽然这样做会守恒能量,但我们知道这从未发生过。
这一过程的不可能性在19世纪中叶通过引入一个新的量——熵 $S$ 得到了解释。熵的变化等于热量的变化量 $\Delta E$ 除以温度 $T$:
$$\Delta S = \frac{\Delta E}{T}. \tag{10.4}$$
对于给定的热量,高温下的熵变小于低温下的熵变。如果用 $T_h$ 表示高温,$T_l$ 表示低温,那么
$$\frac{\Delta E}{T_h} < \frac{\Delta E}{T_l},$$
所以
$$\Delta S_h < \Delta S_l. \tag{10.5}$$
这意味着当一定量的热量 $\Delta E$ 从热的物体传递到冷的物体时,总熵会增加。如果热量从冷的物体传递到热的物体,那么熵就会减少。我们对这两个过程中的第一个非常熟悉,但第二个过程从未发生过。这一观察结果被概括为以下的表述:
熵与温度
307
在任何允许的过程中,宇宙的总熵必定增加,这一事实最初由19世纪的工程师萨迪·卡诺(Sadi Carnot)在分析蒸汽机时认识到。
通过与能量守恒的比较,可以突出这一概念的目的。如果状态A与状态B具有相同的能量,那么状态A可能演变为状态B,反之亦然。能量守恒定律允许任何一种情况。相比之下,熵只能增加而绝不能减少的定律决定了过程发生的方向。它限制了宇宙演化的可能方式,并以某种方式与时间的流逝及我们对时间方向的感知相关联。然而,熵在引入时,其起源是一个谜。熵总是增加的规则或许提供了一种简洁的方法来判断哪些过程被禁止,但它并没有告诉我们为什么这些过程不被观察到。它们只是被简单地宣布为非法。我们需要找出导致基本热力学量——熵和温度——的微观变量。
如今,熵被认为是热力学中最基本的量。麦克斯韦(Maxwell)证明,我们无需了解每个原子或分子运动的细节,就能从统计上理解热量的总体效应。随机运动的宏观效应由温度的概念捕捉,但热量是一种无序的能量形式,而熵是这种无序性最直接的度量。路德维希·玻尔兹曼(Ludwig Boltzmann)基于经典动力学,将熵解释为由分子的随机速度产生。
然而,经典动力学的精确度是有限的。正如我们所见,当人们试图详细理解分子和原子,或者液体和固体的性质时,就需要量子力学。熵的最简单定义实际上建立在量子态之上。这就是我们接下来要考虑的内容。
10.2 熵与温度
一个简单的热力学系统依赖于两个独立的宏观变量,一个是热学类的,一个是动力学类的。这样的一对变量是温度 ( T ) 和体积 ( V )。其他变量对还包括能量 ( E ) 和压强 ( P )。理论上,最方便的一对是 ( E ) 和 ( V )。此时,( E ) 被称为内能,常记为 ( U )。它与分子不可见的热运动相关,但不包括系统作为一个整体运动时的动能,如果系统恰好处于运动中的话。
热力学变量自然地分为两类,称为强度量和广延量。强度量是系统不依赖于系统大小或物质数量的物理性质。这类变量包括密度、温度和压强。另一方面,广延量是可加的性质,与系统中物质的数量成正比。这类变量包括能量、质量和体积。
我们假设系统由非常大量的分子 ( N ) 组成,处在一个体积为 ( V ) 的容器中。这些分子表现为一个受哈密顿量控制的量子系统,该哈密顿量可能包含描述分子间相互作用的项。每个分子的波函数必须在容器壁处为零,因此在容器外找到粒子的概率为零。这个边界条件意味着能级依赖于 ( V ),但它们在很大程度上并不依赖于容器的形状。
在本节的其余部分,我们将假设体积 ( V ) 是固定的,只考虑改变系统能量所带来的影响。在10.3节,我们将考虑同时改变能量和体积的影响。
308
热力学
单个分子的能级间隔随其能量增加而减小。对于由N个分子组成的系统也是如此,当总能量E增加时,系统的总能级密度以惊人的速度增长。
我们将Ω(E)定义为N粒子系统中能量介于E − ∆E与E之间的独立量子态数目。∆E取非常小的能量,小于实验中可能达到的能量分辨率,但其精确值并不十分重要。粗略地说,Ω就是系统在能量E处的状态数。更精确地有,
Ω(E) = g(E) ∆E , (10.6)
其中g(E)是态密度,即E附近单位能量间隔内的状态数。
在宏观物理系统中,Ω随能量的增长如此之快,以至于我们也可以将Ω(E)定义为能量低于E的量子态数。虽然这听起来颇为不同,但实际上几乎是一样的,因为能量显著低于E的状态数与那些非常接近E的状态数相比,可以忽略不计。这里可以类比高维空间中单位半径球体的表面积。该面积本质上与球体的体积相同,因为几乎所有的体积都非常靠近表面。
统计力学的一个基本假设是:除了能量之外,没有任何东西能显著区分系统的状态。因此,如果系统具有能量E且处于平衡态,那么系统处于该能量下任一可及状态的概率是均等的。于是,所有能量为E的状态均以相同的概率1/Ω(E)出现。这是统计力学的基石。对这一陈述的最好辩护是,它表达了我们对N个粒子微观状态中除总能量之外所有细节的完全无知。因此,除E之外,唯一重要的量就是状态数Ω(E)。这使我们得以把握热系统中无序的概念。
Ω和g都极其巨大;它们指数依赖于N。一个桌面上的系统通常具有超过N = 10²³个分子。任何形如exp cN的数(其中c是一个不大的系数,而N具有如此量级)几乎都难以想象。这种指数依赖性可以这样理解。任何热力学系统都可以视为由接触很弱的子系统构成。例如,一份气体样品可以看作沿一个共同界面接触的两个较小样品。对于相互作用微弱的两个系统,联合系统的量子态可表示为Ψ = Ψ₁Ψ₂,其中Ψ₁遍历系统1可及的所有状态,Ψ₂遍历系统2可及的所有状态。因此,联合系统的状态数为Ω = Ω₁Ω₂。这一乘法规则与Ω指数依赖于粒子数的事实相容,因为如果系统是同类型的,且Ω₁ = exp cN₁,Ω₂ = exp cN₂,其中N₁和N₂分别是两个系统中的粒子数,那么Ω = exp cN,其中N = N₁ + N₂是总粒子数。
我们定义系统的熵S为
S(E) = log Ω(E) , (10.7)
尽管它仍然巨大得难以置信,但已变得更容易处理,因为它大致与N成比例。熵是一个广延的、可加的函数。对式(10.6)取对数,我们²
² 注意,这是针对N粒子系统的,而非如8.2.1节中那样针对单个粒子。
熵与温度
309
我们会发现,实际上 (S(E) = \log \Omega(E) = \log g(E)),因为 (\log \Delta E) 是固定的且不与 (N) 成比例。根据熵的概念,基本假设是:处于能量 (E) 的每个量子态出现的概率为
(\frac{1}{\Omega(E)} = e^{-S(E)})。熵常被描述为无序度的量度。这里所说的无序度,是指系统可及的物理状态数 (\Omega(E)) 的对数,它反映了我们由于对系统微观细节缺乏精确了解而无法区分这些状态的能力。³
熵仅仅是对状态进行计数,它与温度有何关联?让我们考虑两个体积固定但类型未必相同的系统。首先假设这两个系统不接触,它们的能量分别为 (E_1) 和 (E_2),熵分别为 (S_1(E_1)) 和 (S_2(E_2))。组合系统可及的总状态数是两个系统各自可及状态数的乘积,即 (\Omega = \Omega_1 \Omega_2 = e^{S_1(E_1)} e^{S_2(E_2)})。取对数后,总熵为
[
S = S_1(E_1) + S_2(E_2) .
\tag{10.8}
]
接下来,使两个系统足够靠近以形成热接触,允许能量在它们之间流动,但不至于近到交换粒子的程度。总能量 (E = E_1 + E_2) 守恒,因此我们可以将 (E_2) 写为 (E - E_1),从而得到
[
S = S_1(E_1) + S_2(E - E_1) .
\tag{10.9}
]
热接触允许 (E_1) 发生变化。
现在,函数 (\Omega = \Omega_1 \Omega_2) 在某个特定的 (E_1) 值处具有一个极高且极窄的极大值。这是因为 (\Omega) 的巨大指数发生微小的分数变化,就会对 (\Omega) 本身产生巨大影响。因此,对于给定的总能量 (E),组合系统中绝大多数的状态都呈现出以此特定 (E_1) 值进行能量分配的特征。当能量在系统间流动之后,组合系统极有可能占据这些最概然状态之一。在初始的能量流动之后,(E_1) 将不再变化,我们就说此时组合系统已达到平衡。
(S) 在此特定 (E_1) 处同样具有一个极大值,尽管相对于 (\Omega) 而言不那么显著,也不那么尖锐。为了从热力学角度表征这个极大值,我们对 (E_1) 求导。极大值出现在
[
\frac{dS}{dE_1} = \frac{dS_1}{dE_1} + \frac{dS_2}{dE_2} \frac{dE_2}{dE_1} = 0 .
\tag{10.10}
]
由于 (E = E_1 + E_2) 是常数,(\frac{dE_2}{dE_1} = -1),因此平衡条件为
[
\frac{dS_1}{dE_1} = \frac{dS_2}{dE_2} .
\tag{10.11}
]
这为温度的热力学定义提供了动机。对于任何其熵作为能量函数(在给定体积 (V) 下)为 (S(E)) 的系统,定义该系统的温度 (T) 为
[
\frac{1}{T} = \frac{dS}{dE} .
\tag{10.12}
]
这个温度的定义甚至比基于理想气体状态方程的定义更为基本。一个能量为 (E) 的系统的热力学温度 (T),简单来说就是
³ 一个处于能量 (E) 的纯量子态本身并不会演化成无序态,但如果该系统与一个外部环境(即热浴)存在弱耦合,那么随着时间的推移,我们可以预期它会变得无序。
310
热力学
是系统态密度决定的S(E)图线斜率的倒数。T是E的函数。所有实际物理系统都具有S随E增加而增大的性质,因此T恒为正。无序度随能量增加。此外,斜率dS/dE随E递减,故温度随能量升高。方程(10.11)反映了两系统在平衡态具有相同温度的事实。这是温度最基本的性质,被称为热力学第零定律(zeroth law of thermodynamics)。
通过方程(10.12)定义的热力学温度T或许显得过于形式化,但它满足了运用温度和熵的现象学概念所发现的关键性质。从此以后我们将统一使用这一温度概念。
考察趋向平衡过程中能量流动的方向颇具深意。将方程(10.8)对时间求导,并注意到dE₂/dt = -dE₁/dt,可得
dS/dt = (dS₁/dE₁)(dE₁/dt) + (dS₂/dE₂)(dE₂/dt)
= (1/T₁ - 1/T₂) dE₁/dt. (10.13)
然而我们已经论证过,在两独立系统合并为单一系统的任何过程中,能量流动会驱动S趋向最大值,因此熵随时间递增:
dS/dt ≥ 0. (10.14)
因此当T₂ > T₁时dE₁/dt为正,此时E₁增加;若T₁ > T₂则dE₁/dt为负,E₁减少。两种情况下能量都从高温系统流向低温系统。这一表述及更普遍的方程(10.14)即热力学第二定律(second law of thermodynamics)。
热力学温标与理想气体温标的一致性并非显而易见。两者之间可能存在相当复杂的函数关系。所幸事实并非如此——正如我们将在第10.6节展示的,运用熵和温度的定义,通过量子力学第一性原理即可推导出理想气体的压强与熵。我们将发现理想气体温度实际上等同于热力学温度。
S无量纲,因此T具有能量量纲。这本是自然之事,但出于历史原因,实用温度以开尔文(K)计量,需借助转换因子k_B(即玻尔兹曼常数(Boltzmann’s constant))将开尔文温度与焦耳能量相关联。我们将取k_B=1,从而直接以能量单位作为温度单位。在原子物理学中,电子伏特eV是实用的能量单位,1 eV约对应10⁴ K。
使用无穷小量处理更为便利,可将方程(10.12)写作
dE = T dS. (10.15)
当系统能量变化与体积变化完全无关时,这部分能量即被视为热量。因此T dS就是无穷小热量。向系统添加热量时,内能增加导致温度上升。使系统产生单位温度变化(体积V固定)所需的热量称为定容热容量,记作C_V。更精确地说,热容量C_V = dE/dT,由方程(10.15)可得关系式
C_V = T dS/dT. (10.16)
热力学第一定律
311
可以通过例如使用电阻电线圈供热来精确测定加入系统的热量。温度的变化也容易确定,因此CV易于测量。利用方程(10.16)并积分,即可计算熵S,公式为
S(T) −S( eT) =
Z T
e
T
CV
T dT ,
(10.17)
其中eT是某个固定的温度。与熵相关的无序度无法直接测量,因此该公式提供了计算系统熵的实用方法。然而,它留下了未定的可加常数S( eT)。不过,根据量子力学可知,任何量子系统都有唯一的最小能量基态。在绝对零度时,这是系统唯一可及的状态,因此Ω= 1,熵S(0) = log Ω= 0,这就固定了常数。这个关于任何系统在绝对零度时熵趋于零的命题被称为热力学第三定律。在积分(10.17)中取eT = 0,得到
S(T) =
Z T
0
CV
T dT ,
(10.18)
这样便可以通过热容测量来实验确定绝对熵⁴,尽管在实践中可能很难测量或估计直至绝对零度的CV。
10.3 热力学第一定律
热力学第一定律是关于热力学中当系统的能量E和体积V都可变时能量与熵的精确陈述。能量E处的状态数为Ω(E, V ),熵为
S(E, V ) = log Ω(E, V ) 。
(10.19)
温度现在通过偏导数定义,
∂S
∂E
V
= 1
T ,
(10.20)
这里我们采用了标准记号,竖线下标表示求偏导数时固定不变的变量。(在此情形中体积V是固定的。)由于S总是随E增加,可以将E视为两个独立变量S和V的函数。
当气体(或液体)体积增大时,会对周围介质做功,结果气体的部分内能会损失。假设外部压力略小于内部压力,因此膨胀是稳定而非爆炸性的;这样系统在膨胀时保持平衡。进一步假设系统膨胀时没有热量进入或离开。这样的膨胀称为绝热过程,而
⁴还有来自温度T以下相变时潜热的额外贡献。
312
热力学
活塞初始位置
活塞最终位置
面积 A
∆x
∆V = A∆x
图 10.1 活塞。
这种膨胀的一个好例子是,一团空气被风卷起并越过山顶。气压随高度略有下降,因此这团空气膨胀、损失能量并冷却,但在此过程中,它基本上不与周围空气发生热量传递。
压强 P 是气体施加在容器壁或周围气体区域(即使没有分隔壁时)上单位面积的力。气体膨胀时所做的无穷小功为 P dV,其中 dV 是体积的无穷小增量。这是因为 dV 等于面积乘以移动的距离,如图 10.1 所示,所以 P dV 等于压强乘以面积再乘以距离。这又等于力乘以距离,即力所做的功。
在一个不涉及热量的过程中,所做的功必定来自气体的内能 E,因此
dE = −P dV . (10.21)
一个一般的热力学过程同时涉及热量和功,因此系统能量变化的普遍公式为
dE = T dS − P dV . (10.22)
这就是热力学第一定律。
热力学第一定律结合了两个陈述:在 V 固定时,T 是 E 关于 S 的导数;在 S 固定时,−P 是 E 关于 V 的导数。更确切地说,T 和 P 是以下偏导数:
T = ∂E/∂S |_V , P = −∂E/∂V |_S , (10.23)
并且两者同时是 S 和 V 的函数。两个通过薄的可移动隔板接触的系统,只有当它们具有相同的温度和压强时才处于平衡。
方程 (10.23) 有一个有趣的数学推论。混合二阶偏导数总是对称的,特别地,
∂²E/∂V∂S = ∂²E/∂S∂V 。因此,
∂T/∂V |_S = −∂P/∂S |_V . (10.24)
热力学第一定律
313
能量
图 10.2 能级的绝热变化。
这就是麦克斯韦关系(Maxwell relation)的一个例子。
我们将绝热变化定义为不涉及热量的变化。这种变化满足 dS = 0,因此 S 是常数。然而,根据我们的定义,S 是系统可用状态数的对数。这些思想是否一致?答案是肯定的。当气体膨胀时,体积增加,量子能级发生变化。通常,随着体积增加,能级会降低,但量子能级的数量不变,因此 S 保持恒定。能级的流动如图 10.2 所示。随着气体膨胀,初始能量附近众多可用的能级一起移动,变成靠近最终较低能量的相同数量的可用能级。如果系统占据其中一个能级,那么,随着能级的变化,系统将连续地跟随这个能级向下移动,因为在不加热以激发系统的情况下,量子系统在平稳缓慢的变化中不会发生跳跃。因此,熵不会改变。
10.3.1 新变量
我们强调过,一个简单的热力学系统由两个独立变量控制,一个是热学变量,一个是动力学变量。在热力学第一定律 (10.22) 中,独立变量被取为 S 和 V,但还有其他多种选择。一种方便的选择是,将容易测量的温度 T 和体积 V 作为独立变量。如方程 (10.20) 所示,T 与 S 的导数有关,因此这种变量变换需要小心处理。标准步骤是定义一个新的能量函数 F,即亥姆霍兹自由能(Helmholtz free energy,简称自由能),以赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)的名字命名。自由能是
F = E − TS (10.25)
它是 S 和 V 的函数,但可以通过将 E 和 S 用 T 和 V 表示,将其转换为 T 和 V 的函数。F 的无穷小变化为
dF = dE − T dS − S dT
= T dS − P dV − T dS − S dT
= −S dT − P dV , (10.26)
314
热力学
这里我们使用了莱布尼茨法则 d(TS) = T dS + S dT,然后利用热力学第一定律(10.22)替换了 dE。最终的表达式在形式上与第一定律相似,只是用 F 代替了 E。注意到在这个表达式中,只出现了新自变量 dT 和 dV 的无穷小变化。因此,将自由能视为函数 F(T, V ),我们看到
S = −∂F
∂T
V
,
P = −∂F
∂V
T
,
(10.27)
并且由此得出一个新的麦克斯韦关系 ∂S
∂V
T = ∂P
∂T
V。
P dV 是系统膨胀时所做的功。这等于系统在 dT = 0 时膨胀所减少的自由能,因此自由能是在温度保持恒定情况下可用于做功的能量。当然,在系统膨胀时要保持其温度不变,必须供给一些热量。自由能 F 是一个有用的概念,因为正如我们将看到的,它可以通过一种与将 TS 从 E 中减去并更换变量截然不同的方式计算出来。
另一个有用的自变量选择是 S 和 P。同样,定义一个修改过的能量函数是方便的。这就是焓 H,定义为
H = E + PV .
(10.28)
H 的一个无穷小变化是
dH
T dS −P dV + P dV + V dP
T dS + V dP ,
(10.29)
所以当 H 被视为 S 和 P 的函数时,有
T = ∂H
∂S
P
,
V = ∂H
∂P
S
.
(10.30)
在压力恒定的情况下,焓 H 是最有用的热力学能量函数。例如,它适用于处于正常大气压影响下的气体和液体。因此,H 对于化学家特别有意义,因为无论是在实验室还是在工业中,大多数化学反应都是在常压系统中进行的。
T dS 一如既往是热量,因此在恒定压力下,将系统温度升高一个单位所需的热量为
CP = T ∂S
∂T
P
= ∂H
∂T
P
.
(10.31)
CP 是恒压热容。
最后一个修改的能量函数是吉布斯自由能(Gibbs free energy) G,以乔赛亚·威拉德·吉布斯(Josiah Willard Gibbs)命名。(有时也称为吉布斯势,用 Φ 表示)。它结合了
子系统——吉布斯分布
315
从 E 到 F 以及从 E 到 H 的变换。吉布斯自由能定义为
G = E −TS + PV .
(10.32)
利用热力学第一定律和莱布尼茨法则,可求得
dG = −S dT + V dP .
(10.33)
因此 G 很自然地被视为强度变量 T 和 P 的函数,这两个变量都不依赖于系统的大小,并且
S = −∂G
∂T
P
,
V = ∂G
∂P
T
.
(10.34)
G 本身(如同 E、F 和 H)是广延量,意味着它与系统中的分子数 N 成正比。因此 G 可以表示为
G(T, P, N) = N eG(T, P)
(10.35)
其中 eG(T, P) 是每个分子的吉布斯自由能。^5
我们稍后将看到,eG 正是该热力学系统的化学势。每当粒子数可变时,例如在化学反应以及相变分析中,这是一个很有用的概念。
10.4 子系统——吉布斯分布
到目前为止,我们考虑的是一个具有给定能量 E 的宏观系统。熵 S 是该能量下可用量子态数的对数,并且假设在平衡时每个态被占据的概率相等。当系统与另一系统热接触时,能量可以在两系统之间传递,但一旦复合系统达到新的平衡且温度相等,能量的进一步涨落就可忽略不计。
现在我们来考虑初始系统的一个子系统,并假设整个系统已达到平衡。如果子系统是宏观的——例如,初始系统的 1%——那么该子系统将具有确定的能量,涨落可忽略不计。事实上,它的能量和熵将是总量的 1%,且子系统的温度与整个系统的温度相同。如果子系统是微观的,情况会更有趣。
微观子系统的一个例子是气体中的单个原子或分子,或是气体中的杂质粒子。由于子系统与系统的其余部分接触,它会通过与其余部分的碰撞来交换能量,因此它的能量会变化。在任何特定时刻,我们对子系统状态的不完全了解意味着,我们能期望的最佳描述是子系统各态被占据的概率。当系统处于平衡时,即使子系统自身的能量可以涨落,这个概率分布也不会改变。
^5 对 E 来说,类似关系式会是更复杂的表达式,E = N e E(S/N, V/N)。
316
热力学
让我们用一个整数 n 来标记子系统的独立量子态,并用 En 表示第 n 个态的能量。其中一些态在能量上可能是简并的。通常 n 从 0 取到 ∞,不过对于某些自旋系统,范围是有限的。
现在我们要确定子系统处于第 n 个态的概率。这个概率取决于 En 以及系统其余部分的温度 T。假设整个系统是孤立的,并且具有能量 E(0)。根据能量守恒,E(0) 是常数。如果子系统具有能量 En,那么系统其余部分的能量就是 E(0) − En。En 仅是 E(0) 的微观份额,但由于宏观系统的状态数量如此庞大,并且对能量极为敏感,我们必须把这个能量移动考虑进去。系统其余部分可以被视为一个热浴 (heat bath),当子系统具有能量 En 时,它的熵为 S(E(0) − En)。因为 En 很小,我们可以使用一阶泰勒展开 (Taylor expansion):
S(E(0) − En) ≃ S(E(0)) − En dS/dE (10.36)
= S(E(0)) − En/T , (10.37)
其中热浴的温度 T 是在能量 E(0) 处求值的。因此,热浴可用的状态数目为
e^{S(E(0)−En)} = e^{S(E(0))} e^{-En/T}. (10.38)
既然子系统处于一个确定的状态(第 n 个态),这也正是整个系统的状态数目。
现在再回到整个系统,但不固定子系统的状态。整个系统所有可用的状态都是等概率的,而 e^{S(E(0))} 是一个常数,所以子系统处于第 n 个态的相对概率就简单地正比于子系统处于这个态时可用的状态数目。这个概率是
P(En) ∝ e^{-En/T}, (10.39)
这被称为吉布斯分布 (Gibbs distribution),不过路德维希·玻尔兹曼 (Ludwig Boltzmann) 在一个更受限的背景下也知道了这个分布。
比例常数必须确定,以使总概率为 1。因此,我们定义一个量 Z,称为吉布斯和 (Gibbs sum) 或配分函数 (partition function):
Z = ∑_{n=0}^{∞} e^{-En/T}. (10.40)
当子系统是一个温度为 T 的系统的一部分时,它处于能量为 En 的特定状态的正确定归一化概率就是
P(En) = (1/Z) e^{-En/T}. (10.41)
配分函数是一个非常有用的量,值得重视。
需要着重指出,尽管子系统必须与热浴有热接触,但这种接触应当足够弱,以便子系统的能级 En 不致受到显著扰动。
子系统——吉布斯分布
不受接触的影响。换句话说,热浴的唯一作用是确定温度 $T$。如果子系统耦合更强,例如固体中的单个原子,那么它就不能被孤立出来单独考虑。
我们可以对吉布斯分布做一致性检验。一个宏观子系统的行为应该与它被孤立并自身构成一个完整系统时的行为相同。设其能量为 $E$。这样一个宏观子系统具有配分函数,其中求和 (10.40) 可以用积分代替:
$$
Z = \int_{E_{\text{min}}}^{\infty} g(E) e^{-E/T} dE .
\tag{10.42}
$$
$g(E)$ 是态密度,这对宏观子系统是有意义的。将 $g$ 用子系统的熵来表示,可得:
$$
Z = \int_{E_{\text{min}}}^{\infty} e^{S(E) - E/T} dE .
\tag{10.43}
$$
指数部分对 $E$ 有一个极大值,满足
$$
\frac{dS(E)}{dE} - \frac{1}{T} = 0 ,
\tag{10.44}
$$
这便将 $E$ 与温度 $T$ 按我们对任何热力学系统所期望的方式联系了起来。$Z$ 本身完全由该极大值紧邻区域对积分的贡献所主导,因此 $Z$ 可近似为
$$
Z = e^{S(E) - E/T} ,
\tag{10.45}
$$
其中 $S$、$E$ 和 $T$ 由方程 (10.44) 关联。取对数得到
$$
-T \log Z = E - T S(E) ,
\tag{10.46}
$$
而右边正是温度为 $T$ 的宏观系统自由能 $F$ 的定义,所以
$$
F = -T \log Z ,
\tag{10.47}
$$
或等价地,$Z = e^{-F/T}$。因此,与温度为 $T$ 的热浴接触的宏观系统的归一化吉布斯分布 (10.41) 为
$$
P(E) = e^{(F - E)/T} .
\tag{10.48}
$$
这便是系统处于能量为 $E$ 的某个特定微观状态的概率。
事实上,压倒性的概率是发现系统的能量等于热力学平衡值 $E$。对于这个能量,有 $F = E - TS$。因此概率 (10.48) 变为
$$
P(E) = e^{(E - TS - E)/T} = e^{-S} .
\tag{10.49}
$$
然而,由于能量为 $E$ 的状态有 $e^{S(E)}$ 个,某个特定状态被占据的概率确实应为 $e^{-S(E)}$。这样就完成了一致性检验。
对一个与热浴接触的宏观系统,偏离热力学平衡能量 (E) 的涨落是可能发生的,但显著的涨落概率可以忽略。在较低能量时,涨落受熵因子的抑制;在较高能量时则受能量因子的抑制。通过对这些能量涨落进行更精确的分析,可以估算其大小,结果发现它们取决于系统的热容。结论是:热力学温度为 (T) 的宏观系统,无论是否与热浴接触,都具有相同的热力学性质。
方程 (10.47) 表明了配分函数 (Z = \sum_n e^{-E_n/T}) 的用处。它提供了一条最直接的途径,从了解宏观系统的量子态出发,得到该系统的热力学性质。自由能 (F = -T \log Z) 是 (T) 和 (V) 的函数,因为能量 (E_n) 依赖于体积 (V)。根据方程 (10.27),(-F) 对 (V) 的导数就是压强 (P),而用 (T) 和 (V) 表示 (P) 的表达式称为状态方程。(-F) 对 (T) 的导数是熵 (S),再通过方程 (10.16),(S) 对 (T) 的导数决定了热容 (C_V)。对于一个由 (N) 个近似无相互作用的子系统组成的系统,例如 (N) 个原子或分子组成的稀薄气体,配分函数是相当容易计算的,我们将在第 10.6 节中看到这一点。
10.5 麦克斯韦速度分布
麦克斯韦(Maxwell)在推导出温度为 (T) 的理想气体中粒子速度的概率分布时,展示了统计力学的重要性。沿用麦克斯韦的思路,我们可以认为宏观容器中的分子在很好的近似下表现为经典行为。在这个极限下,量子力学预言的离散动量变为准连续的,通常的经典动能公式对每个分子都有效:
[
\varepsilon = \frac{1}{2m}(p_x^2 + p_y^2 + p_z^2) = \frac{1}{2}m(v_x^2 + v_y^2 + v_z^2) \tag{10.50}
]
其中 (\mathbf{v} = (v_x, v_y, v_z)) 是分子的速度,(m) 是其质量。势能取决于容器中分子间的相对位置,但这部分可以分离出来。如果分子间力是吸引力,分子倾向于轻微聚集在一起;如果是排斥力,分子则倾向于均匀散开,但分子的速度不受其空间排列的影响,最重要的是,每个分子的速度可以独立处理。
因此,每个分子速度的概率密度为
[
P(v_x, v_y, v_z) \propto e^{-\frac{m(v_x^2+v_y^2+v_z^2)}{2T}}. \tag{10.51}
]
这就是麦克斯韦分布,它是吉布斯(Gibbs)分布的特殊情况,适用于可用状态正好对应每个分子可能的动能范围的情形。正确归一化的概率密度为
[
P(v_x, v_y, v_z) = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} e^{-\frac{m(v_x^2+v_y^2+v_z^2)}{2T}}, \tag{10.52}
]
满足 (I = \int P(v_x, v_y, v_z) , dv_x dv_y dv_z = 1),这由高斯积分 (1.64) (\int_{-\infty}^{\infty} e^{-au^2} du = \left( \frac{\pi}{a} \right)^{\frac{1}{2}}) 可得。
麦克斯韦速度分布
319
0
0
3
2
5
2
7
2
T
CV
Trot
Tvib
图10.3 在低温下,双原子气体每分子的热容 (C_V) 等于 (\frac{3}{2})。在较高温度下,分子可能被激发到转动状态,热容相应增加。在更高温度下,分子还会被激发到振动状态。
运动方向均等可能,因此分子速率 (v) 的分布比速度分布更有意义。由 (v^2 = v_x^2 + v_y^2 + v_z^2),该概率分布为
[
P(v) = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} 4\pi v^2 e^{-\frac{mv^2}{2T}},
\tag{10.53}
]
平均速率和分布的方差很容易求出。特别是,每个分子的平均动能为
[
\langle K \rangle = \left( \frac{m}{2\pi T} \right)^{\frac{3}{2}} \int_0^\infty \left( \frac{1}{2}mv^2 \right) 4\pi v^2 e^{-\frac{mv^2}{2T}} dv = \frac{3}{2}T,
\tag{10.54}
]
此结果由高斯积分 (1.66) 得出。
气体中 (N) 个分子的总动能为 (N\langle K \rangle = \frac{3}{2}NT),如果气体由无相互作用、无结构的原子组成,这就是总能量 (E)。此时热容为
[
C_V = \frac{dE}{dT} = \frac{3}{2}N.
\tag{10.55}
]
测量热容是直接的,这为确定气体样品中原子数目提供了一种方法。历史上,这是建立物质原子图像的重要一步。
对于大多数实际气体,总能量还包括另外两种贡献。首先,如果气体不够稀薄,分子间的距离与分子间力的作用范围相当,……
320
热力学
分子间势能,大致为分子尺寸的量级,则必须计入势能。其次,分子的内部结构也可能有贡献,此时就会有与分子转动和振动运动相关的能量。(如果这些能量中的任何一种非常大,分子就会分解为原子,但这只发生在极高的温度下。)必须像方程(10.40)那样计算吉布斯求和,以求出每个分子的配分函数,而这要求对分子的量子态有相当多的了解。然而,在低温下,无结构分子或原子的理想图像成立。随着温度的升高,修正随之而来,首先是最低能量激发态的贡献。通常,分子的转动态能量最低,振动态能量较高,而原子内的电子激发能量更高。随着这些不同的量子态被占据,分子气体的热容随温度升高而增加,如图10.3所示。
10.6 理想气体——状态方程与熵
我们可以利用在8.2.1节提到的相空间中的态密度,计算理想气体的更多性质。单个无结构分子的配分函数z为
z =
∫ e^{-(p_x^2 + p_y^2 + p_z^2)/(2mT)} (d^3x d^3p)/(2πℏ)^3 。
(10.56)
在经典极限下,这个对分子位置和动量坐标的积分,每个空间维度带有一个归一化因子2πℏ,替代了对量子态的求和。指数部分是当只有动能ε有贡献时−ε/T的经典表达式。空间积分给出体积V,动量积分是高斯型的。计算这些积分得到
z = V/(2πℏ)^3 (2πmT)^{3/2} = V ( mT/(2πℏ^2) )^{3/2} 。
(10.57)
对于N个分子,总配分函数为
Z = (1/N!) z^N 。
(10.58)
因子z^N正确地计入了总能量,因为各个分子能量之和为E = ε_1 + ε_2 + ··· + ε_N,而积分遍历所有分子的位置和动量。组合因子N!补偿了对物理上不可区分的态的重复计数。根据量子力学,全同粒子无法被标记,因此分子的排列没有物理效应,如8.7节所讨论的。(这对费米子和玻色子都成立。)
我们感兴趣的是自由能F = −T log Z,而不是Z本身。代入方程(10.58),我们得到
F = −T log( (1/N!) z^N ) = −T( N log z − log N! ) 。
(10.59)
理想气体——状态方程与熵
321
现在,著名的关于 N! 的斯特林(Stirling)近似派上了用场:
N! ≃(2πN)
1
2 N Ne−N ,
(10.60)
而对于统计力学来说,一个足够好的近似是
log N! ≃N log N −N .
(10.61)
(下一项正比于 log N,当 N 的数量级为 10²³ 时可以忽略。)利用这个近似并提取出共同的因子 N,得到
F = −NT(log z + 1 −log N) = −NT log
ze
N
,
(10.62)
其中 e = 2.718 … 是欧拉(Euler)常数,即自然对数的底。代入方程 (10.57) 中的 z,我们发现在体积 V、温度 T 下,由 N 个分子组成的理想气体的自由能为
F = −NT log
V e
N
mT
2π¯h2
3
2 !
.
(10.63)
将其分为依赖于分子数密度 N/V 的项和仅依赖于温度的项,得到
F = −NT log
V e
N
−3
2NT log
mT
2π¯h2
.
(10.64)
自由能是广延量,因为它正比于 N,并且 F/N 仅依赖于强度量 N/V 和 T。如果没有 N! 因子的贡献,情况就不会如此。
现在我们可以计算压强 P 和熵 S。压强为
P = −∂F
∂V
T
= NT
V
.
(10.65)
这就是理想气体的状态方程。它就是理想气体定律 PV = NT,因此方程 (10.2) 中的常数 A 就简单地等于分子数 N。(如果包含玻尔兹曼(Boltzmann)常数,或者将分子数替换为气体的摩尔数,其形式会略有不同。)我们从第一性原理推导出了这个方程,这意味着我们相当抽象的温度定义 (10.12) 与方程 (10.3) 中定义的理想气体温标是一致的。
类似地,熵为
S = −∂F
∂T
V
= N log
V e
N
- 3
2N log
mT
2π¯h2 - 3
2N .
(10.66)
同样,这是一个广延量,但对温度和密度有着相当复杂的依赖关系。这个 S 的表达式仅在高温下有效,因为它依赖于……
322
热力学
这是对配分函数的经典估计。它不满足热力学第三定律:当 (T = 0) 时 (S = 0)。热容的表达式更简单,为
[
C_V = T \frac{\partial S}{\partial T}\bigg|_V = \frac{3}{2}N , \tag{10.67}
]
正如我们之前所得到的。其他有用的量,如能量、焓以及定压热容 (C_P),都可以轻松计算。
如果分子或原子具有内部结构,但气体仍保持稀薄,那么自由能的第二项对温度的依赖关系会有所不同,因为它源自方程 (10.56) 中的指数,其中会包含额外的项,因此气体的熵和热容会不同。然而,取决于体积的第一项保持不变,因而状态方程仍为 (PV = NT)。两个处于力学平衡和热平衡(即压强和温度相同)且体积相等的理想气体样品,因此含有相同数量的分子,正如阿梅代奥·阿伏伽德罗 (Amedeo Avogadro) 在 19 世纪初首先认识到的那样。通过称量这两个气体样品,可以求出它们分子量的比值。这使得化学家能够确定诸如 O₂、H₂O 和 CO₂ 等简单分子的原子结构。
10.7 非理想气体
分子间相互作用通常比原子间相互作用更为复杂,因此我们现在考虑单原子气体,例如稀有气体,其分子就是单个原子。即使单原子气体也会以多种方式偏离理想行为。随着密度的增加,两个原子靠得很近的几率上升,相互作用势能⁶ 的影响变得更大。在高密度和低温下,原子是费米子还是玻色子也变得重要起来。之前我们考虑了能量为 (\varepsilon) 的单原子态,并假设气体的 (N) 个原子独立地占据这些态。这在高温和低密度下是合理的,因为某个特定态被单个原子占据的概率远小于 1。在这种情况下,费米子和玻色子的行为相似。然而,在低温下,吉布斯分布告诉我们,低能态被占据的概率远大于高能态。最多只有一个费米子原子可以占据一个单原子态,而任意数量的玻色子原子可以占据这样一个态,因此现在组合因子不再是简单的常数 (N!)。无论哪种情况,原子之间都存在一种有效的相互作用,因此吉布斯分布被修改,这影响了气体的热力学性质。
对于接近理想的气体,有一种系统的方法来写状态方程,即按数密度 (N/V) 进行展开。这被称为维里展开 (virial expansion),其形式为
[
P = \frac{NT}{V} \left( 1 + \frac{N B(T)}{V} + \frac{N^2 C(T)}{V^2} + \cdots \right) . \tag{10.68}
]
首项当然给出了理想气体定律。(B(T)) 和 (C(T)) 分别称为第二和第三维里系数 (virial coefficients)。对于经典气体,(B(T)) 可以计算为一个积分,涉及……
⁶ 稀有气体原子之间存在非常弱的范德瓦尔斯力,这是由于原子中电子场的涨落产生的电偶极子所致。
化学势
323
只依赖于一对原子的相互作用势,但通常它对温度的依赖关系并不特别简单。最简单的非理想气体可以模拟为硬球原子气体,每个原子直径为l,因此原子中心不能彼此靠近到小于l的距离。这代表了原子之间的短程硬排斥。由于原子自身占据空间导致体积减小,其压强大于理想气体。对于硬球气体,人们发现第二维里系数与温度无关,等于(\frac{2}{3}\pi l^3)。即使对于硬球气体,(C(T))也更难计算,因为它与三原子相互作用有关。
对于费米子或玻色子气体,即使没有相互作用势因而原子之间没有吸引力或排斥力,维里系数也不为零。人们发现
[
B(T) = \pm \frac{1}{2g}\left(\frac{\pi \hbar^2}{mT}\right)^{\frac{3}{2}} .
]
(10.69)
这里上面的符号对应费米子,下面的符号对应玻色子。g是原子独立自旋态的数目,对于自旋为0的玻色子为1,对于自旋为(\frac{1}{2})的费米子为2。由于泡利(Pauli)不相容原理,费米子的压强高于经典理想气体的压强。对于玻色子则较低。
我们一直在讨论的效应发生在中等密度下,但在高密度下,真实气体通常会液化,至少在足够低的温度下是如此。这种不连续行为是一种相变,理论上更难理解。我们将在10.13节中讨论一些有关相变的内容。
10.8 化学势
一个系统的化学势(\mu),在10.3.1节末尾提到过,是一个与系统粒子数N的变化相关的强度量。在许多情况下,化学势起着重要作用。这些包括化学反应,其中各种化学物质的分子数目可能改变。当考虑气体系统的子体积时,化学势也很有用,因为粒子可以进入或离开。第三个例子是相变,其中粒子从一相转变为另一相。
(\mu)与N的关系颇为类似于T与E的关系。回想一下,孤立系统具有固定的能量E,而温度T是通过熵间接定义的。然而,我们也可以考虑一个与热浴接触而保持固定温度T的系统,此时能量E会调整到给定的温度。类似地,孤立系统通常具有固定的粒子数N,但往往很有用的是,考虑系统通过多孔膜与一个具有固定化学势(\mu)的粒子浴接触,然后N会调整,直到达到这个给定的(\mu)值。
正如我们曾证明两个热接触的系统在温度相等时达到平衡且熵最大一样,可以证明两个自由交换粒子的系统将达到化学势相等的平衡态。现在让我们更精确地定义化学势。
324
热力学
如果我们允许宏观系统的粒子数变化,那么能量是熵、体积和粒子数的函数,E(S, V, N)。于是化学势为
µ = (∂E/∂N){S,V},
(10.70)
这是一个熵 S 和体积 V 均固定的偏导数,并且第一定律推广为
dE = T dS − P dV + µ dN.
(10.71)
项 µ dN 必须包含在所有能量函数中,包括吉布斯自由能 G,因此
dG = −S dT + V dP + µ dN
(10.72)
且 µ = (∂G/∂N){T,P}。然而,回忆 G(T, P, N) = N \tilde{G}(T, P),其中 \tilde{G}(T, P) 是每粒子的吉布斯自由能,因此 (∂G/∂N)_{T,P} = \tilde{G}(T, P)。所以系统的化学势并非一个全新的量,而是等于每粒子的吉布斯自由能。总的吉布斯自由能为 G = µN。
现在考虑一个系统(不一定是宏观的)与一个远大于它的热与粒子库相接触,组合系统的总能量和总粒子数具有恒定值 E^{(0)} 和 N^{(0)}。我们关心的是发现该系统处于某个特定量子态的概率,该量子态下系统具有能量 E 并包含 N 个粒子。对于这样一个微观态,库将具有能量 E^{(0)} − E 和粒子数 N^{(0)} − N。与吉布斯分布的推导类似,我们可以对库的熵 S 做线性近似,
S(E^{(0)} − E, N^{(0)} − N) = S(E^{(0)}, N^{(0)}) − E/T + µN/T,
(10.73)
这里我们假设体积固定,并使用了第一定律的形式 dS = dE/T − µ dN/T。因此,组合系统可及的态数为
e^{S(E^{(0)}−E, N^{(0)}−N)} = e^{S(E^{(0)}, N^{(0)})} e^{(\mu N − E)/T},
(10.74)
而系统占据该微观态的概率为
P(E, N) = \frac{1}{Z_G} e^{(\mu N − E)/T}.
(10.75)
这是吉布斯分布在考虑粒子数可变情形下的对应形式。归一化因子 Z_G 确保总概率之和为 1,称为巨配分函数。概率分布 (10.75) 根据 T 和 µ 决定了 E 和 N 的平均值。对于宏观系统,这些平均值就是热力学值。
10.9 低温下的费米子气体和玻色子气体
当温度接近绝对零度时,费米子或玻色子气体表现出引人注目的性质。特别是玻色子,可以发生一种称为玻色–爱因斯坦凝聚的相变。
低温下的费米子与玻色子气体
325
我们假设气体由 N 个全同粒子组成,它们可以是费米子也可以是玻色子,盛放在体积为 V 的盒子中,且彼此之间没有直接相互作用。唯一的相互作用来自全同粒子多粒子波函数的量子性质。没有直接相互作用意味着我们可以处理每个单独粒子的能级,而由于盒子是宏观的,单粒子态具有准连续的能谱 ε。
如果粒子是费米子,一个单粒子态只能有 0 或 1 的占据数;如果是玻色子,则可以是 0 或任意正整数。在此情况下,化学势很有用,因为它避免了复杂的组合计算。我们可以将一个能量为 ε 的单粒子态视为一个与其余气体构成的热源和粒子源相接触的系统,该热源温度为 T,化学势为 µ。该态的占据数是可变的,当占据数为 n 时,系统的能量为 εn = nε,因此 µn − εn = n(µ − ε)。
根据分布 (10.75),令 N = n, E = nε,则能量为 ε 的单粒子态占据数为 n 的归一化概率为
P(n) = 1/z e^{n(µ−ε)/T} , (10.76)
其中 z = Σ_n e^{n(µ−ε)/T}。对于费米子,n = 0, 1,因此求和中仅有两项;对于玻色子,n = 0, 1, 2, …,因此求和是一个无穷几何级数,只要 µ < ε 便收敛且容易求和。这些单粒子配分函数为
z_F = 1 + e^{(µ−ε)/T} (费米子) , (10.77)
z_B = 1 / (1 − e^{(µ−ε)/T}) (玻色子) . (10.78)
10.9.1 费米–狄拉克函数
比这些概率分布更重要的是作为 ε 函数的平均占据数,
n(ε) = 1/z Σ_n n e^{n(µ−ε)/T} . (10.79)
对于费米子,z = z_F,n 取值为 0 和 1,故平均值为
n(ε) = e^{(µ−ε)/T} / (1 + e^{(µ−ε)/T}) = 1 / (e^{(ε−µ)/T} + 1) ≡ n_F(ε) . (10.80)
n_F(ε) 称为费米–狄拉克函数。图 10.4 给出了它在不同温度下的图像。对于能量 ε 小于 µ 的态,分母中的指数项很小,故平均占据数接近于 1;而对于能量大于 µ 的态,指数项很大,平均占据数接近于 0。由于指数与 1/T 成正比,这种过渡在低温下很陡峭,在高温下则比较平缓。零温极限情形是简并费米气体,此时所有低于 µ 的态都被占据,所有高于它的态都空着。此时 µ 是最高占据态的能量,即费米能 ε_F。在有限温度下,占据数在 ε_F 处的尖锐间断被展宽了。
326
热力学
0
–2
T = 0.1
T = 0.5
T = 1.0
–4
–6
–8
0
0.2
0.4
0.6
0.8
nF
1
2
4
6
8
ε –µ
图10.4 费米-狄拉克(Fermi–Dirac)分布函数。
假设盒中单粒子态的密度为g(ε),可能的能量从最小值εmin向上延伸。那么总粒子数N等于平均费米子占据数nF(ε)在整个可用能量范围内对态密度加权的积分,
N =
Z ∞
εmin
g(ε)
e
ε−µ
T
- 1
dε .
(10.81)
这给出了N作为µ和T的函数。通过反演这个表达式,可以确定µ作为N和T的函数。气体的总能量可由一个类似的积分得到,在被积函数中多一个因子ε。
对于T = 0时的简并费米气体,所有状态直到费米能量εF都被占据,因此µ = εF,且εF与N的关系为
N =
Z εF
εmin
g(ε) dε .
(10.82)
对于很小的T,µ与εF仅有微小差别,这个差别取决于靠近εF处的态密度g(ε)。
10.9.2
简并电子气体的压强
考虑体积为V的盒子中的N个电子。假设它们的电荷被背景离子的正电荷所屏蔽,因此电子可以被视为无相互作用。设温度很低,电子表现为简并费米气体。电子的动能从0向上延伸,态密度为
g(ε) =
V
2π2
(
2m
¯h2
)
3/2
ε
1/2 .
低于费米能量εF的所有状态都被占据,高于它的所有状态都空着。在8.7.1节中我们计算了简并电子气体的费米能量,也计算了N个电子的总能量,得到
E = 3(3π2)
2/3
5
¯h2
2m
(
N
V
)
2/3
N .
(10.83)
低温下的费米子和玻色子气体
327
简并电子气的态是N个电子能量最低的态,因此它是零温态。由于该态是唯一的,熵为零。
现在假设体积V变化。熵S保持为零,因此TdS为零,热力学第一定律简化为dE = −PdV。因此,简并电子气的压强为
P = −dE
dV = 2(3π2)
2
3
5
¯h2
2m
N
V
5
3
.
(10.84)
这种可观的压强,与密度的5/3次幂成正比,是泡利(Pauli)不相容原理的结果。它被称为电子简并压。状态方程为PV = NT的经典理想气体在零温时压强为零,但不相容原理要求几乎所有电子即使在零温下也具有正的动能,并且当体积减小时总能量增加,从而产生压强。这种压强在白矮星的演化中起着至关重要的作用,我们将在第13.7.1节中看到。
10.9.3
电子气的热容
在德鲁德(Drude)理论中,金属中的电子被视为经典的自由粒子气体。尽管这个早期理论取得了一些成功,但其关于电子对金属热容贡献的预测却缺乏实验支持。如果电子真的表现为经典的无相互作用粒子,我们会预期其能谱与第10.5节中讨论的理想气体的能谱相同。对于Ne个电子,热容将为3
2Ne,正如理想气体的方程(10.55)所给出的。在正常室温下,这超过了测量值的100倍。
要精确计算热容,必须使用量子理论。电子是费米子,因此量子态的平均占据数由费米-狄拉克(Fermi–Dirac)函数(10.80)给出。金属中的电子数密度很高,因此电子的费米能量εF远大于室温T。费米-狄拉克函数从1到0的跃变发生在εF附近约为T量级的相对较窄的能量范围内,因此热激发只影响一小部分电子——那些能量接近εF的电子。
我们现在将在远低于εF的温度下计算电子热容。电子费米气体的热力学能量为
Ee =
Z ∞
εmin
εg(ε)nF(ε) dε ,
(10.85)
其中g(ε)是态密度,nF(ε)是费米-狄拉克函数。态密度不依赖于温度,但nF依赖于温度,因此热容为
Ce = dEe
dT =
Z ∞
εmin
εg(ε)∂nF
∂T dε .
(10.86)
在低温下,化学势µ近似为εF,其温度依赖性可以忽略。令x = ε−εF
T
。费米-狄拉克函数则为
nF(x) =
1
ex + 1
.
(10.87)
328
热力学
其对温度 T 的导数为
∂nF
∂T = dnF
dx
∂x
∂T =
ex
(ex + 1)2
ε −εF
T 2
= 1
T
xex
(ex + 1)2 .
(10.88)
最后一个量可以重新表示为
1
T
x
(e
1
2 x + e−1
2 x)2 ,
(10.89)
这是一个关于 x 的奇函数,集中在 x = 0 附近,即集中在 ε = εF 附近。因此在积分 (10.86) 中,我们可以将积分范围拓展到 −∞ 到 ∞,将 g(ε) 视为常数 g(εF),并将能量因子 ε 替换为 (ε − εF) + εF = Tx + εF。常数 εF 由于乘以奇函数,对积分没有贡献。然后将 dε 替换为 Tdx,我们得到
Ce = Tg(εF)
Z ∞
−∞
x2
(e
1
2 x + e−1
2 x)2 dx .
(10.90)
这是一个标准积分,其值为 π2
3 。因此
Ce = π2
3 g(εF) T
(10.91)
在低温下。
在第 8.7.1 节中,我们计算了自由电子的态密度为
g(ε) = (2m3)
1
2
V
π2¯h3 ε
1
2 = 3
2
N(ε)
ε
,
(10.92)
其中 N(ε) 是能量不超过 ε 的电子态总数。因此,费米面处的态密度为 g(εF) = 3
2
Ne
εF ,因为 N(εF) = Ne,代入方程 (10.91) 得到
Ce ≃ π2
2 Ne
T
εF
.
(10.93)
由于室温下金属的 T ≪ εF,该热容远小于经典的 3
2 Ne。
在低温下,金属的热容可以表示为电子贡献与晶格振动贡献之和。晶格贡献和电子贡献的高阶修正都与 T 3 成正比。在低温下,与 T 成正比的电子贡献占主导地位。对于自由电子模型适用的金属,这个简单模型与热容测量值之间有合理的一致性。这些金属是货币金属和碱金属,其电子热容的预测值准确度在 10% – 30% 以内。
费米子气体与玻色子气体在低温下
329
10.9.4
玻色–爱因斯坦函数
对于玻色子粒子,每个单粒子态的平均占据数可以用与费米子相似的方法计算。利用概率分布 (10.76),其中 z = zB 来自方程 (10.78),我们求得平均占据数为
n(ε)
1
zB
∞
X
n=0
n e
n(µ−ε)
T
1 − e
µ−ε
T
∞
X
n=0
ne
n(µ−ε)
T
0 + e
µ−ε
T
+ 2e
2(µ−ε)
T
+ 3e
3(µ−ε)
T
+ · · ·
−0
−e
2(µ−ε)
T
−2e
3(µ−ε)
T
−· · ·
∞
X
n=1
e
n(µ−ε)
T
.
(10.94)
对于 µ < ε,该几何级数求和为
n(ε) =
e
µ−ε
T
1 − e
µ−ε
T
1
e
ε−µ
T
−1
≡ nB(ε) .
(10.95)
nB(ε) 称为玻色–爱因斯坦函数(Bose–Einstein function),它与费米–狄拉克函数(Fermi–Dirac function) nF(ε) 的区别仅在于分母中的 +1 换成了 −1。图 10.5 展示了函数 nB,同时也画出了 nF 以作比较。
nB(ε) 分母的形式意味着积分
Z ∞
0
xn−1
ex −1 dx
(10.96)
经常出现在玻色气体理论中,对不同 n。其值为
Z ∞
0
xn−1
ex −1 dx
Z ∞
0
xn−1(e−x + e−2x + e−3x + · · ·) dx
Z ∞
0
xn−1e−xdx +
Z ∞
0
x′
2
n−1
e−x′ 1
2dx′ +
Z ∞
0
x′′
3
n−1
e−x′′ 1
3dx′′ + · · ·
Z ∞
0
xn−1e−x dx
1 + 1
2n + 1
3n + · · ·
Γ(n)ζ(n) ,
(10.97)
其中 Γ(n) = R ∞
0 xn−1e−x dx,ζ(n) = P∞
k=1
1
kn 。Γ(n) 是欧拉伽马函数(Euler gamma function),ζ(n) 是黎曼泽塔函数(Riemann zeta function)。当 n 为正整数时,Γ(n) = (n − 1)!。另一个有用的值是 Γ( 3
2) = 1
2 π
1
2 。以下泽塔函数值也会用到:ζ( 3
2) ≃ 2.612,ζ(3) ≃ 1.202,ζ(4) = π4
90 。
单粒子态的能量范围从 εmin 向上延伸。nB(ε) 仅在 µ 小于所有允许能量 ε 时才有意义,因为平均占据数不能为负。
330
热力学
–2
–3
–4
0
0.5
1
1.5
2
n
2.5
3
–1
0
1
2
3
4
T
ε –µ
图10.5 玻色-爱因斯坦分布函数与费米-狄拉克分布函数(上下曲线)的比较。
当ε≫µ时,它们在渐近意义下相同,因为此时一个态上多重占有的概率可以忽略不计。其渐近形式为麦克斯韦-玻尔兹曼函数e
µ−ε
T
(中间曲线)。
因此µ < εmin。µ的值由总粒子数为N这一要求决定,这同样引出一个积分约束条件
N =
Z ∞
εmin
g(ε)
e
ε−µ
T
−1
dε .
(10.98)
对于小T,玻色-爱因斯坦函数随ε增加而迅速减小,因此若N固定,
µ必随T减小而自下方趋近于εmin。此时大多数粒子占据一个狭窄的激发态能区,其能量等于或略高于εmin。
值得注意的是,存在一个临界温度Tc,低于此温度时,只有有限比例的粒子能处于ε > εmin的态上。其余粒子全部处于能量为εmin的基态。此时基态被宏观地占据。这一现象被称为玻色-爱因斯坦凝聚(Bose–Einstein condensation)。
为求得Tc,我们假设基态是分立的且能量为εmin,但单粒子激发态具有准连续能谱,其态密度为
费米子与玻色子气体在低温下的行为
331
0
1 –
3/2
0
1
1
0
0.5
1
0.6
1.2
1.8
T
Tc
T
Tc
T
Tc
N0
N
N0
N
图10.6 左图:均匀三维盒子中玻色子凝聚体比例N0
N 随约化温度 T
Tc 变化的预测曲线。右图:三维谐振子阱中原子玻色-爱因斯坦凝聚体观测到的凝聚体比例随约化温度的变化。虚线为N0
N = 1 −( T
Tc )3的曲线。
g(ε)。对于质量为m、可在体积为V的盒子中自由运动的非相对论性自旋为0的玻色子,我们可以设εmin = 0。激发态的态密度为
g(ε) =
m3
2
1
2
V
π2¯h3 ε
1
2 .
(10.99)
当µ = 0时达到临界温度Tc。在此温度下,处于基态的粒子比例基本上仍为零,因此将g(ε)代入方程(10.98)并设µ = 0,可得总粒子数为
N
m3
2
1
2
V
π2¯h3
Z ∞
0
ε
1
2
e
ε
Tc −1
dε
mTc
2π¯h2
3
2
V 2
π
1
2
Z ∞
0
x
1
2
ex −1 dx
2.612 V
mTc
2π¯h2
3
2
,
(10.100)
其中我们代入了x =
ε
Tc 以得到n = 3
2 时的标准积分(10.96),然后利用了Γ( 3
2) = 1
2π
1
2 和ζ( 3
2) ≃2.612。因此,玻色-爱因斯坦凝聚的临界温度与数密度之间的关系由下式给出
N
V = 2.612
mTc
2π¯h2
3
2
.
(10.101)
在更低的温度下,µ保持为0,处于激发态的粒子数为2.612 V