8_Quantum_Mechanics_in_Three_Dimensions

8
三维量子力学

8.1 引言

就算符与测量而言,量子力学的基本原理在三维空间中与一维时本质上相同。薛定谔方程包含拉普拉斯算子(Laplacian) ∇² 而非 d²/dx²,并含有一势能 V(x),通常比一维情况下更难求解。然而,当势能具有球对称性时,这些困难会大大降低,寻找粒子态及其能量变得容易得多。一个物理上重要的例子是由原子中带正电的原子核产生的库仑势(Coulomb potential)。原子中的电子在这种吸引势中遵循薛定谔方程,其解出现在一组离散、无限的负能级上,这为原子结构提供了良好的解释。对于这些电子束缚态,位置概率密度集中在原子核周围,并随着远离中心而迅速衰减。在库仑势中,也存在正能量的电子散射态。三维空间中的散射是一个比一维更复杂的话题,因为散射粒子可以向各个方向出射;它们并非仅仅向前透射或向后反射。量子力学散射理论对于理解多种涉及粒子束的实验很重要,但我们不会详细讨论它。

在三维量子力学中,存在表征角动量的算符,这些算符在一维中没有对应物。当势能具有球对称性时,角动量与哈密顿量对易,稳态可根据角动量算符的本征值及其能量进行分类。其细节相当微妙,因为表示角动量三个分量的算符彼此之间并不对易。

20世纪20年代,人们发现粒子除了在绕其他粒子运动时所携带的角动量外,还具有内禀的量子自旋(spin)。自旋必须包含在总角动量中,因此即便是自由运动的粒子,例如不受势能束缚的电子,也携带着一定的角动量。这是基本粒子一个典型的量子力学特征。大多数粒子,包括电子、质子、中子和光子,都具有非零自旋,尽管少数粒子,包括π介子和希格斯粒子(Higgs particle),自旋为零。自旋可以是普朗克常数 ħ 的整数倍或半整数倍。

一个没有经典对应物的现象是全同粒子系统非凡的量子行为。例如,比氢更复杂的原子中的电子遵循一条量子力学规则,该规则以沃尔夫冈·泡利(Wolfgang Pauli)的名字命名为泡利不相容原理(Pauli exclusion principle)。

《物理世界》。尼古拉斯·曼顿(Nicholas Manton)与尼古拉斯·米(Nicholas Mee),牛津大学出版社(2017)。
©尼古拉斯·曼顿与尼古拉斯·米。DOI 10.1093/acprof:oso/9780198795933.001.0001

232
三维量子力学
泡利(Pauli)。相当令人惊讶的是,这直接源于它们的半整数自旋,因此尽管电子遵循泡利原理,π介子和光子却不遵循。
在本章末尾,我们讨论了经典作用量在量子理论中所扮演的角色。它出现在量子力学的一种重新表述——路径积分表述中。路径积分方法不仅揭示了量子力学经典极限的某些性质,也揭示了诸如粒子的德布罗意(de Broglie)波长等量子力学基本特征。

8.2 位置与动量算符
一维量子力学的一个关键思想是,经典动力学变量被替换为并非总是对易的算符。在三维空间中,我们需要三个独立的算符来表示粒子的笛卡尔位置坐标,以及三个算符来表示粒子的动量分量。这些算符记为 xi 和 pi (i = 1, 2, 3),它们都是厄米的,因此每一个都代表一个可测量的可观测量。这些算符整体上用矢量 x 和 p 表示。位置算符相互对易,这意味着它们是可以同时测量的。因此,一次测量可以确定粒子在三维空间中的位置。类似地,动量算符也相互对易,所以动量作为一个矢量也是可测量的。然而,与一维情况相同,位置算符并不都与动量算符对易。精确的对易关系为(其中 i, j = 1, 2, 3)

[xi, xj] = 0 ,
[pi, pj] = 0 ,
[xi, pj] = i¯hδij1 .
(8.1)

回想一下,当 i = j 时 δij 为 1,否则为零,而 1 是单位算符。位置–动量对易关系表明,例如 [x1, p1] = i¯h1,这类似于一维关系 (7.1),但 [x1, p2] = 0。因此,同时测量粒子在 1-方向的位置(通过某种扩展的平面装置)和 2-方向的动量是可能的。这些对易关系在原点平移或笛卡尔坐标轴旋转下保持不变,但如果我们使用非笛卡尔坐标,它们看起来会不同。因为位置算符相互对易,所以由它们构造多项式没有问题。其中最重要的是半径平方,r2 = x2
1 + x2
2 + x2
3。同样有用的是半径本身 r,尽管它是 r2 的平方根,但定义明确。两者都是旋转不变的标量算符。

与一维情况一样,我们需要位置和动量算符的一个方便的表示,以便作用于波函数。粒子的波函数 ψ(x, t) 是其位置和时间函数。位置算符通过乘法作用,xi 作用于 ψ(x, t) 得到新函数 xiψ(x, t)。由于函数 xixjψ(x, t) 和 xjxiψ(x, t) 相同,因此满足对易关系 [xi, xj] = 0。动量算符是偏导数的倍数,

pi = −i¯h ∂
∂xi
,
(8.2)

这是一维动量算符 (7.7) 的推广。用矢量形式表示即为 p = −i¯h∇。偏导数相互对易,这个结果我们之前已经用过多次,因此 [pi, pj] = 0。

位置和动量算符

233

位置-动量对易关系可以通过作用在一个一般的波函数上来验证:
[
[x_i, p_j]\psi =
x_i
\left(
-i\bar{h} \frac{\partial}{\partial x_j}
\right)
\psi -
\left(
-i\bar{h} \frac{\partial}{\partial x_j}
\right)
(x_i\psi)

-i\bar{h}x_i \frac{\partial\psi}{\partial x_j}
+ i\bar{h}
\left(
\delta_{ij}\psi + x_i \frac{\partial\psi}{\partial x_j}
\right)

i\bar{h}\delta_{ij}\psi ,
\tag{8.3}
]
这里我们像之前一样使用了莱布尼茨(Leibniz)法则,并利用了 (x_i) 对 (x_j) 的偏导数等于 (\delta_{ij}) 的结果。

我们可以从动量算符构造出其他算符。类似于半径平方,也存在动量平方¹,即标量算符
[
p^2 = p_1^2 + p_2^2 + p_3^2 .
\tag{8.4}
]
将动量算符用偏导数表示,我们得到
[
p^2 = -\bar{h}^2
\left(
\frac{\partial^2}{\partial x_1^2}

  • \frac{\partial^2}{\partial x_2^2}
  • \frac{\partial^2}{\partial x_3^2}
    \right)
    = -\bar{h}^2 \nabla^2 ,
    \tag{8.5}
    ]
    它是拉普拉斯(Laplacian)算符的倍数。

在经典动力学中,质量为 (m) 的粒子的动能为 (\frac{1}{2m}p^2),因此在量子力学中,动能表示为 (-\frac{\bar{h}^2}{2m}\nabla^2)。一个粒子的总哈密顿量 (H) 是动能与势能之和,而势能 (V(x)) 只是空间位置的函数。因此,三维空间中粒子的薛定谔(Schrödinger)方程为
[
i\bar{h}\frac{\partial\psi}{\partial t} = H\psi = -\frac{\bar{h}^2}{2m}\nabla^2\psi + V(x)\psi .
\tag{8.6}
]
与一维情况一样,我们假设势能不显含时间。

薛定谔方程最有用的解是定态,它们具有简单的指数时间依赖关系,
[
\psi(x, t) = \chi(x)e^{-\frac{i}{\bar{h}} Et} .
\tag{8.7}
]
对于这些态,薛定谔方程简化为
[
H\chi = E\chi ,
\tag{8.8}
]
或明确写为
[
-\frac{\bar{h}^2}{2m}\nabla^2\chi + V(x)\chi = E\chi .
\tag{8.9}
]
与之前一样,挑战在于找到哈密顿量 (H) 的能量本征值 (E),以及相应的定态波函数 (\chi(x)),它们同时也是 (H) 的本征函数。对于物理解,当 (|x| \to \infty) 时 (\chi(x)) 不应增长。最简单的情况是______

¹ 从现在开始,对于任何矢量 (v),我们将方便地使用记号 (v^2) 表示 (v \cdot v)。

234
三维量子力学
当势函数 V(x) 为零时,我们得到的是自由粒子。方程(8.9)的解是位置变量的纯指数函数,
χ(x) = e^{ik·x} = e^{ik_1x_1}e^{ik_2x_2}e^{ik_3x_3} 。 (8.10)
这是所有三个动量算符 p_i 的本征函数,其本征值为 ¯hk_i。等价地,它是 p 的本征函数,本征值为 ¯hk,且矢量 k 不受约束。χ(x) 也是哈密顿量 H = (1/2m)p^2 = −(¯h^2/2m)∇^2 的本征函数,能量本征值为 E = (¯h^2k^2)/(2m),其中 k^2 = k_1^2 + k_2^2 + k_3^2。这个定态波函数适用于粒子束中的粒子,具有确定的动量和正能量。

8.2.1 箱中粒子

对粒子施加最小约束,将其运动限制在一个有限体积的箱内。这种约束对于描述金属样品中的电子以及许多其他凝聚态物理情境非常有用。它也有助于描述容器中的气体分子。
数学上,最便捷的箱体是边长分别为 L_1、L_2、L_3 的长方体。
我们对粒子的波函数施加周期性边界条件;这使得箱体的相对面等同起来,这在物理上并不现实,但其他边界条件会导致类似的结果。自由粒子的波函数仍然具有 χ(x) = e^{ik_1x_1}e^{ik_2x_2}e^{ik_3x_3} 的形式,其能量仍为 E = (¯h^2k^2)/(2m),但现在周期性条件要求 e^{ik_1x_1} = e^{ik_1(x_1+L_1)},因此 e^{ik_1L_1} = 1,对 L_2 和 L_3 同理。因此,k 被限制满足
k = (k_1, k_2, k_3) = (2πn_1/L_1, 2πn_2/L_2, 2πn_3/L_3) (8.11)
其中 (n_1, n_2, n_3) 为整数。在 k 空间中,每个边长为 (2π/L_1, 2π/L_2, 2π/L_3) 的元胞内只允许有一个态。元胞的体积为 (2π)^3/(L_1L_2L_3) = (2π)^3/V,其中 V = L_1L_2L_3 是箱子的体积。由于这个结果仅依赖于 V,从现在起我们将忽略能量对箱子形状的详细依赖关系。

因为每个大小为 (2π)^3/V 的元胞有一个态,k 空间中的态密度为 V/(2π)^3。这适用于箱内一系列物理波动系统。在量子力学中,将此结果转换到动量空间更为方便。由于粒子动量为 p = ¯hk,对 p 的约束涉及 2π¯h,因此 p 空间中的态密度为 V/(2π¯h)^3。
对于宏观尺寸箱中的粒子,这是一个非常高的密度,并且这些态在 p 空间中呈准连续分布。在经典极限下,粒子同时由其位置和动量来表征,我们可以说,粒子态的密度在位置和动量空间(即相空间)中同时具有意义。相空间中的密度为 1/(2π¯h)^3。将其对空间箱体以测度 d^3x 积分,我们得到因子 V,从而恢复动量空间中的密度。虽然这个论证并不严格,但它为量子力学与其经典极限之间的关系提供了一个重要的指示。

角动量算符
235
动量空间中的密度可以转换为能量E的密度。动量大小在p和p+dp之间的状态数为4πp² dp乘以p空间中的密度V/(2π¯h)³,因此p的态密度为
[
\tilde{g}(p) = \frac{V p^2}{2\pi^2 \bar{h}^3}. \tag{8.12}
]
通过进一步作变量代换E = 1 2mp2,我们得到E的态密度为²
[
g(E) = \frac{V}{4\pi^2} \frac{2m}{\bar{h}^2}^{\frac{3}{2}} E^{\frac{1}{2}}. \tag{8.13}
]
能量在E和E+dE之间的状态数为g(E) dE。当提及盒中量子粒子的态密度时,通常指的就是这个函数g(E)。
由于盒中粒子态构成一个准连续谱,我们可以用态密度将任何对状态的求和替换为积分。若离散状态用n标记,且具有能量E_n,则
[
\sum_{\text{states}} f(E_n) \simeq \int_{E_{\text{min}}}^\infty g(E) f(E) , dE. \tag{8.14}
]
这对于粒子能量的大多数函数f都成立。

8.3 角动量算符

粒子的经典(轨道)角动量为l = x × p,是一个具有三个分量的矢量。例如,沿1方向的分量为l₁ = x₂p₃ - x₃p₂。要得到量子的轨道角动量算符,我们只需代入动量算符p_i的偏导数表达式。这里通常略去¯h因子,定义
[
\begin{aligned}
l_1 &= -i \left( x_2 \frac{\partial}{\partial x_3} - x_3 \frac{\partial}{\partial x_2} \right), \
l_2 &= -i \left( x_3 \frac{\partial}{\partial x_1} - x_1 \frac{\partial}{\partial x_3} \right), \
l_3 &= -i \left( x_1 \frac{\partial}{\partial x_2} - x_2 \frac{\partial}{\partial x_1} \right).
\end{aligned} \tag{8.15}
]
写成矢量形式,角动量算符为l = -i x × ∇。物理的角动量算符是此算符乘以¯h。这种约定的优点在于l₁、l₂、l₃是无量纲的,而且我们将会看到,它们的本征值是整数。普朗克(Planck)常数¯h是作用量的一个单位,具有能量乘以时间的量纲,因此,例如波函数(8.7)中的指数-i Et/¯h就是无量纲的。颇为巧合的是,¯h也具有角动量的量纲,因此在量子力学中,角动量自然是一个纯数乘以¯h。我们可以预期角动量是¯h的整数倍。它常常是这样,但电子的自旋是½¯h,我们说电子具有自旋½。

² 态密度之间的关系为\tilde{g}(p) dp = g(E) dE,其中dE = 1 mp dp。

236
三维量子力学
与动量算符不同,轨道角动量算符并不互相对易。它们的对易子为
[
[l_1, l_2] = i l_3, \quad
[l_2, l_3] = i l_1, \quad
[l_3, l_1] = i l_2.
\tag{8.16}
]
其中第一个可通过计算来验证:
[
\begin{aligned}
[l_1, l_2]\psi &= - \left( x_2 \frac{\partial}{\partial x_3} - x_3 \frac{\partial}{\partial x_2} \right) \left( x_3 \frac{\partial}{\partial x_1} - x_1 \frac{\partial}{\partial x_3} \right) \psi \
&\quad + \left( x_3 \frac{\partial}{\partial x_1} - x_1 \frac{\partial}{\partial x_3} \right) \left( x_2 \frac{\partial}{\partial x_3} - x_3 \frac{\partial}{\partial x_2} \right) \psi \
&= \left( x_1 \frac{\partial}{\partial x_2} - x_2 \frac{\partial}{\partial x_1} \right) \psi = i l_3 \psi ,
\end{aligned}
\tag{8.17}
]
其中除了由算符 (\frac{\partial}{\partial x_3}) 作用于 (x_3) 所产生的项之外,所有项都相消了。另外两个对易子可通过循环置换指标得到。

另一个有用的算符是标量平方角动量
[
l^2 = l_1^2 + l_2^2 + l_3^2 .
\tag{8.18}
]
可以检验 (l^2) 与每个单独的算符 (l_1)、(l_2)、(l_3) 都对易。算符 (r^2) 和 (\nabla^2) 也与每个角动量算符对易。其根本原因在于 (l^2)、(r^2) 和 (\nabla^2) 都是标量、旋转不变的算符,而所有这类算符都必须与角动量对易。

我们所需要的最后一个算符是
[
\mathbf{x} \cdot \nabla = x_1 \frac{\partial}{\partial x_1} + x_2 \frac{\partial}{\partial x_2} + x_3 \frac{\partial}{\partial x_3} .
\tag{8.19}
]
这是去掉因子 (-i\hbar) 的 (\mathbf{x}\cdot\mathbf{p}) 算符,因此同样是无量纲的。回想一下,如果 (\mathbf{n}) 是任意单位矢量,那么 (\mathbf{n}\cdot\nabla) 是沿方向 (\mathbf{n}) 的方向导数。矢量 (\mathbf{x}) 的大小为 (r) 并沿径向向外,所以算符 (8.19) 就是 (r) 乘以沿径向向外的导数,可以记为 (r \frac{\partial}{\partial r})。这个算符最早由欧拉(Euler)考虑,是径向缩放算符。

关于经典粒子的位置和动量,有一个有用的关系式,它可以通过将 (\mathbf{p}) 分解为平行和垂直于 (\mathbf{x}) 的分量而得到。(\mathbf{x}) 方向的单位矢量是 (\frac{1}{r}\mathbf{x})。因此 (\mathbf{p}) 在这个方向的分量为 (\frac{1}{r}\mathbf{x}\cdot\mathbf{p}),而垂直分量的量值为 (\frac{1}{r}|\mathbf{x}\times\mathbf{p}|)。根据勾股定理,这两个分量长度平方之和为 (p^2),所以在经典力学中有
[
p^2 = \frac{1}{r^2} (\mathbf{x}\cdot\mathbf{p})^2 + \frac{1}{r^2} (\mathbf{x}\times\mathbf{p})\cdot(\mathbf{x}\times\mathbf{p}) ,
\tag{8.20}
]
因而
[
r^2 p^2 = (\mathbf{x}\cdot\mathbf{p})^2 + (\mathbf{x}\times\mathbf{p})\cdot(\mathbf{x}\times\mathbf{p}) .
\tag{8.21}
]
这个关系有一个量子类比。(p^2) 正比于动能算符,从而正比于拉普拉斯算符 (\nabla^2),而 (\mathbf{x}\cdot\mathbf{p}) 正比于径向缩放算符 (r \frac{\partial}{\partial r})。

角动量算符
237
而 x×p 正比于角动量 l。方程 (8.21) 的量子算符形式为
r²∇² = (r ∂/∂r)² + r ∂/∂r − l² .
(8.22)
这与经典关系并不完全相同,因为算符 x 和 p 的各分量并不都对易,由此多出了 r ∂/∂r 的一次幂项。要验证方程 (8.22),必须用定义 (8.15) 和 r ∂/∂r = x·∇ 的平方 (利用方程 (8.19)) 仔细计算算符 l² = l₁² + l₂² + l₃²。关系式 (8.22) 将很有用,因为它把角动量的平方与拉普拉斯算符联系起来,进而与粒子的哈密顿量联系起来。

8.3.1
用笛卡尔坐标求 l² 的本征函数
现在我们将利用关系式 (8.22) 来寻找角动量平方算符 l² 的一组完备的本征函数和本征值。这是求解球对称势中粒子薛定谔方程的关键一步。标准方法是采用球极坐标 r, ϑ, ϕ。然后会发现角动量的每个分量都是只含对角坐标 ϑ 和 ϕ 的导数、而不含对 r 的导数的算符。l² 也是如此。因此 l² 的本征函数只是 ϑ 和 ϕ 的函数,被称为球谐函数。
这里我们采用另一种方法,主要在笛卡尔坐标下处理。考虑关于 x₁, x₂ 和 x₃ 的所有单项式。它们是 x₁, x₂, x₃ 的幂次之积,
p_{abc} = x₁^a x₂^b x₃^c ,
(8.23)
其中 a, b, c 是非负整数,用作标记。(在第 1.3 节中,曾用单项式的例子来说明偏微分以及拉普拉斯算符的作用。此处的讨论与之类似,但更系统。)记各幂次之和为 l,即 l = a + b + c。l 称为该单项式的次数,我们不应忘记零次单项式 p_{000} = 1。一个多项式是若干个单项式的有限和,并带有任意数值系数,若所有涉及的单项式都是 l 次的,则称该多项式为 l 次多项式。
对于给定的 l,有多少个不同的单项式?换句话说,a, b, c 有多少种选择?答案可通过考虑一行中的 l+2 个物体并从中选出两根作为分隔棍来得到:
• • … • ⏐ • … • ⏐ • • … • • .
(8.24)
这显示出左边有 a 个物体,中间有 b 个,右边有 c 个。两根子可以位于 l+2 个位置中的任意两处:例如,若它们相邻则 b=0,若一根在最左端则 a=0,等等。从 l+2 个位置中选出两个位置的方法数为 ½(l+2)(l+1),这就是 l 次单项式的个数。l 次多项式空间就是这些单项式的线性组合所构成的空间,因此其维数为 ½(l+2)(l+1)。
径向伸缩算符为
x₁ ∂/∂x₁ + x₂ ∂/∂x₂ + x₃ ∂/∂x₃ .
(8.25)

238
三维量子力学
作用在 p{abc} 上时,第一项会分离出因子 a,但除此之外 p{abc} 保持不变。类似地,第二项和第三项分别分离出 b 和 c。因此
(x1 ∂/∂x1 + x2 ∂/∂x2 + x3 ∂/∂x3) p{abc} = (a + b + c)p{abc} = l p{abc} . (8.26)
使用球坐标时,这一结果同样显而易见,因为该算子可表示为 r ∂/∂r。在球坐标中,单项式 p{abc} 是 r^l 乘以某个角度函数,因为
(x1, x2, x3) = (r sin ϑ cos ϕ, r sin ϑ sin ϕ, r cos ϑ) (8.27)
而这些表达式中的每一项都含有一个 r 因子。因此
r ∂/∂r p{abc} = l p{abc} , (8.28)
且该算子对所有 l 次多项式都以此简单方式作用。

接下来,我们考虑拉普拉斯算子 ∇^2 = ∂^2/∂x1^2 + ∂^2/∂x2^2 + ∂^2/∂x3^2 如何作用于一个 l 次单项式。一般作用结果为
∇^2(x1^a x2^b x3^c) = a(a-1)x1^{a-2} x2^b x3^c + b(b-1)x1^a x2^{b-2} x3^c + c(c-1)x1^a x2^b x3^{c-2} . (8.29)
无论细节如何,结果总是一个 l-2 次多项式。因此,拉普拉斯算子 ∇^2 作用在 l 次多项式空间(维度为 1/2 (l+2)(l+1))上,并将其映射到 l-2 次多项式空间(维度为 1/2 l(l-1))。由于后一空间的维度小于前一空间,必然存在某些 l 次多项式,使得拉普拉斯算子在其上的作用结果为零。我们说这些多项式被拉普拉斯算子零化。(不那么戏剧性的说法是,它们满足拉普拉斯方程。)事实上,被拉普拉斯算子零化的 l 次多项式空间的维度,恰好是维度 1/2 (l+2)(l+1) 与 1/2 l(l-1) 之差,即 2l+1。它不会更大,因为每一个 l-2 次多项式都可以通过拉普拉斯算子作用于某个 l 次多项式得到。

例如,有 6 个二次单项式,x1^2, x2^2, x3^2, x1 x2, x2 x3, x1 x3,以及一个零次单项式,即数字 1。因此,有五个独立的二次多项式被拉普拉斯算子零化。它们可以选为
x1^2 - x2^2, x1^2 + x2^2 - 2x3^2, x1 x2, x2 x3, x1 x3 . (8.30)

我们现在达到了这种方法的关键之处。所有被拉普拉斯算子零化的 l 次多项式,都是角动量平方算子 l^2 的本征函数,且具有相同的、容易求得的本征值。为了看清这一点,设 P 为一个这样的多项式。径向缩放算子 r ∂/∂r 作用于 P 给出 l P,因此
( (r ∂/∂r)^2 + r ∂/∂r ) P = l(l+1) P . (8.31)
拉普拉斯算子作用于 P 结果为零,因此由方程 (8.22) 我们得到
l^2 P = l(l+1) P . (8.32)
结论是:一个被 ∇^2 零化的 l 次多项式,是 l^2 的本征函数,本征值为 l(l+1)。天真地看,人们可能会预期本征值是 l^2,但

角动量算符
239
该公式中出现 +1 是因为相关算符并非全部对易,这是量子力学的一个关键特征。

举例来说,所有(8.30)式中的函数都是2次的,因此都是 l² 的本征函数,本征值为6。这可以直接验证,但认识到这些函数被拉普拉斯算符湮灭,能更深入地理解为何如此。

之前我们说过,l² 的本征函数通常是纯角度函数,称为球谐函数。我们在这里得到的多项式等于这些球谐函数乘以 rˡ 的幂次。因子 rˡ 不影响 l² 的本征值。我们称这些多项式为谐函数,该术语常用于满足拉普拉斯方程的函数。我们将一个 l² 本征值为 l(l+1) 的谐函数 P 记作 P = rˡPₗ(ϑ, ϕ),其中 Pₗ(ϑ, ϕ) 是球谐函数。与球谐函数不同,谐函数在原点处是光滑函数,这从其笛卡尔坐标形式即可看出。

总而言之,通过考虑所有 l 次的、被拉普拉斯算符湮灭的 x₁, x₂, x₃ 多项式,我们得到了一组完备的 l² 本征函数。或者,从球极坐标的角度看,我们得到了一组完备的球谐函数,再乘以 r 的幂次。不被拉普拉斯算符湮灭的多项式可以通过再乘以 r 的幂次与球谐函数关联起来。

在专注于算符 l² 及其本征值和本征函数时,我们多少忽略了原始的角动量算符 l₁, l₂, l₃。它们每一个都与 l² 对易,但彼此之间并不对易。因此我们选取其中一个,l₃,并重新排列我们已找到的谐函数,使它们同时成为 l² 和 l₃ 的本征函数。为此,我们需要知道算符 l₃ = −i ( x₁ ∂/∂x₂ − x₂ ∂/∂x₁ ) 如何作用于笛卡尔坐标。这可以最简洁地表示为

l₃(x₁ + ix₂) = x₁ + ix₂ ,
l₃x₃ = 0 ,
l₃(x₁ − ix₂) = −(x₁ − ix₂) . (8.33)

作用于这些笛卡尔坐标的组合上,我们看到 l₃ 具有本征值 m = 1, 0, −1。因为 l₃ 是一个线性微分算符,它遵循莱布尼茨法则,这意味着 l₃ 本征函数的乘积,其 l₃ 本征值等于各因子本征值之和。如果一个多项式包含 m₁ 个 (x₁ + ix₂) 因子,m₂ 个 (x₁ − ix₂) 因子,以及任意数量的 x₃ 因子,那么它就是一个 l₃ 本征函数,本征值为 m = m₁ − m₂。

l 次谐函数有一组具有确定 l₃ 本征值 m 的基。例如,对于 l = 2,我们可以选择基

(x₁ + ix₂)² , (x₁ + ix₂)x₃ , (x₁ + ix₂)(x₁ − ix₂) − 2x₃² , (x₁ − ix₂)x₃ , (x₁ − ix₂)² . (8.34)

我们很容易看出这些谐函数分别是 l₃ 的本征函数,本征值依次为 m = 2, 1, 0, −1, −2。每一个都是(8.30)式中多项式的线性组合,所以这些谐函数同时也是 l² 的本征函数,本征值为6。一般而言,l² 的本征值为 l(l+1) 的 2l+1 个本征函数,有一组由 l₃ 的本征值 m 标记的基。m 在范围 l, l−1, …, −(l−1), −l 内的 2l+1 个值各出现一次。该范围的上限是本征函数 (x₁ + ix₂)ˡ,下限是 (x₁ − ix₂)ˡ。具有确定 l 和 m 标记的球谐函数记为 Pₗᵐ(ϑ, ϕ),相应的谐函数为 rˡPₗᵐ(ϑ, ϕ)。

240
三维空间中的量子力学
8.4
具有球对称势的薛定谔方程
具有球对称势 V(r) 的定态薛定谔方程为
[
-\frac{\bar{h}^2}{2m}\nabla^2\chi + V(r)\chi = E\chi .
\tag{8.35}
]
可以通过取球谐函数 (P = r^l P_m^l(\vartheta, \phi)) 并乘以一个额外的径向函数 (f(r)) 来求解,
[
\chi(r, \vartheta, \phi) = f(r) r^l P_m^l(\vartheta, \phi) .
\tag{8.36}
]
展开方程 (8.22) 中的径向导数项,我们可以将拉普拉斯算符表示为
[
\nabla^2 = \frac{\partial^2}{\partial r^2} + \frac{2}{r}\frac{\partial}{\partial r} - \frac{1}{r^2} l^2 .
\tag{8.37}
]
径向导数仅作用于 (f(r) r^l),而 (l^2) 作用于 (P_m^l) 产生 (l(l+1)P_m^l)。因此,方程 (8.35) 中的所有项都与 (P_m^l) 成正比,经过一些简化后,它变为纯粹的径向方程
[
\left[ -\frac{\bar{h}^2}{2m} \left( \frac{d^2}{dr^2} + \frac{2}{r}\frac{d}{dr} - \frac{l(l+1)}{r^2} \right) + V(r) - E \right] f(r) r^l = 0 .
\tag{8.38}
]
该方程显式地依赖于整数角动量量子数 (l) 的值,并且对于每个 (l) 都有一组能量本征值 (E)。注意,量子数 (m) 没有出现在方程 (8.38) 中,因此对于给定的 (l) 和给定的能量,总是存在 ((2l+1)) 重简并态。这些态具有相同的能量和角动量平方,但角动量在 3 轴上的投影不同。更通俗地说,这些态的区别在于角动量指向的方向。通过旋转对称性,能量不可能依赖于这个方向。

如果 (l \neq 0),项 (\frac{\bar{h}^2}{2m} \frac{l(l+1)}{r^2}) 在原点处有一个强烈的正奇点,主导了那里任何物理势 (V(r))。通常的效应是,随着 (l) 的增大,能级 (E) 会升高。对于一般势,不同 (l) 值的能级之间没有简单的关系。取决于 (V) 的形状和 (l) 的值,一些态可能是束缚态,而另一些则可能是散射态。有时根本没有束缚态,有时则没有散射态。³ 以球谐振子为例,其势为 (V(r) = Ar^2),其中 (A) 为正。在这里,对于每个整数 (l),都存在一个无限、离散的、具有正能量的束缚态集合。粒子无法逃逸到无穷远,因此没有散射态。

另一类势是有限深势阱。这里 (V(r)) 为负,当 (r \to R)(势阱的径向宽度)时迅速趋于零。势阱中的束缚态具有负能量,这些态可能存在也可能不存在,但对于所有正能量,总是存在散射态。如果 (V) 足够深(实际上重要的是深度和宽度的组合),那么对于小的 (l) 值将会存在束缚态。然而,对于大的 (l) 值则不会,因为项 (\frac{\bar{h}^2}{2m} \frac{l(l+1)}{r^2}) 具有排斥效应,克服了势阱的吸引力。如果 (V) 很浅,即使对于 (l=0),也根本不会有束缚态。

³ 势的强度与束缚态数量之间的关系由 Levinson 定理描述,该定理可追溯至 1949 年。

具有球对称势的薛定谔方程
241
8.4.1 库仑(Coulomb)势
我们现在更详细地研究吸引的库仑势。这个势很重要,因为它描述了一个电子与一个质子的相互作用。其束缚态就是最简单的原子——氢原子的状态。由于质子的质量几乎是电子的2000倍,我们可以认为质子静止于原点,然后求解电子的定态波函数 χ(r, ϑ, ϕ) = f(r)rl P^m_l(ϑ, ϕ)。质子带正电荷 e,电子带相反的负电荷 −e。势是静电库仑势 V (r) = −e^2/(4πr),其(负)梯度给出吸引的平方反比律力。由于 V 为负且不浅,我们可以预期存在束缚态。事实上,对于所有非负整数 l 都存在束缚态,因为势在 r → ∞ 时趋近于零相当缓慢,而且在大的 r 处,1/r 的吸引力压倒 1/r^2 的排斥力。此外还有正能量状态,代表电子被质子散射,但我们将集中于束缚态。势中的 1/r 奇点相当温和,波函数在原点保持有限,无论束缚态还是散射态都是如此。对于 l ≠ 0,波函数在原点为零。

代入库仑势后,方程(8.38)变为
[
\left[ -\frac{\bar{h}^2}{2m_e} \left( \frac{d^2}{dr^2} + \frac{2}{r} \frac{d}{dr} - \frac{l(l+1)}{r^2} \right) - \frac{e^2}{4\pi r} - E \right] f(r) r^l = 0,
\tag{8.39}
]
其中 m_e 是电子质量。通过乘以 2m_e/\bar{h}^2 并定义 α = m_e e^2/(2π\bar{h}^2) 和 ν^2 = −2m_e E/\bar{h}^2 可以简化该方程。对于束缚态 E 为负,故 ν^2 为正。利用莱布尼茨(Leibniz)法则显式算出 f(r) r^l 的径向导数后,方程(8.39)变为
[
\left( -\frac{d^2}{dr^2} - \frac{2(l+1)}{r} \frac{d}{dr} - \frac{\alpha}{r} + \nu^2 \right) f(r) = 0.
\tag{8.40}
]
方程中最奇异的 l(l+1)/r^2 项消失了。它由于波函数中的 r^l 因子而抵消。

让我们考虑 f 在大 r 处的行为。常数 ν^2 主导了含 1/r 因子的两项,合适的渐近解是 f(r) ∼ e^{−νr},它在大的 r 处迅速衰减。完整解可以写为
[
f(r) = g(r) e^{-νr}.
\tag{8.41}
]
要求 g(r) 在原点有限,并且在大的 r 处比指数函数增长得慢。这最后一个条件决定了 ν 的可能取值,对于这些值,g(r) 是一个多项式。

最简单的解是 g(r) = 1,这样 f(r) 严格等于 e^{−νr}。将此代入方程(8.40),可得 ν = α/[2(l+1)]。因此
[
f(r) = e^{-\frac{\alpha}{2(l+1)} r},
\tag{8.42}
]
并且
[
E = -\frac{\bar{h}^2 \nu^2}{2m_e} = -\frac{\bar{h}^2 \alpha^2}{8m_e} \frac{1}{(l+1)^2} = -\frac{m_e e^4}{32\pi^2 \bar{h}^2} \frac{1}{(l+1)^2}.
\tag{8.43}
]
因为 f(r) 不穿过零点,这实际上是对于每个 l 值的最低能量解。通常,接下来会寻求相同 l 的更高能量解(即具有

242
三维量子力学
(较小的 ν,因为这对应于负得较少的 E),并且确实有无穷多个这样的解,其中 g(r) 是次数越来越高的多项式。然而,库仑势非常特殊,并且如果在能量固定的情况下改变 l,描述起来会更容易。
让我们改变记号,设 ν =
α
2N ,这样当 g(r)=1 时有 N = l+1,且
E = −¯h2α2
8me
1
N 2 = −mee4
32π2¯h2
1
N 2 ,
(8.44)
其中 N ≥1 为正整数。N 称为主量子数,因为它决定了能量。到目前为止我们一直考虑的解是
f(r) = e−α
2N r ,
(8.45)
其角动量标记为 l = N −1。现在,在固定 N 和能量的情况下,可以证明,对于有限范围 l = 0, 1, 2, . . . , N −1 内的任何整数 l,方程 (8.40) 都有一个解。解的形式为
f(r) = g(r)e−α
2N r ,
(8.46)
其中 g 是一个次数为 N −l −1 的多项式,称为广义拉盖尔多项式。例如,对于 l = N −2,g(r) = 1 −
α
2N(N−1)r。
8.4.2
光谱学
图8.1展示了氢原子的束缚态能量。能量仅取决于主量子数 N 和固定的物理常数。最低能态,即 N = 1,是唯一的且角动量为零。它是氢原子的基态。更高的 N 的态还有两个进一步的标记,即角动量标记 l 和 m,并且回想起给定 l,允许的 m 值有 2l + 1 个。与一般的势 V (r) 相比,这里有更多的简并。对于每个 N,有一个 l = 0 的态,三个 l = 1 的态,依此类推,最后有 2N −1 个 l = N −1 的态。总共有 N 2 = PN−1
l=0 (2l + 1) 个态,其能量为 −mee4
32π2¯h2
1
N 2 。这种额外的简并是量子化粒子在吸引势 1
r 中运动所特有的,可以利用我们在第 2 章中用来研究经典开普勒轨道的龙格–楞次矢量(Runge–Lenz vector)的量子类比来理解。

其中一些态对应于玻尔(Bohr)早期研究氢原子时所发现的态。在这个原始的原子量子力学模型中,电子绕质子做经典的圆周轨道运动,角动量为 N¯h,即 ¯h 的整数倍。在吸引库仑力作用下的经典运动方程意味着电子能量为 E = −mee4
32π2¯h2
1
N2 。玻尔模型预言了正确的能级,但没有解释角动量与能量之间的关系。玻尔模型所忽略的是,对于给定的 N,存在角动量投影为 m¯h 且 |m| 取从 0 到 N −1 的任意整数值的量子态。后来,阿诺德·索末菲(Arnold Sommerfeld)通过考虑椭圆轨道并量子化角动量的 l3 分量,对玻尔模型做出了重要补充。完整的玻尔–索末菲氢原子模型尽管基于相当特别的原理,但与本文基于薛定谔方程的分析一致。

球对称势下的薛定谔方程
243
紫外线
N = ∞
N = 4
N = 3
N = 2
N = 1
可见光
红外线
帕邢(Paschen)系
巴尔末(Balmer)系
基态
发射
莱曼(Lyman)系
电离
吸收
13.6 eV
12.8 eV
12.1 eV
10.2 eV
0 eV
图8.1 氢原子的束缚态能量。电子跃迁产生氢光谱中的明线。从N > 1跃迁到N = 1形成莱曼系。从N > 2跃迁到N = 2形成巴尔末系。从N > 3跃迁到N = 3形成帕邢系。

在氢原子的基态,电子具有其可能的最低能量。电子可以通过多种方式被激发到更高的能态,包括电激发、与其他原子碰撞的热激发,以及与可能入射到原子上的粒子的相互作用。在我们的讨论中,基态和激发态都是定态,它们之间没有跃迁,但这只是一种近似。因为电子是带电的,它还会与电磁场发生相互作用。这种相互作用并不容易分析,因为需要考虑电磁场的量子方面,而我们的薛定谔方程并未包含这些。最重要的效应是,处于激发态的电子具有有限的寿命,会跃迁到较低能态,并最终回到基态。释放的能量以一个或多个光子(电磁场的量子化状态)的形式发射出去。

单个发射光子的能量等于电子初态和末态(几乎)定态之间的能量差。在主量子数分别为 (N’) 和 (N)(且 (N’ > N))的态之间发生跃迁时,光子能量为
[
\frac{m_ee^4}{32\pi^2\bar{h}^2} \left( \frac{1}{N^2} - \frac{1}{N’^2} \right).
\tag{8.47}
]
如果原子氢样品发射大量光子,这会被探测为普通的电磁辐射。光子能量与辐射频率成正比,因而与波长成反比。在速度

244
三维量子力学
光的速度为 1,这些跃迁会产生波长为 λ 的辐射,其中
1
λ =
mee4
64π3¯h3
 1
N 2 −
1
N ′2

.
(8.48)
允许的波长及其颜色范围如图 8.1 所示。跃迁到 N = 1 能级的谱线全部位于紫外区,而跃迁到 N = 2 能级的谱线则位于可见光谱区。谱线非常锐利。
8.5
自旋
量子力学中角动量的关键特征是 (8.16) 式中的那组对易关系。我们是从表示轨道角动量 l = x × p 的微分算子出发推导出这些关系的。自然要问,对易关系是否能被其他类型的表示所满足,比如矩阵。答案是肯定的,而且不同于位置和动量算子,这些矩阵的大小是有限的。起作用的最小非平凡矩阵是 2 × 2 矩阵。这些矩阵被称为自旋算子,并有其专用记号 s = (s1, s2, s3)。自旋算子为
s1 = 1
2

0
1
1
0

,
s2 = 1
2

0
−i
i
0

,
s3 = 1
2

1
0
0
−1

,
(8.49)
它们满足对易关系 [s1, s2] = is3 等等,正如方程 (8.16) 中那样。如果没有因子 1
2 ,这些矩阵就称为泡利矩阵 (Pauli matrices),并记作 σ = (σ1, σ2, σ3),因此 s = 1
2 σ。物理上的自旋算子为 ¯hs = ¯h
2 σ。
自旋算子提供了角动量的另一种量子力学实现。由于矩阵是 2 × 2 的,具有自旋的最简单量子态只有两个复分量。这样的态被称为二分量旋量,写作
φ =

φ1
φ2

.
(8.50)
为了看出自旋算子并不等价于先前用微分算子表示的角动量,考虑自旋的平方
s2 = s2
1 + s2
2 + s2
3 .
(8.51)
每个泡利矩阵 σi 的平方都是 2 × 2 单位矩阵 1,因此 s2 = 3
41。所以任何二分量旋量都是 s2 的本征态,本征值为 3
4。这正是 s = 1
2 时 s(s + 1) 的值,因此自旋是标记为 1
2 的角动量的一种表现,而非我们早前找到的整数标记 l。我们说这些态具有自旋 1
2。
自旋算子 s3 =

1
2
0
0
−1
2

有两个不同的本征值,恰好就是对角元 1
2 和 −1
2。并且由于
s3

1
0

= 1
2

1
0


s3

0
1

= −1
2

0
1

,
(8.52)
相应的本征态就是这里所示的两个旋量,
1
0


0
1

。它们分别被称为(相对于 x3 轴的)自旋向上态和自旋向下态,s = 1
2。本征值

自旋
245
s₃的本征值从s到−s以整步长变化,正如l₃的本征值m从l到−l以整步长变化一样。

有趣的是,每个二分量旋量在某个方向上都是自旋向上的。一个在方向n = (sin ϑ cos ϕ, sin ϑ sin ϕ, cos ϑ)上自旋向上的旋量φ必须满足(n · s)φ = ½φ,或显式地
(sin ϑ cos ϕ s₁ + sin ϑ sin ϕ s₂ + cos ϑ s₃)φ = ½

cos ϑ
sin ϑ e⁻ⁱᵠ
sin ϑ eⁱᵠ
−cos ϑ

φ = ½φ .
(8.53)
一个解是φ =

cos ½ϑ
sin ½ϑ eⁱᵠ

。反之,φ =

φ₁
φ₂

在由tan ½ϑ eⁱᵠ = φ₂/φ₁定义的方向上是自旋向上的。

8.5.1 施特恩–格拉赫实验
银原子束
狭缝

特殊形状的磁铁
照相底片
S₃ = ½
S₃ = −½
N
S
图8.2 施特恩–格拉赫装置。

物理粒子可以具有自旋½,这是一个非凡的事实。这一发现是在1922年,当时奥托·施特恩(Otto Stern)和瓦尔特·格拉赫(Walther Gerlach)让一束(中性)银原子通过一个设计用于产生沿x₃方向对齐的非均匀磁场的磁铁。当原子通过施特恩–格拉赫装置时,束中原子的磁矩与磁场相互作用,原子从原始轨迹偏转,如图8.2所示。施特恩和格拉赫发现的结果是,银原子束分裂成两束。每个原子具有与其自旋成正比的磁矩,在自旋向上态中磁矩向上对齐,或在自旋向下态中向下对齐。通过磁场时,原子向上或向下偏转,取决于其磁矩是向上还是向下,如图8.3右图所示。经典上,我们预期原子自旋可以指向任意方向,偏转将取决于取向角度。偏转将是连续的,在对应与磁场完全对齐和完全反平行对齐的两种极端值之间变化。施特恩–格拉赫实验表明,我们的经典预期是错误的,自旋只能理解为一种量子现象。结果可以解释为对s₃的测量,并表明唯一可能的结果是本征值½和−½。不仅仅银原子具有自旋½;电子、质子和中子也具有自旋½。电子自旋影响氢原子中电子可用的状态。

图8.3 银原子通过斯特恩-盖拉赫装置(Stern–Gerlach apparatus)后在照相底片上留下的痕迹。左图:磁场关闭时,没有偏转。右图:磁场开启时,银原子通过两个离散的角度发生偏转。

定态波函数是一个依赖位置的旋量,
φ(x) =
 φ1(x)
φ2(x)

.
(8.54)
在非常好的近似下,φ 的薛定谔方程约化为我们之前讨论过的薛定谔方程(8.35)的两个副本,一个关于 φ1,一个关于 φ2。因此,态与之前相同,具有相同的能量,但多了一个额外的标记,用以标明电子是自旋向上还是自旋向下。具有能量(8.44)的独立状态数目现在是 2N 2,是先前考虑的无自旋情形的两倍。

8.5.2
塞曼效应(Zeeman effect)
将原子置于强磁场中会破坏哈密顿量的球对称性,并解除电子态的简并。当通过衍射光栅观察光谱时,谱线的分裂是可见的。当一块强磁体靠近装有激发原子气体的管子时,可以观察到一条单一的谱线发生分裂。这就是塞曼效应。磁场的第一个效应是,将原本简并的、给定 l 的电子态能量分裂成对应不同 m 值的 2l+1 个能级。这种正常塞曼分裂如图8.4所示。l = 1 的态分裂成三个,l = 2 的态分裂成五个。由这些能级间跃迁产生的光子发射和吸收所导致的谱线也相应分裂。磁场的第二个效应是,由于电子自旋与磁场的相互作用,自旋向上的电子态能量相对于自旋向下的态发生偏移。自旋向上和向下相差一个单位的角动量,因此我们可能会预期自旋分裂的大小与连续 m 值之间的分裂相同。然而,不同自旋值导致的能量分裂几乎是单位轨道角动量所致分裂的两倍。这可以通过使用…来理解。

自旋

狄拉克方程——我们将在第12章介绍的相对论性量子力学方程。

无磁场
有磁场
m = 2
m = 1
m = 1
m = 0
m = 0
m = –1
m = –1
∆m = –1
∆m = +1
∆m = 0
无磁场时的光谱
有磁场时的光谱
l = 2
l = 1
m = –2
ħω
图8.4 原子置于磁场中时,电子态的能量发生分裂。这就是基本的(正常)塞曼效应。

我们在图8.5中对此加以说明。对于一个处于l = 1态的电子,存在三个m值,而每个m值又有两个自旋值(向上和向下),总计六个态。这六个态的能量在磁场中分裂,如右图所示。有四个等间距的态,统称为P₃/₂组,另外两个态标记为P₁/₂。这反映了角动量相加的方式,这种分裂被称为反常塞曼效应,尽管它的出现并不罕见。轨道角动量为1,自旋为1/2。如果这两个角动量矢量指向同一方向,总角动量为3/2;如果它们指向相反方向,总角动量为1/2。总角动量为3/2时有四个不同的投影,而总角动量为1/2时有两个。

塞曼效应是天文学家的重要工具,因为它使他们能够研究恒星的磁场。例如,通过塞曼效应,我们知道太阳黑子周期是由太阳磁场的周期性变化引起的。它也使得天文学家能够证实中子星的典型磁场强度约为10⁶ T(T表示特斯拉)。相比之下,地球磁场为10⁻⁵ T。

8.5.3 其他自旋表示

存在角动量对易关系的更大矩阵表示,类似于自旋算符s。例如,存在一个由3×3矩阵构成的表示,作用于三分量旋量。角动量平方s²的本征值为s(s+1) = 2,

248
三维空间中的量子力学
P 3
2
P1
2
S 1
2
1
2
1
2
3
2

1
2

1
2

1
2

1
2
3
2
图 8.5 当与两个电子自旋态结合时,l = 0 的角动量态(s 态)分裂为两个,三个 l = 1 的态(p 态)分裂为总共六个态。这就是反常塞曼效应(anomalous Zeeman effect)。
因此自旋标记为 s = 1。这些矩阵等价于将通常的角动量算符(8.15)的作用限制在一阶多项式 a1x1 + a2x2 + a3x3 上所得到的结果。这里 l = 1。尽管有这样的等价性,矩阵表示对于描述自旋为1的粒子依然有用。与二分量的旋量不同,并非每一个三分量旋量都代表一个在某个方向上自旋向上的自旋1粒子。
Z 玻色子(Z boson)是一个有质量的自旋1粒子,它的三个极化态是三分量旋量的独立状态。可以设想,它是两个自旋为 1
2 的粒子的束缚态,其自旋来源于轨道角动量和其组分的自旋,但这种解释很难与大量的实验观测相协调。Z 玻色子似乎像电子一样,是一种没有子结构的基本粒子,并且有坚实的理论理由说明它为何仍可以具有自旋1,我们将在第12章中看到这一点。
还有一组 4 × 4 矩阵表示自旋。这个表示描述了自旋为 3
2 的粒子。同样,这样的粒子也是存在的。德尔塔共振态(Delta resonances)是质子和中子的激发态,其自旋为 3
2。然而,自旋 3
2 不如自旋 1
2 基本,德尔塔共振态可以用三个组分夸克来模拟,每个夸克携带自旋 1
2。
总之,存在对应于自旋 0, 1
2, 1, 3
2, 2, 5
2, … 的自旋表示。数值 0, 1, 2, … 称为整数自旋,而 1
2, 3
2, 5
2, … 称为半整数自旋。在这些自旋中,自旋 0, 1
2, 1 似乎是最基本的。
8.6
自旋
1
2 作为量子范式
自旋
1
2 粒子提供了一个量子力学反直觉本质的简单例子,并为其公理提供了一个极好的检验。让我们暂且忽略空间波函数,将自旋 1
2 粒子仅当作一个两态系统来处理。将粒子视为一个束流的分量是方便的,该束流的自旋态可以通过一个或多个施特恩–格拉赫(Stern–Gerlach)

几个全同粒子的量子力学
249
放置在束流方向上的磁铁。方程(8.49)中的自旋算符s₁, s₂, s₃是厄米的(hermitian)⁴,因此它们代表可观测量。如果束流沿x₁方向,那么沿任何正交方向的自旋都可以通过适当摆放施特恩-格拉赫(Stern–Gerlach)磁铁来测量。

假设粒子遇到的第一个磁铁,其磁场沿x₃方向排列。对s₃的测量有两个可能结果½和-½,并假设某次测量的结果是½。紧接着,态是(1 0),即s₃的本征值为½的归一化本征态。如果用另一个同样排列的磁铁重复测量,结果确定是½。

现在假设第二个磁铁的磁场沿x₂方向排列,从而测量s₂。人们可能会预期,一个沿x₃方向自旋向上的态在x₂方向的自旋分量为零。但量子力学并非如此运作。
s₂ = ½ (0 -i; i 0) (8.55)
的本征值同样是½和-½,其归一化本征态分别是
1/√2 (1 i) 和 1/√2 (1 -i) . (8.56)
入射的自旋向上态(1 0)可以表示为s₂本征态的线性叠加:
(1 0) = 1/√2 [1/√2 (1 i)] + 1/√2 [1/√2 (1 -i)] . (8.57)
测量结果的概率就是该表达式中系数的平方。因此,s₂的测量结果有½的概率为½,有½的概率为-½。入射态是纯态,但s₂的测量结果却是概率性的、不确定的。这已在实验室中得到证实。不确定性的根本原因是s₃和s₂不对易。

类似的也可以在第二个磁铁磁场位于(x₂, x₃)平面内任意角度的情况下来分析。自旋的测量结果总是½或-½,但预言的概率依赖于角度,一般并不相等。这些概率同样已为实验所证实。

这些想法尽管奇特,如今已有了技术应用,并被开发成能够以完美安全性交换信息的系统,即量子密码术(quantum cryptography)。

8.7 几个全同粒子的量子力学

在经典力学中,如果有两个或更多粒子,它们有位置x⁽¹⁾, x⁽²⁾, …和动量p⁽¹⁾, p⁽²⁾, …。在量子力学中,多粒子系统的态由一个只依赖于粒子位置的波函数Ψ(x⁽¹⁾, x⁽²⁾, …)来描述。

⁴ 一个方阵Mₐₔ是厄米的,如果它的转置(行列交换后的矩阵)等于它的复共轭,即如果M₆ₐ = \overline{Mₐₔ}。厄米矩阵的本征值为实数。

250
三维空间中的量子力学
波函数也依赖于时间,但我们在这里略去这种依赖关系。波函数的模平方,
|Ψ(x(1), x(2), . . .)|^2 , (8.58)
是同时发现第一个粒子位于 x(1)、第二个粒子位于 x(2) 等等的概率密度。为使这有意义,波函数必须满足归一化条件:
∫ |Ψ(x(1), x(2), . . .)|^2 d^3x(1) d^3x(2) . . . = 1 , (8.59)
其中积分遍及整个空间。

每个粒子的位置算符和动量算符都作用在波函数上,与单粒子情况相同,位置算符通过乘法起作用,动量算符则通过偏微分起作用。例如,总动量算符的三个分量是如下求和:
P1 = −i¯h ∂/∂x(1)_1 − i¯h ∂/∂x(2)_1 − · · · ,
P2 = −i¯h ∂/∂x(1)_2 − i¯h ∂/∂x(2)_2 − · · · ,
P3 = −i¯h ∂/∂x(1)_3 − i¯h ∂/∂x(2)3 − · · · , (8.60)
或写成矢量形式:
P = −i¯h∇(1) − i¯h∇(2) − · · · . (8.61)
总哈密顿量 H 是动能之和加上一个依赖于所有粒子位置的势能。若有 N 个粒子,质量分别为 m(1), m(2), . . . , m(N),则
H = − Σ
{k=1}^N (¯h^2/(2m(k))) (∇(k))^2 + V (x(1), x(2), . . . , x(N)) , (8.62)
其中 (∇(k))^2 是关于变量 x(k) 的拉普拉斯算符。N 粒子定态是 H 的本征函数,本征值 E 就是这些粒子的总能量。

回忆一下,如果势能只依赖于粒子的相对位置,则系统具有平移不变性,且在经典力学中总动量守恒。类似地,在量子力学中,平移不变性意味着总动量算符 P 与哈密顿量 H 对易。这意味着存在一组完备的定态,它们同时是 H 和 P 的本征态。这些态具有确定的能量和确定的总动量(也记为 P)。对于两个粒子组成的系统,这种态的波函数具有如下形式:
Ψ(x(1), x(2)) = e^{i/¯h P·X_CM} ψ(x(2) − x(1)) , (8.63)
其中 X_CM 是通常的两粒子质心,x(2) − x(1) 是粒子间的分离矢量。

现在假设这 N 个粒子是全同的。(所谓全同,是指这些粒子即使在原则上也无法区分。)这些粒子可以是,例如,原子中彼此相互作用并与固定原子核相互作用的电子,或者是全同原子构成的气体,其中原子被当作点粒子,其内部结构被忽略。

几个全同粒子的量子力学
251
全同粒子都具有相同的质量 m,因此哈密顿量(8.62)具有略微简洁的形式:
H = −
N
X
k=1
¯h2
2m(∇(k))2 + V (x(1), x(2), . . . , x(N)) 。
(8.64)
V 在点 x(1), x(2), . . . , x(N) 的置换下保持不变,因为置换不会改变粒子的组态,只会改变粒子的标记。哈密顿量中的动能部分具有相同的置换对称性。这对波函数有什么影响呢?

交换波函数中的标记并不会改变全同粒子的组态。由此可知,概率密度 |Ψ(x(1), x(2), . . . , x(N))|2 必定等于在交换了前两个标记之后的概率密度 |Ψ(x(2), x(1), . . . , x(N))|2。然而,波函数本身在这种标记交换下可能会获得一个相位因子:
Ψ(x(2), x(1), . . . , x(N)) = eiα Ψ(x(1), x(2), . . . , x(N)) 。
(8.65)
如果我们再次交换前两个标记,就会回到原始函数,因此 e2iα = 1。所以只有两种可能:要么 eiα = 1,要么 eiα = −1。在第一种情况下,我们称波函数是玻色型的(bosonic);在第二种情况下,称波函数是费米型的(fermionic)。如果波函数是玻色型的,那么这些粒子被称为玻色子(bosons);如果波函数是费米型的,那么这些粒子被称为费米子(fermions)。

一旦对交换第一对标记的效果做出选择,那么对于任何一对标记也都必须做出相同的选择。这是因为,由于粒子是全同的,它们必须被完全相同地处理。此外,混合选择会与哈密顿量的对称性不相容。因此,玻色型波函数在交换任意一对标记时都保持不变,从而在所有可能的标记置换下都保持不变,这被称为完全对称。费米型波函数在交换任意单独一对标记时会改变符号,因此是完全反对称的。它在任何奇置换下改变符号,而在偶置换下保持不变。所谓奇置换,我们指的是奇数个成对交换的组合结果。它可以以多种方式表达为这样的组合,但其奇偶性始终不变。利用方阵行列式的性质很容易证明这一点。行的奇置换会改变行列式的符号,因此它必定总是奇数个行交换的结果,而每次行交换都会改变符号。类似地,偶置换是偶数个成对交换的组合,而行列式行的偶置换不会改变符号。

这些不同类型的波函数不仅仅在代数上不同,它们在物理上也有所不同,因此可能具有不同的能量,我们可以通过一个简单的例子来说明。考虑两个在一维空间中通过谐振子势相互作用的粒子。设 ξ = x(2) − x(1) 为间距,因此势为 V (ξ) = 1/2 mω^2 ξ^2。注意 V 在交换粒子标记时保持不变。质心是 XCM = 1/2 (x(1) + x(2)),定态波函数的形式为
χ(x(1), x(2)) = e^{i/¯h P XCM} g(ξ) ,
(8.66)
其中 P 是总动量。在标记交换下,ξ 改变符号,但 XCM 不受影响,并且涉及 XCM 的相位因子不会改变。因此,对于两个费米子,

252
三维空间中的量子力学
g 必须是 ξ 的奇函数,即当 ξ 变号时函数值变号,而对于两个玻色子,g 必须是偶函数。我们之前研究过谐振子的定态。第 n 个态的能量为 E_n = (n + 1/2)¯hω,它由一个厄米多项式 H_n 乘以一个关于 ξ 为偶函数的指数因子构成。厄米多项式在 n 为偶数时是偶函数,在 n 为奇数时是奇函数。因此,对于玻色子,n 必须为偶数;而对于费米子,n 必须为奇数。两个玻色子的基态是 n=0 的态,但两个费米子的基态是 n=1 的态,具有更高的能量。

费米子态是在 ξ=0 处为零的函数。换句话说,两个费米子不能处于同一位置,并且它们非常接近的概率也很小。这一结果可推广到 N 个费米子的波函数。费米子波函数 Ψ(x(1), x(2), . . . , x(N)) 在任意一对标签交换时变号。因此,当任意两个自变量 x(k) 和 x(l) 相同,即两个粒子处于同一位置时,Ψ 必须为零。由于波函数的导数通常是有限的,当任意一对粒子间的距离很小时,Ψ 也很小。这一结果称为泡利(Pauli)不相容原理。

由于泡利原理,费米子粒子之间表现出物理上的排斥,但这并非排斥势的结果。如果将 N 个费米子限制在一个大小固定的有限盒子里,由于这种排斥,能量随 N 增加的速度远大于 N 本身。对于玻色子,不存在这样的效应。

一个关于 N 个全同粒子的简单模型是:它们与一个背景势 U 相互作用,但彼此之间没有直接相互作用。这种情况下的势能是单体项之和:
V (x(1), x(2), . . . , x(N)) = U(x(1)) + U(x(2)) + · · · + U(x(N)) , (8.67)
这是一个置换对称函数。此时定态薛定谔方程的解为乘积波函数:
χ(x(1), x(2), . . . , x(N)) = χ(1)(x(1))χ(2)(x(2)) · · · χ(N)(x(N)) , (8.68)
其中 χ(1), χ(2), . . . , χ(N) 是单体问题的解。从现在起,我们用记号 ε 表示单体能量,用 E 表示 N 粒子体系的总能量。波函数 (8.68) 的单体能量为 ε(1), ε(2), . . . , ε(N),在没有粒子间相互作用的情况下,总能量为 E = ε(1)+ε(2)+· · ·+ε(N)。
然而,为了使这个波函数满足玻色子或费米子所要求的置换对称性质,还需要进一步处理。我们必须将其对称化或反对称化。
玻色子的基态特别简单。我们取 χ(1), χ(2), . . . , χ(N) 全都等于单体基态 χ_0,其能量为 ε_0,于是:
χ(x(1), x(2), . . . , x(N)) = χ_0(x(1))χ_0(x(2)) · · · χ_0(x(N)) . (8.69)
这个波函数是全对称的,能量为 Nε_0。

对于费米子,可接受的定态波函数更为复杂,但可以写成一个行列式。我们选取 N 个不同的单体波函数 χ(1), . . . , χ(N),将完全波函数写为:
χ(x(1), x(2), . . . , x(N)) =
| χ(1)(x(1)) χ(2)(x(1)) . . . χ(N)(x(1)) |
| χ(1)(x(2)) χ(2)(x(2)) . . . χ(N)(x(2)) |
| … . . … |
| χ(1)(x(N)) χ(2)(x(N)) . . . χ(N)(x(N)) | . (8.70)

多个全同粒子的量子力学
253
将其展开后,会得到 N! 个形如方程(8.68)右端那样的乘积之和(包含一些负号)。χ 是完全反对称的,因为行列式在交换任意两行时会变号。每个单粒子波函数必须是互不相同的,否则行列式中的两列就会相同,整个波函数将变为零。总能量依旧是单粒子能量之和,基态由选取 N 个能量最低且互不相同的单粒子态组合进行列式中而得到。基态能量大于 Nε0。

这一模型——多个粒子与背景势发生相互作用,但彼此之间没有直接相互作用——通常是一个有用的近似。它在整个化学领域都被采用,在固体物理中则被称为独立电子模型(independent electron model)。利用这个近似,可以按下述简单方法来构造 N 个粒子的玻色子型和费米子型定态。

首先要解出势场中的单粒子问题,并对各状态加以标记。它们可以按照能量递增的顺序标记为 0, 1, 2, …,或者直接用实际能量 ε0, ε1, … 来标记。(如果某个能级是简并的,就需要添加额外的标记,例如角动量标记。)然后,一个玻色子态通过给出各个单粒子态的占据数 n0, n1, … 来指定。由这些占据数,可以将整个波函数重新构造为单粒子波函数乘积的求和形式。总粒子数必须满足 n0 + n1 + … = N,因此只有有限个占据数可以不为零。对占据数没有其他约束。总能量是各被占据态的能量之和,其中已计及占据数。基态为 n0 = N,而所有其他占据数均为零,如图 8.6 左图所示。

一个费米子态同样由占据数来指定,但这些数只能是 0 或 1。任何一个单粒子态都不能被多重占据。这是泡利不相容原理(Pauli exclusion principle)的另一种表述方式。对于 N 个费米子,有 N 个单粒子态被单重占据,其余的态为空。波函数是由被占据态构造而成的行列式,总能量是被占据态的能量之和。

我们先前关于泡利原理的讨论需要稍加修正,以便将自旋考虑在内。对于 N 个自旋为 1/2 的费米子,必须将自旋态包含在波函数中。当粒子之间没有直接相互作用,且每个粒子可以处于自旋向上或自旋向下的态时,情况最为简单。单粒子波函数记为 χ(x)↑ 和 χ(x)↓。当一对粒子的位置和自旋标记同时交换时,总波函数必须变号。能量是否依赖自旋态并无影响。泡利原理的那种表述——任何态的占据数要么为 0 要么为 1——仍然有效。

泡利原理允许两个全同的自旋 1/2 粒子(但不能更多)具有相同的空间波函数 χ,如图 8.6 右图所示,前提是一个粒子自旋向上,另一个粒子自旋向下,并且自旋态被反对称化。这样的波函数写作
χ(x(1))χ(x(2)) 1/√2 (↑↓ − ↓↑) 。
(8.71)
它在空间部分是对称的,在自旋部分是反对称的。另一种可能则是自旋态对称,而空间波函数反对称,例如,
(χ(1)(x(1))χ(2)(x(2)) − χ(2)(x(1))χ(1)(x(2))) ↑↑ 。
(8.72)

量子力学中的三维问题
图8.6 左:玻色子基态。右:费米子基态。其中χ(1)和χ(2)是不同的。
对于两个粒子,反对称的自旋态 1/√2 (↑↓-↓↑) 是唯一的,且总自旋为零。然而,存在三个对称自旋态:↑↑,1/√2 (↑↓+↓↑) 和 ↓↓,它们是总自旋为1的态的三个投影。
当粒子之间存在真实的相互作用时,这些波函数并不是定态薛定谔方程的精确解。不过,它们作为近似解是很有用的,并且它们具有正确的置换对称性。更好的近似,特别是对于基态,可以通过调整背景势和单粒子波函数以某种方式考虑作用在粒子之间的力来获得。这被称为哈特里方法(用于玻色子)或哈特里–福克方法(用于费米子)。
8.7.1 费米球
假设在一个盒子中有N个自旋为1/2的费米子,其中N非常大,并且这些粒子之间没有相互作用。金属样品中的电子就是一个相当好的例子,因为尽管电子-电子之间的库仑力相当大,但它们被金属中带正电的背景离子大致中和了。在基态,费米子占据能量最低的可用态。单粒子态在某个能量ε_F以下的占有数为1,在高于此能量的所有态占有数为0。ε_F 被称为费米能。
我们可以利用态密度计算出费米能ε_F和基态的总能量。对于体积为V的盒子中质量为m、自旋1/2的粒子,单粒子态密度为 g(ε) = V/(2π^2) * (2m/ħ^2)^(3/2) * ε^(1/2)。这是用能量ε表示的,与公式(8.13)相比多了一个因子二,这是因为有两个独立的自旋态。对于被占据的态,ε从零(单粒子基态能量)向上延伸至费米能ε_F。因此,粒子的总数N为
N = ∫_0^εF g(ε) dε = V/(2π^2) * (2m/ħ^2)^(3/2) * (2/3) * ε_F^(3/2)。 (8.73)

玻色子、费米子与自旋
255
将其反转,我们得到
εF = ¯h2
2m
3π2N
V
 2
3
,
(8.74)
这表明费米能量仅取决于粒子的空间数密度 N
V 。总能量 E 是类似 N 的积分,但被 ε 加权,
E =
Z εF
0
g(ε)ε dε = V
2π2
2m
¯h2
 3
2 2
5 ε
5
2
F .
(8.75)
这可以用公式 (8.74) 以 N 和 V 表达,给出
E = 3(3π2)
2
3
5
¯h2
2m
N
V
 2
3
N .
(8.76)
在 k 空间或 p 空间中,被占据的态填满了一个称为费米球 (Fermi sphere) 的球体内部。费米球的半径 kF 通过 1
2m(¯hkF)2 = εF 与费米能量 εF 相关联,并且就是 kF =

3π2N
V
 1
3 。

8.8
玻色子、费米子与自旋
每一个粒子,无论是像电子这样的基本粒子,还是像原子这样的复合粒子,要么是玻色子,要么是费米子。但它究竟是哪一种?引人注目的是,这仅取决于粒子的自旋。实验表明,具有整数自旋 0, 1, . . . 的粒子总是玻色子,而具有半整数自旋 1
2, 3
2, . . . 的粒子总是费米子。在量子力学内部,确实无法理解为什么会这样,并且在考虑诸如原子结构等物理问题时,多电子波函数必须是反对称的这一要求必须人为加入。然而,在粒子的相对论性理论中,有一个定理可以解释这种关系,尽管它并非基础性的。

如我们所见,电子具有自旋 1
2,因此是费米子。这一事实的重要性怎么强调都不为过。它对于原子和分子中电子的行为,以及对于像金属和半导体这类材料中无数电子的行为,都有着至关重要的影响。我们将在第9章中,基于我们对费米球的讨论来探讨这些影响。

一个原子由电子、质子和中子组成,所有这些都是费米子性粒子。那么,如果它包含的费米子数量是偶数,整个原子就是玻色子性的,因为交换两个这样的原子的标签,需要对偶数个费米子对进行标签交换。这与原子的自旋是整数是一致的。(原子的总自旋是偶数个相互作用的半整数自旋费米子的自旋,与一些轨道角动量——它总是整数——的组合。)相比之下,交换两个各自由奇数个费米子组成的原子的组分标签表明,这样的原子必定是费米子性的。这同样与原子的自旋是一致的,该自旋是奇数个半整数自旋的组合,因此也是半整数的。

中性原子根据其组成,可以是费米子或玻色子。这在低温下会导致一些非常令人惊讶的行为。例如,氦-4 原子包含两个电子、两个质子和两个中子,因此是玻色子。在…

256
三维空间中的量子力学
当温度低于4.2 K时,氦-4呈现为液态。进一步冷却至2.17 K时,它会转变为超流体——一种无粘性、对流动无阻力的液体。一个原本能完好盛装普通液态氦的容器,一旦被冷却到此温度以下,就会突然出现许多泄漏,因为超流氦会通过容器上的超微孔隙渗出。超流氦-4具有许多奇异而绝妙的性质。相比之下,氦-3在这些温度下仍为普通液体。这是因为氦-3原子由两个电子、两个质子和一个中子组成,因此它们是费米子。当氦-3被进一步大幅冷却时,会发生一件非凡的事情:在仅2.49×10⁻³ K的温度下,氦-3原子会配对。每个氦-3原子自旋为1/2,但一对原子的自旋沿相同方向排列,使得总自旋为1。氦-3对是一种玻色子,结果是氦-3变成了超流体。将氦-3对结合在一起的键极其微弱,微小的温度升高就会将它们拆散。这就是为什么氦-3必须被冷却到如此超低的温度才能变为超流体。

光子自旋为1,因此是另一种重要的玻色子类型。它们以光速传播,必须用量子理论的相对论版本来描述。光子的玻色子特性使激光成为可能,也奠定了将光视为满足麦克斯韦(Maxwell)方程组的经典电磁波来处理的基础。正如我们将在第12章中看到的,电磁力源于带电粒子之间交换光子。一般而言,在量子理论中,自然界的各种力都是通过其他粒子之间交换玻色子而产生的。

8.9 重返作用量
在日常生活中,我们熟悉粒子遵循明确轨迹的概念。粒子运动的量子描述则截然不同。早在1800年,托马斯·杨(Thomas Young)就描述了光产生的干涉图样,并将其结果与水波的干涉相比较。我们现在知道光由光子组成,而这些单个的玻色子粒子具有类似波的性质。在20世纪20年代,克林顿·戴维孙(Clinton Davisson)和莱斯特·革末(Lester Germer)证实了电子的行为方式非常相似。这一点通过图8.7所示的双缝实验得到了最好的说明。电子从源A发射,穿过两条邻近的狭缝B和C,然后到达探测屏。在屏上某点D探测到电子的概率在屏上呈周期性变化。我们得出结论:正如德布罗意(de Broglie)所提出的,电子与波相关联,并且这些波根据其相对相位而相互叠加或抵消。既然电子从A运动到D有两条不同的路径可用,它到达D的振幅Ψ = μ(e^iφB + e^iφC) 就是它经过B或C这两条路径的振幅之和。在D点发现它的概率是
|Ψ|² = μ²(e^iφB + e^iφC)(e^−iφB + e^−iφC) = 2μ²(1 + cos(φC − φB)) , (8.77)
其中μ是归一化常数。

在实验上,可以将电子源调得非常弱,以至于在任何特定时刻只有一个电子穿过仪器。干涉图样仍然会出现,这确立了量子力学中单个电子的类波本性。量子力学的另一个特征是,该图样是概率性地建立起来的,只有探测到大量单个电子后才会变得清晰。

回到作用量

257
A
B
C
D
O
y
x
图8.7 从源A发出、穿过屏障上两条狭缝的电子束,在远端的屏幕上产生了干涉图样。电子到达D点的振幅Ψ,等于它沿两条可能路径传播的振幅之和。

到目前为止,我们还没有解释如何计算相位差φ_C - φ_B。我们可以尝试对这个装置中的单个电子求解薛定谔(Schrödinger)方程。不过,还有一种替代方法,即使用经典粒子的作用量。在第1章中,我们展示了光的一些熟知性质,如反射和折射,是如何遵循费马原理(Fermat’s principle)的;在第2章中,我们又展示了如何从最小作用量原理(principle of least action)推导出牛顿运动定律。事实上,有了正确形式的作用量,这个原理就能解释整个经典物理学。显然,最小作用量原理具有深远的影响,但到目前为止,我们还没有解释它为何有效。答案相当出人意料,它为经典力学与量子力学之间的关系提供了最清晰的洞察。

狄拉克(Dirac)在1933年首次讨论了作用量在量子力学中的角色,他的论述后来被费曼(Feynman)继承发扬,费曼利用它们发展出了一种替代的量子力学途径。这种方法与此前的表述完全等价,但对量子世界的奇异性及其意义提供了额外的洞见。费曼的分析受到了双缝实验的启发。他决定认真对待一个看似荒谬的观念:穿过双缝装置的电子沿两条可用路径同时传播,或者至少以某种方式“知道”这两条路径。遵循狄拉克的思路,他提出:要确定电子到达屏幕上D点的振幅Ψ,就必须计算穿过该装置的两条路径的作用量,并将两者的贡献作为相位因子都包括进来,于是
Ψ = μ(e^{iφ_B} + e^{iφ_C}) = μ ( exp( i/ħ S_B ) + exp( i/ħ S_C ) )。
(8.78)
这里,S_B是电子沿路径x(t)从A经由B到达D的作用量,S_C则是经由C的路径的作用量。该作用量即第2章中所定义的作用量。

258
三维空间中的量子力学
S[x(t)] =

L dt =

(K − V ) dt ,
(8.79)
其中K为动能,V为势能。
重要的是相对相位。若两条狭缝B与C与源A等距,则从源到狭缝的路径相位相同,在|Ψ|²中互相抵消。我们只需考虑从狭缝到探测屏的路径。如图8.7所示建立坐标系:以屏上与两狭缝等距的点O为原点,x轴垂直于屏面,y轴沿屏面方向。设两狭缝间距为2f,狭缝到屏面的垂直距离为l。假设电子在时间0经过狭缝,在时间T到达屏面。(我们求和的是时间T时对振幅的贡献,因此对于每条路径该时间都是相同的。)
对于自由非相对论电子,V = 0,拉格朗日量L即为动能K = ½m(v²ₓ + v²ᵧ)。抵达屏上坐标为y的点D的作用量为S = ½m(v²ₓ + v²ᵧ)T。沿x和y方向的速度分别为
vₓ = l/T ,
vᵧ = (y ∓ f)/T ,
(8.80)
其中经狭缝B的路径取上号,经狭缝C的路径取下号。因此
ϕ_B = (1/ħ)S_B = (m/2ħ)[ (l/T)² + ((y − f)/T)² ]T = (m/2ħ)(l² + (y − f)²) vₓ/l ,
(8.81)
同理
ϕ_C = (m/2ħ)(l² + (y + f)²) vₓ/l .
(8.82)

ϕ_C − ϕ_B = (m/2ħ)(4yf)vₓ/l = (2fmvₓ)/(ħl) y ,
(8.83)
利用方程(8.77),我们得出电子抵达探测屏上D点的概率为
|Ψ|² = 2μ² [ 1 + cos( (2fmvₓ)/(ħl) y ) ] .
(8.84)
该结果在4μ²与零之间振荡,当y = 0(即两条路径长度相等)时取最大值。屏上干涉图样的波长为
λ = 2π ħl/(2fmvₓ) .
(8.85)
vₓ由l和T决定,但更符合实际的做法不是固定T,而是固定电子的能量E,并利用关系式E = ½mv²ₓ来确定vₓ。
费曼(Feynman)设想通过增加屏障上狭缝的数量来增加可用路径。每条这样的路径都会对电子抵达屏上某特定点的振幅作出贡献,而这总振幅决定了干涉图样的形式。最终,为模拟自由空间中的电子,费曼设想不断增加狭缝数量直至屏障完全消失。随后他论证道,

回到作用量

为了一致性,电子仍然必须遵循那些穿过现已不可见的屏障上所有点的路径。此外,屏障的位置是完全任意的;它本可以放在源和探测器之间的任何地方。因此,我们得到了一个惊人但不可避免的结果:真空中一个自由电子实际上必须遵循A和D之间所有可想象的路径,而电子到达D的振幅包含了这浩繁无穷路径集合的贡献。费曼(Feynman)由此得出结论,一个电子(或其他粒子)从A发射并在D被探测到的振幅为

[
\Psi = \mu \sum_{\text{paths}} \exp\left( \frac{i}{\hbar} S[x(t)] \right),
\tag{8.86}
]

其中求和遍布所有可能的、从A到D在固定时间间隔0到T之间的光滑路径,而粒子沿每条路径的瞬时速度并不固定。

这个公式被称为费曼路径积分(Feynman path integral)。它累加来自不可数无穷多条路径的贡献,其中大多数路径包含说不尽的扭动,但它非常民主,因为所有路径都被平等对待;不同路径之间振幅的唯一区别是它们的相位。费曼证明了(允许D的位置可变)振幅(\Psi)满足薛定谔方程,并完全等价于通常的波函数。在非相对论量子力学中,求解薛定谔方程通常比进行等效的路径积分计算要简单得多,但在考虑量子场论时这种技术的优势便显现出来,而在处理规范理论时它更变得不可或缺。

费曼的路径积分方法为经典力学和量子力学之间的关系提供了一个非常有趣的视角。经典力学适用于我们可以将(\hbar)视为非常小的情形。此时表达式(\exp( \frac{i}{\hbar}S[x(t)]))中的相位变化迅速,一条路径导致的相位可能与其邻近路径的相位显著不同。令(S_i[x(t)])表示沿路径i求值的作用量。那么如果(S_2[x(t)] = S_1[x(t)] + \pi \hbar),路径2的贡献刚好抵消路径1的贡献,因为(\exp( \frac{i}{\hbar}S_2[x(t)]) = -\exp( \frac{i}{\hbar}S_1[x(t)]))。一般而言,当沿着与某条特定路径差异极微的路径求值时,相位会取遍0到(2\pi)的每一个值。把这些邻近路径的贡献加在一起时,它们会相消干涉,并不对粒子到达D的总振幅产生贡献。那些真正做出贡献的主要路径,是当我们偏离该路径时作用量在一阶近似下不发生改变的那些。这些路径正是使(S[x(t)]))取极小值或驻值的路径,被称为稳相路径(paths of stationary phase)。路径积分中的稳相条件恰好对应于经典的最小作用量原理(principle of least action)——当作用量取驻值时,相位即为稳恒。我们得出结论:在量子力学中,所有可能的路径都必须被考虑;但当经典近似有效时,路径积分由那些作用量取驻值的经典路径所主导。

我们可以问,一条路径需要变化多大,才能使其作用量改变(\pi \hbar),并在路径积分中使原路径和变化后路径的贡献相互抵消。对于一个自由非相对论粒子,质量为(m),动量为(p),在短时间(\Delta t)内运动,其作用量为(\Delta S = \frac{p^2}{2m}\Delta t)。若运动的距离为(\Delta x),则动量(p = m \frac{\Delta x}{\Delta t}),于是

[
\Delta S = \frac{p^2}{2m}\Delta t = \frac{1}{2} p \Delta x .
\tag{8.87}
]

260
三维空间中的量子力学
因此,若∆x = 2π¯h/p(这正是德布罗意(de Broglie)波长),则有∆S = π¯h。这样一来,量子力学的路径积分图像就解释了为什么动量为p的粒子会表现得像波,其波长由德布罗意关系式给出。

这也揭示了经典力学何时适用。只要我们不考虑比粒子德布罗意波长更小的长度尺度,粒子的经典轨迹就是一个有用的概念。对于以10 m s⁻¹运动的台球,其波长极其微小,仅为10⁻³⁴ m,因此用经典力学描述其运动总是安全的。然而,原子中电子的德布罗意波长约为一个纳米,比原子本身还要大,所以当考虑电子与原子之间的相互作用时,我们不能使用经典力学近似。这一点在下一章中将会很重要。不过,在我们讨论电子穿过宏观双缝装置时,我们使用经典轨迹来确定每条路径的作用量,并将路径积分视为仅有的两项贡献之和,这是合理的。

8.10
扩展阅读
除了第7章末尾推荐的扩展阅读资料外,另请参阅:
E. 梅茨巴赫(Merzbacher),《量子力学》(第三版),纽约:Wiley出版社,1998年。

关于费曼(Feynman)量子力学路径积分方法的原著修订校正版,请参阅:
R.P. 费曼(Feynman)和A.R. 希布斯(Hibbs),《量子力学与路径积分:D.F. 斯泰尔(Styer)修订版》,纽约州米尼奥拉:Dover出版社,2010年。