12_Particle_Physics

12
粒子物理
12.1
标准模型

在本章中,我们将探究物质的基本组分。至此,我们已经从四种不同的力的角度考察了宇宙的结构及其所包含的物质:引力与电磁力,再加上两种核力——强力和弱力。引力决定了宇宙的大尺度结构,但引力内在的微弱性意味着它对基本粒子对(例如原子中的电子)之间相互作用的影响完全可以忽略不计。相比之下,其他三种力在粒子物理中都扮演着重要角色。电磁力将原子束缚在一起,强力将质子和中子束缚在原子核中,它在α衰变和核裂变中也至关重要。弱力负责原子核的β衰变,并在恒星内部元素合成中起主要作用。当弱力起作用时,粒子可能会改变其身份。例如,在β衰变中,一个中子转变为一个质子,同时产生一个电子和一个电子反中微子。今天,这三种力被理解在一个单一的结构中,其中包括电磁力和弱力的统一理论,以及与强力的一个相当类似的理论相结合。这个极为成功的理论是现代物理学的辉煌胜利之一,它被称为标准模型。

质量
电荷
2/3
≈2.3 MeV/c²
≈4.8 MeV/c²
≈95 MeV/c²
≈4.18 GeV/c²
≈126 GeV/c²
0.511 MeV/c²
<2.2 eV/c²
<0.17 MeV/c²
<15.5 MeV/c²
105.7 MeV/c²
1.777 GeV/c²
≈1.275 GeV/c²
≈173.07 GeV/c²
1/2
–1/3
1/2
–1
1/2
0
1/2
0
1/2
0
1/2
–1
1/2
–1
1/2
–1/3
1/2
–1/3
1/2
2/3
1/2
2/3
1/2
0
u

d

e
电子
νₑ
电子中微子
ν_μ
缪子中微子
ν_τ
陶子中微子
μ
缪子
τ
陶子
夸克
轻子
规范玻色子


s
b

c
胶子
希格斯玻色子
光子
Z玻色子
W玻色子
G
H
Z
W
γ
t

自旋
0
0
0
1
0
0
1
91.2 GeV/c²
80.4 GeV/c²
0
1
±1
1

图12.1 标准模型粒子表。前三列展示了三代费米子,最后一列展示了玻色子。

The Physical World. Nicholas Manton and Nicholas Mee, Oxford University Press (2017).
©Nicholas Manton and Nicholas Mee. DOI 10.1093/acprof:oso/9780198795933.001.0001

394
粒子物理
12.1.1
基本粒子
所有已知粒子和相互作用都可约化为少数几种基本粒子的相互作用,如图 12.1 所示。每一种粒子都由其静止质量、自旋以及决定其相互作用的各类荷完全定义。粒子还可能具有许多其他性质,比如磁矩,以及它们衰变为其他类型粒子的速率。这些都可以从理论上计算。量子力学将同种粒子视为全同粒子。它们自然地分为两类:玻色子(bosons),具有整数自旋,遵循玻色-爱因斯坦统计;费米子(fermions),具有半整数自旋,遵循费米-狄拉克统计和泡利不相容原理。基本费米子只有 12 种,自旋均为 1/2,连同它们的反粒子,列于表 12.1 中。它们分为两类:夸克(quarks)和轻子(leptons),取决于它们是否受强力影响。夸克通过强力、弱力和电磁力发生相互作用。带电轻子,即电子、μ子和τ子,通过电磁力和弱力相互作用,但不参与强力。不带电的轻子是中微子。它们只通过弱力相互作用。

这 12 种费米子构成了三代,每代包含四个粒子。第一代由上夸克、下夸克、电子和电子中微子组成。普通物质由前三种粒子构成。质子由两个上夸克和一个下夸克结合而成。中子由两个下夸克和一个上夸克组成。第二代的两个夸克称为粲夸克和奇异夸克,两个轻子是μ子和μ子中微子。第三代由顶夸克、底夸克、τ子和τ子中微子组成。第二代和第三代中的每一个粒子都带有与第一代对应粒子相同的荷,似乎只是它们的更重复制品。

大多数粒子是不稳定的,并通过由某种基本相互作用控制的过程衰变。较重的粒子衰变为两个或更多较轻的粒子,释放出的能量以衰变产物的动能形式带走。如果这类粒子的平均寿命为 T(即半衰期 (log 2)T),在时间 t = 0 时有 N(0) 个粒子,那么随后时刻的粒子数为
N(t) = N(0) exp(−ℜt)
(12.1)
其中衰变率为 ℜ = 1/T。通常,在对撞机实验中测量的是衰变宽度
Γ = ¯hℜ = ¯h/T
(12.2)
(以能量为单位)。短寿命粒子的静止质量(或能量)因量子力学不确定性关系而无法精确定义。Γ 是静止质量分布的宽度,例如在图 12.26 中所示。若粒子有多种衰变方式,则有
Γ_total = Σ_i Γ_i

Br_i = Γ_i / Γ_total,
(12.3)
其中 Γ_i 是衰变模式 i 的部分衰变宽度,Br_i 是该模式的分支比。

量子场论
395

轻子
q
质量 (GeV)
夸克
q
质量 (GeV)
I
电子 (e⁻)
−1
0.0005
上夸克 (u)
2/3
0.002
I
中微子 (νₑ)
0
< 10⁻⁹
下夸克 (d)
−1/3
0.005
II
μ子 (µ⁻)
−1
0.106
粲夸克 (c)
2/3
1.3
II
中微子 (ν_µ)
0
< 10⁻⁹
奇异夸克 (s)
−1/3
0.1
III
τ子 (τ⁻)
−1
1.78
顶夸克 (t)
2/3
173
III
中微子 (ν_τ)
0
< 10⁻⁹
底夸克 (b)
−1/3
4.2
表12.1 标准模型(Standard Model)中的基本自旋1/2费米子。q是以质子电荷为单位的电荷数。(每个粒子都有一个质量相同、电荷相反的反粒子。)
玻色子
q
质量 (GeV)
自旋
作用
胶子 (G)
0
0
1
QCD交换玻色子
光子 (γ)
0
0
1
QED交换玻色子
W±玻色子
±1
80.4
1
弱交换玻色子
Z玻色子
0
91.2
1
弱交换玻色子
希格斯玻色子 (H)
0
125
0
希格斯机制
表12.2 标准模型中的基本玻色子。
在粒子衰变中观察到的寿命通常为:强力,10⁻²⁴−10⁻²⁰ s;电磁力,10⁻¹⁹−10⁻¹⁶ s;弱力,10⁻¹²−10⁻⁶ s。第二代和第三代的夸克以及带电轻子是不稳定的,主要通过弱力迅速衰变。
有两个守恒定律似乎在所有粒子碰撞和衰变中普遍成立。它们是轻子数守恒,其中每个轻子贡献+1,每个反轻子贡献−1;以及重子数守恒,其中每个夸克贡献1/3,每个反夸克贡献−1/3。出现1/3这个因子,是因为重子(如质子和中子)由三个夸克组成,而反重子由三个反夸克组成。
基本玻色子见表12.2。表中列出的这少数几种自旋为1的玻色子的交换,产生了强力、电磁力和弱力,我们稍后将讨论。希格斯玻色子是唯一已知的自旋为0或标量的基本粒子。它在标准模型中扮演着独特的角色,通过赋予W和Z玻色子以及基本费米子质量(但不赋予光子质量)来打破电弱力的对称性。基本粒子(无论是费米子还是玻色子)的质量差异巨大。
标准模型中所有粒子和力的行为,只能由同时结合了量子力学和相对论的理论来解释。实现这种结合的正确语言是量子场论(quantum field theory),我们现在转向它。
12.2 量子场论
爱因斯坦(Einstein)最先引用量子力学来解释光电效应,将电磁波视为由光子组成,光子是无质量、以光速运动的粒子。然而,标准的量子力学显然是一个非相对论理论。薛定谔方程包含对时间的一阶导数,却包含对空间的二阶导数。此外,能量与动量的关系对于一个

396
粒子物理
一个质量为m、不受势场作用的量子力学粒子的能量为E = p²/2m,而非相对论关系E² = p² + m²。为了描述光子及其他以接近光速运动的粒子,需要找到一种与狭义相对论相容的量子力学形式。

最早的尝试是寻找薛定谔(Schrödinger)方程的相对论性不变等价物,并期望其解就是相对论粒子的波函数。起初有两个方程看起来颇有希望。一个是克莱因-戈尔登(Klein–Gordon)方程,我们在第3.2节中提到过。在该方程中,单个时间导数被移除,而负拉普拉斯算子−∇²被波算子∂²/∂t² − ∇²取代。第二个更激进的选项是狄拉克(Dirac)方程。狄拉克认识到在量子力学波动方程中保留单个时间导数的重要性,这样波函数向未来的演化仅取决于初始时刻的波函数本身,而不依赖于它的一阶时间导数。这与波函数坍缩的假设一致,该假设意味着波函数由测量结果决定,其后续演化则由波动方程确定。狄拉克方程将单个时间导数与单个空间导数结合在一起。我们将在第12.3节中描述实现这一点的创新方式。

然而,无论是克莱因-戈尔登方程还是狄拉克方程,都不能被视为薛定谔方程真正的相对论性单粒子类比。以这种方式使用克莱因-戈尔登方程的缺陷在于,无法定义合适的粒子位置概率密度。狄拉克方程的障碍是,除了通常的正能量态外,其解还包括具有任意大负能量的粒子态。

这些问题的根本原因在于,粒子在相对论速度下的相互作用可能涉及足够的能量来产生新粒子。在标准量子力学中,可以为多个相互作用的粒子定义波函数,正如我们在第8.7节所做的那样,但粒子数不随时间改变。然而,当粒子以接近光速运动时,其总能量可能是其静止质量的数倍。在高能粒子碰撞中,能量很容易转化为新的粒子,因此在相对论物理学中,粒子数经常发生变化。这意味着相对论量子力学必然是一个多粒子理论,而且粒子数并不固定。

历史上,理解粒子数可变的多粒子量子力学的进展颇为曲折,但最终的结果是量子场论。克莱因-戈尔登方程和狄拉克方程在这里重新出现,但它们是作为相对论性场方程,其解释更接近经典麦克斯韦(Maxwell)方程组。我们对这一主题的讨论将主要是描述性的,因为量子场论中的计算涉及大量技术细节和复杂的数学工具。

在经典物理学中,物质粒子与场之间有着清晰的区别。粒子是点状的或至少是高度定域的,而场则贯穿时空;场也负责粒子之间的力。量子场论在很大程度上消解了这一区别。例如,存在一个与电子相关的电子场,正如存在一个与光子相关的电磁场一样。然而,仍有一些区别,因为物质主要由费米子粒子组成,而半整数自旋的费米子(如电子)与整数自旋的玻色子(如光子)对应着不同类型的量子化场。

量子场论
397
量子场论的一个强大特征是,它能够解释粒子相互作用的所有方式(引力相互作用除外)。因此,通常用吸引或排斥力来描述的粒子束缚态和粒子散射理论,与粒子产生和衰变的理论被统一起来。这就是为什么我们把中子衰变或Z玻色子产生等现象归因于弱力的原因。

12.2.1 电磁场的量子化
目前人们相信,每种基本粒子都有一个对应的场,而这些场是时空结构的一部分。一个场在空间的每一点都有一个动力学自由度,因此总体来说,一个场拥有无限多个自由度。不同点的场值相互耦合,结果在最简单的情况下,场方程的基本动力学解是波模,具有确定的波矢k和频率ω。场方程用k来决定ω,但由于k可以是任何三维矢量,因此仍然存在无限多个解。在经典理论中,每个波模的振幅A(k)都独立地振荡。

在量子场论中,这些振幅中的每一个都被当作一个量子谐振子来处理,并且对于每一个k都有一个谐振子。(这里进行类比的是谐振子的变量x和波模的变量A(k)。x通常是一个空间位置,但在这里并不重要。)粒子就是这些量子化波模的激发态。它们不是在空间上定域的,但它们具有确定的能量和动量,这些能量和动量与ω和k相关。

自旋为0的粒子是遵循克莱因-戈登方程(Klein–Gordon equation)或其变体的场的激发态。自旋为1/2的粒子是遵循狄拉克方程(Dirac equation)的场的激发态。我们将在适当的时候描述这些粒子,但首先我们将考虑自旋为1的光子。它们是更为人们熟知的电磁场的量子化激发。我们已经在第3章中考察了电磁场的经典理论,而在第10.10节关于黑体辐射的讨论中,光子也扮演了重要角色。

在构建电磁学的量子场论时,我们从服从无源相对论性麦克斯韦方程组(Maxwell equations)的经典电磁场开始。这个场具有无限多个波模,对于每个非零波矢k,有两个独立的偏振方向。(波矢为零的模是非物理的,因为它可以通过规范变换去除。)每个波模都有一个振荡幅度,由4维矢势A的强度,或者等效地由相互关联的电场和磁场强度来描述。麦克斯韦方程组意味着,波矢为k的波模的频率为ω = |k|。将电磁场量子化意味着将所有这些波模量子化。更准确地说,这意味着为一组无限维的谐振子构造一个量子哈密顿算符。这是三维谐振子的一个无限延伸,例如,在11.3.5节关于原子核的尼尔森模型(Nilsson model)中出现过。隐式地,所有谐振子都有一个薛定谔方程(Schrödinger equation),其组合解被称为场的波泛函。

对于具有波矢k和频率ω以及特定偏振选择的模,谐振子的能级为E_n = (n + 1/2)ħω,其中n = 0, 1, 2, …。基态被解释为没有光子的状态。第一激发态的能量比基态高ħω,并被解释为一个具有波矢k和频率ω = |k|的单光子,这与爱因斯坦(Einstein)的假设一致,即频率为ω的电磁波由能量为ħω的光子组成。第n激发态是n个光子的状态,每个光子都…

398
粒子物理
波矢k和能量¯hω,并且这个n光子态是唯一的,因此光子的排列交换没有影响。此外,对n没有限制,因此该理论正确地将光子描述为玻色子。量子场论的定态最好用占有数——即具有各种波矢k的光子数——来描述。一般的态是这些态的叠加。

如果所有模式都处于其基态,那么整个电磁场就处于基态。这个态被称为真空(vacuum),完全没有光子。频率为ω的谐振子的基态能量为1/2¯hω,因此所有波模式的基态能量之和(其数量为无穷大)似乎是一个无穷大的总能量。然而,这种能量在物理上是不可探测的,所以可以简单地将其舍弃,将基态能量定义为零。¹ 这可以通过将每个谐振子的量子哈密顿量移动一个常数来实现,使得其基态能量为零,而不是1/2¯hω。

经典电磁场既携带能量也携带动量。用波模式的振幅及其波矢k可以表达动量,由此我们可以在量子场论中推导出动量算符。它是每个波模式各自贡献的项之和。对于波矢为k的波模式,其动量算符与哈密顿量类似,只是将ω替换为k。因此,该模式的一个1光子态同时具有动量p = ¯hk和能量E = ¯hω。由于ω = |k|,这意味着光子满足相对论性的能量-动量关系E = |p|。所以光子是无质量的。

光子是自旋为1的粒子(矢量粒子)。一个有质量的自旋1粒子会有三个独立的极化状态,因为在其静止参考系中,所有三个正交的空间方向都可用。但由于光子是无质量的且不能静止(即不能具有零动量),因此它只有两个独立的极化状态,并且沿k方向没有极化状态,这是自洽的。这是经典矢量势中平行于k的纵向部分可以通过规范变换(如3.7节所述)消除的直接结果。然而,光子仍然是一个矢量粒子,因为在围绕k轴的空间转动下,其极化状态会像矢量一样旋转。

电磁场的量子化导出了一个完整的光子理论,将光子描述为无质量、自旋为1的粒子。这一方法的成功表明,其他粒子或许可以通过对满足适当场方程的不同类型场进行量子化来理解。

12.2.2 量子化的标量克莱因-戈登场
量子场论最方便的出发点通常是场的经典拉格朗日量密度。由此,利用最小作用量原理(principle of least action),可以推导出经典的动力学场方程,如2.3节所述。

让我们考虑一个实标量场φ(x, t)的如下拉格朗日量密度:
L = 1/2 ∂φ · ∂φ − 1/2 m₀²φ² = 1/2 (∂φ/∂t)² − 1/2 ∇φ · ∇φ − 1/2 m₀²φ², (12.4)
其中m₀是一个正的质量参数。总作用量是L在时空上的积分,
S = ∫ L d⁴x , (12.5)

¹ 这个步骤在我们将要考虑的电磁场或其他场的量子理论中不会带来任何问题,但这对于引力的量子理论来说会是一个问题,因为所有的能量都是引力场的源。

量子场论
399
由该作用量导出的场方程是克莱因-戈登(Klein–Gordon)方程
∂²φ
∂t² − ∇²φ + m₀²φ = 0 。 (12.6)
这就是我们的方程(3.18),但由于现在它满足相对论性要求,我们已取 c = 1。(同时将 µ 替换为 m₀。)

克莱因-戈登方程比麦克斯韦(Maxwell)方程组更简单,因为 φ 只有一个大小量,没有矢量极化,也无需考虑规范变换。它对 φ 是线性的,因此其独立解同样是波模,具有波矢 k 和频率 ω。将波形式
φ(x, t) = A e^{i(k·x − ωt)} (12.7)
代入方程(12.6),我们得到关系式
ω² = k² + m₀² 。 (12.8)
这个特解是复数的,但与其他涉及振荡的问题一样,可以利用复数解的线性组合得到实数解。此时,场以正频率 ω = √(k² + m₀²) 作简谐振荡。

量子化的处理方法是将每个波模视为一个量子谐振子,就像电磁场情形那样。对每个模,将谐振子振幅 A 量子化。频率为 ω 的模式的基态能量为 ½¯hω,并存在能量间隔为 ¯hω 的激发态。在真空中,所有模式都处于基态。无穷多个模式贡献的总基态能量同样被抛弃,并将真空定义为零能量。波矢为 k 的模的第一激发态被解释为一个单粒子态,类似于单个光子。该粒子的能量为 E = ¯hω = ¯h√(k² + m₀²),并且通过寻找代表场总动量的量子算符可以再次证明,该粒子具有动量 p = ¯hk。将式(12.8)乘以 ¯h² 表明,粒子的能量和动量满足关系
E² = p² + (¯hm₀)² , (12.9)
其中 E 为正。这正是质量为 m = ¯hm₀ 的相对论性粒子的能量-动量关系。因此,量子化后的实克莱因-戈登场理论描述了一种质量为 m 的单一类型粒子。若某个谐振子模式处于第 n 激发态,则该态代表 n 个全同粒子,每个粒子具有相同的动量和能量。与光子情形相同,我们得到的是一个玻色子理论。克莱因-戈登粒子的自旋为 0,因为单粒子态完全由其动量决定,不存在极化矢量。这类粒子被称为标量玻色子。

注意,粒子质量 m = ¯hm₀ 是一种涉及普朗克(Planck)常数的量子现象。这相当令人惊讶。m₀ 是场的质量参数,有时被不严谨地称为场的质量,但它本身的量纲并不匹配粒子质量。波模在空间上并非定域的,因此作为克莱因-戈登场激发的粒子并不具有明确的位置。动量与波矢之间是德布罗意(de Broglie)关系 p = ¯hk,因此在非相对论极限下,克莱因-戈登场与单个量子

400
粒子物理
力学粒子。克莱因-戈登场方程的解在波矢远小于 m0 时,表现得就像一个非相对论粒子的量子态。这是因为在小动量情况下,能量–动量关系 (12.9) 变为 E ≃ m + p²/2m。常数项 m 仅在场中产生一个普适的、依赖于时间的指数因子 e⁻ⁱᵐ⁰ᵗ。提取出这一因子后,剩下的就是一个满足质量为 m 的自由粒子薛定谔方程的场。通过组合不同动量的模式,我们可以像在非相对论量子力学中一样,构造一个空间局域的单粒子态。然而,动量必须很小,这限制了空间局域化的程度。任何过度局域化一个粒子的尝试,实际上都会产生一个多粒子态,因此,不存在与相对论一致的、精确截断到单粒子量子理论的情况。

12.3 狄拉克场
狄拉克场 ψ 满足一个在时间和空间导数上都是一阶的相对论性方程。这样的方程只有当使用四个 4 × 4 矩阵 γ(现在称为狄拉克矩阵或伽马矩阵)来构造时才有可能,因此 ψ 必须具有排列成一列的四个复分量。在第 8.5 节中,我们引入了自旋为 ½ 的电子的波函数是一个二分量旋量的概念。狄拉克场 ψ 是这一概念的修正,被称为四分量狄拉克旋量²。量子化后,它描述了两个相关粒子的态,这两个粒子的自旋都是 ½。我们将在下文中更仔细地解释这一点,但提前预告一下:如果其中一个粒子是电子,那么另一个粒子就是它的反粒子,即正电子,这是反物质的一个例子。狄拉克场的量子化给出了一个多粒子理论,但和克莱因-戈登情况一样,单粒子态是基本的状态。

12.3.1 狄拉克方程
使用我们在第 4 章和第 6 章中用过的简写 4-矢量符号,狄拉克方程是
(iγ · ∂ − m₀)ψ = 0 , (12.10)
其中 m₀ 是一个质量参数。展开 4-矢量的点积 γ · ∂,方程变为 iγᵘ ∂ψ/∂xᵘ − m₀ψ = 0,或者完整写出:
iγ⁰ ∂ψ/∂x⁰ + iγ¹ ∂ψ/∂x¹ + iγ² ∂ψ/∂x² + iγ³ ∂ψ/∂x³ − m₀ψ = 0 。 (12.11)
我们看到,它以对称的方式涉及时间 (x⁰ = t) 和空间 (x¹, x², x³) 的单阶导数,且无疑看起来是相对论性的。乍一看,γ 似乎是某个恒定的、普适的 4-矢量,但这不可能正确,因为选择一个特定的 4-矢量会破坏相对论性理论所必需的洛伦兹变换对称性。相对运动的不同的观测者,将需要 γ 是不同的 4-矢量。

狄拉克(Dirac)找到了这个问题的解决办法。他没有让 γ 的分量使用普通数,而是用四个恒定的方矩阵 γ = (γ⁰, γ¹, γ², γ³) 构造了这个 4-矢量,这些矩阵集合起来具有所期望的洛伦兹变换性质。这四个伽马矩阵需要满足某些代数关系,以确保与狭义相对论相容。其结果是,ψ 的每个分量都满足相对论性的克莱因-戈登方程。波动模式解随之满足频率与波矢之间的相对论关系,ω² = k² + m₀²。

² 它不是一个 4-矢量,因为旋量和矢量在洛伦兹变换下的变换方式不同。

狄拉克场

为了找到这些代数关系,我们假设 ψ 满足狄拉克方程 (12.10),然后从左侧作用算符 iγ·∂ + m₀,得到
(iγ·∂ + m₀)(iγ·∂ − m₀)ψ = 0 (12.12)
或者更具体地写为
$$
\left( i\gamma^\nu \frac{\partial}{\partial x^\nu} + m_0 \right) \left( i\gamma^\mu \frac{\partial}{\partial x^\mu} - m_0 \right) \psi = 0 .
$$ (12.13)
展开此方程给出
$$
\gamma^\nu \gamma^\mu \frac{\partial^2 \psi}{\partial x^\nu \partial x^\mu} + m_0^2 \psi = 0 .
$$ (12.14)
由于双重偏导数在交换 μ 和 ν 下是对称的,γ^νγ^μ 中唯一有贡献的部分是对称组合 ½(γ^μγ^ν + γ^νγ^μ)。对于 ψ 的每个分量,方程 (12.14) 约化为克莱因-戈登方程
$$
\frac{\partial^2 \psi}{\partial t^2} - \nabla^2 \psi + m_0^2 \psi = 0 ,
$$ (12.15)
只要满足
$$
\gamma^0 \gamma^0 = 1_n , \quad \gamma^1 \gamma^1 = \gamma^2 \gamma^2 = \gamma^3 \gamma^3 = -1_n ,
$$ (12.16)
其中 1_n 是某个 n × n 单位矩阵,并且当 μ 和 ν 不同时
$$
\gamma^\mu \gamma^\nu + \gamma^\nu \gamma^\mu = 0
$$ (12.17)
恒成立。将代数关系 (12.16) 和 (12.17) 写为更紧凑的形式,即
$$
\gamma^\mu \gamma^\nu + \gamma^\nu \gamma^\mu = 2\eta^{\mu\nu} 1_n ,
$$ (12.18)
其中 η^{μν} = diag(1, −1, −1, −1) 是(逆)闵可夫斯基度规张量,由方程 (6.11) 所定义。

关系 (12.18) 被称作狄拉克代数,或者等效地称为伽马矩阵反对易关系(式中“反”指的是左侧两项之间的加号)。这些关系确实可以满足,并且基本解是用 4 × 4 矩阵来表示的。不存在更小的可行矩阵。例如,1 × 1 矩阵仅仅是数,尽管方程 (12.16) 可以用 ±1 和 ±i 来求解,但方程 (12.17) 却无法同时满足。一种给出解的方式是将 4 × 4 矩阵写成 2 × 2 分块形式,这些分块要么是零矩阵、单位矩阵 1₂,要么是第 8.5 节所定义的泡利矩阵 σ₁, σ₂, σ₃。于是伽马矩阵为
$$
\gamma^0 = \begin{pmatrix} 1_2 & 0 \ 0 & -1_2 \end{pmatrix}, \quad \gamma^i = \begin{pmatrix} 0 & \sigma_i \ -\sigma_i & 0 \end{pmatrix}, \quad i = 1, 2, 3,
$$ (12.19)
这样写是可行的,因为 σ_i σ_j + σ_j σ_i = 2δ_{ij} 1₂。虽然这个解不唯一,但使用 4 × 4 矩阵的变体解仅仅是在狄拉克旋量空间中的基变换下有所不同,而这并不产生物理上的差异。存在更大矩阵的解,但它们只是由上面 4 × 4 矩阵解的若干份拷贝构造而成,对应于拥有

402 粒子物理

多个表示多种狄拉克场的旋量。因此我们给出的解本质上是唯一的。

在任意时空维度中都存在狄拉克代数 (Dirac algebra) 的一个版本,且每个时空坐标既可以是类时的,也可以是类空的。特别地,在任意维数的欧几里得空间 (Euclidean space) 中同样存在一个版本。每当维数增加二,狄拉克矩阵 (Dirac matrices) 的尺寸就加倍。因此在十维时空中,矩阵为32 × 32,但它们仍然可以由12和泡利矩阵 (Pauli matrices) 构建而成。

现在让我们回到四维时空,寻找狄拉克方程 (Dirac equation) 的解。由于伽马矩阵 (gamma matrices) 以2 × 2分块形式写出,将ψ分解为一对二分量旋量会很方便。狄拉克方程不显含空间和时间的函数,因此很自然地可以寻求如下形式的波模解
ψ(x, t) = ei(k·x−ωt)

χ
ξ

,
(12.20)
其中χ和ξ为常二分量旋量。将此式代入狄拉克方程(12.10),我们得到耦合方程组
(ω −m0)χ −k · σ ξ

0
k · σ χ −(ω + m0)ξ

0 ,
(12.21)
其中
k · σ = k1σ1 + k2σ2 + k3σ3 =

k3
k1 −ik2
k1 + ik2
−k3

(12.22)
为2×2矩阵。若取χ为任意常二分量旋量,则第二个方程将ξ确定为
ξ = k · σ χ
ω + m0
.
(12.23)
代入第一个方程并利用恒等式 (k · σ)2 = k2 12,我们得到
(ω −m0)χ −k2
χ
ω + m0
= 0.
(12.24)
非平凡解通常要求χ非零,这就需要有 ω2 −m2
0 −k2 = 0,或等价地
ω2 = k2 + m2
0 .
(12.25)
这一条件确保了狄拉克方程得以满足,其结果是狄拉克旋量 (Dirac spinor) ψ的每个分量都满足克莱因–戈登方程 (Klein–Gordon equation)。

这里没有理由固定ω的符号。对于给定的k,频率ω是 k2 + m2
0 的平方根,可正可负。若m0取定为正,则当ω为正时有 ω ≥ m0,当ω为负时有 ω ≤ −m0。(若k为零且ω = −m0,则χ为零而ξ为任意常二分量旋量。)狄拉克方程是线性的,因此各种波模解相互独立且可叠加。

由于ψ的每个分量都遵从克莱因–戈登方程,现在狄拉克方程在相对论上自洽是显而易见的。然而旋量场ψ的四个分量并不独立,寻找ψ的恰当洛伦兹变换 (Lorentz transformation) 需要

狄拉克场
403
更多的代数工作。事实上,我们可以验证狄拉克方程允许洛伦兹变换。一个推进(boost)会混合上、下二分量旋量 χ 和 ξ,但空间转动的作用更简单。每个二分量旋量的转动方式与非相对论二分量旋量的转动方式相同。这正是所需要的。这意味着 χ 的变换如同一个自旋 1/2 粒子的自旋态,自旋可以沿任意方向排列。在 χ 固定的情况下,ξ 由公式 (12.23) 确定,并以相同的方式变换。

12.3.2 狄拉克场的量子化——粒子和反粒子
我们可以尝试像处理其他类型的场那样,将狄拉克场量子化,把每个波模当作谐振子处理。在朴素真空(na¨ıve vacuum)中,所有模都处于未激发态。然而,这一步骤存在一个严重问题。负频率 ω 的解对应于负能量的粒子态。负频率模的每一次激发都会降低总能量,这将导致无法遏制的能量坍缩。狄拉克场与另一个场之间的相互作用会激发正、负频率模,从而产生无限多的负能量粒子。简而言之,该理论将是不稳定的。

现在,狄拉克场是为描述电子而发明的,电子是费米子。狄拉克(Dirac)认识到负能态问题与泡利不相容原理密切相关,并提出了以下每个模的显式费米子量子化方案。每个波模只有两种可能的量子态。它要么未激发,此时没有粒子存在;要么激发,此时恰好存在一个粒子。换言之,波模要么未被占据,要么被占据一次。没有两个粒子可以处于相同的动量、能量和自旋态。在真空态中,所有正频率模都未被占据。一个正频率 ω 模的占据态具有比空态高 ¯hω 的能量,并被解释为一个正能量粒子。若波矢为 k,则粒子具有动量 ¯hk 和能量 q ¯h2k2 + ¯h2m2 0,因此与克莱因-戈登(Klein–Gordon)理论中一样,粒子质量为 m = ¯hm0。



2m
图 12.2 从左到右:朴素真空;朴素单粒子态;填满的狄拉克海,即真正的真空态;代表反粒子的单空穴狄拉克态;具有一个粒子和一个反粒子的态。

那么负频率模呢?狄拉克假设在真正的真空态中,所有这些模都被占据了。这个狄拉克真空态也被称为填满的狄拉克海。如图 12.2 中间所示。狄拉克真空赋予理论一种显著的对称性,这种对称性不同于朴素真空的对称性。它是

404
粒子物理学
一种交换正负能量、同时交换占据态与未占据态的对称性。

现在考虑一个负频率波模从占据态变为未占据态时会发生什么。由于ω为负,能量以负值减少;换句话说,能量增加了。未占据态的能量比占据态高出¯h|ω|。我们可以将这份正能量视为一种新型粒子的能量,即反粒子(antiparticle)。(反粒子最初被称为空穴(hole),因为它是狄拉克海(Dirac sea)中的一个空穴。)

该理论描述了粒子和反粒子,两者都可以存在于具有动量p = ¯hk且自旋向上或向下的态中。动量为p = ¯hk的粒子是波矢为k的波模的激发。动量为p = ¯hk的反粒子是波矢为−k的波模的去激发。粒子和反粒子具有相同的正质量m = ¯hm0,并且都具有正能量
p
p2 + m2。那么是什么区分了粒子和反粒子呢?通常,它们会参与不同的相互作用。在许多情况下,我们可以通过它们的电荷来区分它们³。当与电磁场耦合时,狄拉克场具有确定的电荷,这对所有波模都是相同的。当一个未占据态变为占据态时,电荷会改变一个固定的量q。因此粒子带有电荷q。但反粒子是在一个占据态变为未占据态时产生的。这使电荷改变−q,因此反粒子带有电荷−q。

当狄拉克场与量子化的电磁场耦合时,一个光子有可能将狄拉克海中一个占据的负能态(一个负能粒子)提升到一个正能态。这同时产生狄拉克海中的一个空穴和一个正能粒子。这被解释为粒子-反粒子对的产生,如图12.3所示。电荷是守恒的,因为光子和粒子-反粒子对都具有零净电荷。负能态和正能态之间的能隙是2m,因此该过程只对至少具有此能量的光子才可能发生。

如果q是电子的电荷−e,且m是电子质量me,那么狄拉克理论描述了相对论性电子(e⁻),并预言了带有电荷e的电子的反粒子的存在。这些反粒子现在被称为正电子(e⁺),因为它们带正电。这是对反物质(antimatter)的首次预言。1932年,在狄拉克提出该理论后不久,正电子被正在用云室研究宇宙射线的卡尔·安德森(Carl Anderson)发现。图12.4展示了首张发表的正电子径迹照片。正如预言的那样,正电子具有与电子相同的质量,但电荷相反。它们的发现是该理论的伟大胜利。

从历史上看,填满的狄拉克海(Dirac sea)这一思想非常重要,因为它导致了反粒子的发现,但它也引发了许多关于真空态的问题。这个态必须具有零净能量、零净动量和零净电荷,但它却被假定为由无限多的负能粒子海填满,潜在地具有无限的负总能量和负总电荷。尽管反粒子最初以我们描述的方式被解释为狄拉克海中的空穴,但今天的粒子物理学家认为填满的狄拉克海是一个不必要的拐杖。如今通常直接讨论粒子和反粒子作为狄拉克场的独立激发。这样就避免了需要论证掉一个无限的负能粒子海。

³ 对于不带电的狄拉克粒子,例如中微子,我们可以定义一种新的荷,称为ψ粒子数,并定义ψ粒子带有荷+1,ψ反粒子带有荷−1。

狄拉克场
405
能量
光子
m
–m
狄拉克海
反粒子(空穴)
粒子
图12.3 从狄拉克海中产生粒子对。
图12.4 第一张正电子照片。其路径在探测器中的磁场作用下发生弯曲。正电子从右上角入射,在穿过位于探测器中心的铅板时逐渐减速。
量子化的狄拉克场不仅适用于电子和正电子;它适用于所有自旋为1/2的粒子。具体而言,对于每一个其他的大质量轻子——μ子和τ子及其反粒子,以及每一类夸克和反夸克,都存在一个单独的狄拉克场。这些粒子通过其质量、电荷以及它们的场与其他场的相互作用方式而彼此区分。
中微子更为复杂,目前仍未完全理解。它们也具有自旋1/2,但在量子场论中最适合描述它们的方式尚待确定。直到20世纪90年代,中微子通常用一种质量参数为零的狄拉克场的变体来描述。我们现在知道,中微子具有极小但不为零的静止质量。非常引人注目的是,它们可以在真空中从一种类型转化为另一种类型,甚至可能

406
粒子物理学
中微子与其反粒子完全相同。我们将在第12.9节描述对其性质的持续研究。
12.4
作用量与相互作用
到目前为止,我们一直在考虑服从线性场方程的场的量子化,其激发代表无相互作用的自由粒子。一个应用是模拟黑体辐射的光子盒。大量光子可能被困在盒子中,但它们彼此之间几乎没有散射。

相互作用的粒子在高能碰撞中相互散射,它们的动能可能转化为新的粒子。这正是粒子物理学成为令人兴奋的实验学科的原因。粒子碰撞后,如果我们要看到出射粒子的径迹并测量其能量和动量,探测器内的进一步相互作用至关重要。相互作用还导致粒子衰变,其中不稳定的粒子通常会衰变成两个或更多较轻的粒子。

为了描述相互作用粒子,我们必须考虑相互作用场,这需要在场方程中加入非线性项。于是,一种场成为另一种场的源。在经典非线性理论中,一种场的波模振荡可以激发另一种场的波模振荡。在量子场论中,这对应于粒子的产生和衰变。即使只有一种场,非线性项也可以将不同频率和波矢的波模耦合起来。这在量子力学中被解释为粒子散射,即粒子碰撞中能量从一个方向的运动转移到另一个方向的运动。

场拉格朗日量提供了编码场与粒子相互作用的最简洁方式。二次型拉格朗日量通过最小作用量原理导出线性场方程,其量子化场论没有粒子相互作用。包含场的高次幂的拉格朗日量导致非线性场方程和粒子相互作用。除少数特殊情况外,精确求解相互作用的量子场论是不可能的。通常的策略是假设任何非二次项的系数都很小,这样相互作用对自由粒子理论产生小的修正。这些系数称为耦合常数。然后,该理论预言的可测量量的振幅可以计算为耦合常数的级数展开,这一过程称为微扰论。正是这种方法导致了费曼图(Feynman diagrams)。
12.4.1
量子电动力学
粒子相互作用的微扰方法是首先由物理学家在模拟光子与带电粒子的相互作用时发展起来的。这些努力的巅峰是有史以来最成功的理论之一——量子电动力学(quantum electrodynamics,简称QED)。在这个理论中,电磁力源于带电粒子(如质子和电子)之间光子的交换,或者更基本地说,源于夸克和带电轻子之间光子的交换。QED的预言已经在实验室中得到检验,并与实验测量结果以惊人的精度相符,在某些情况下接近万亿分之一(1012)。

电磁学的一个非常重要的方面是存在通过进行规范变换(gauge transformation)重新定义势的自由,正如第3章所讨论的。规范变换保持电磁场 (F) 不变,因此对任何物理可测量量没有影响。它只是我们描述中冗余性的反映。

作用量与相互作用
407
描述电磁学,但它是经典理论和量子场论的一个基本特征。任何包含电磁场的拉格朗日密度都必须在规范变换下保持不变。换句话说,它必须是规范不变的。
在构造拉格朗日量时,实现规范不变性的方法是,对任何携带电荷 q 的场作用以下述修改的导数项:

−→
D = ∂−iqA ,
(12.26)
其中 A 是电磁4-矢量势。这在引入相互作用的同时保持了规范不变性。描述带荷的自旋
1
2 粒子通过电磁场相互作用的QED拉格朗日密度为⁴
L = −1
4F · F + iψγ · Dψ −m0ψψ .
(12.27)
这里的场包括4-矢量势 A,及其场强
F = ∂A −(∂A)T ,
(12.28)
以及狄拉克场 ψ,它具有质量参数 m0 和电荷 q。ψ 是 ψ 的狄拉克共轭,一个行4-旋量,由 ψ 分量的复共轭构造而成(其中第三和第四分量取相反的符号,以实现洛伦兹不变性)。Dψ 表示 ∂ψ −iqAψ。
规范变换对场的作用如下:
A →A −∂λ ,
ψ →e−iqλψ ,
(12.29)
其中 λ 是空间和时间的任意函数。A 的变换将方程(3.58)中给出的规范变换写成了4-矢量形式。ψ 的改变是一个依赖于 λ 及电荷 q 的相因子。
我们来检验QED拉格朗日密度(12.27)的规范不变性。在规范变换(12.29)下,∂A 获得一个额外项 −∂∂λ,而 (∂A)T 获得其转置,这反转了偏导数的次序。由混合偏导数的对称性,这些额外项在 F 中相互抵消,因此 L 的第一项是规范不变的。最后的狄拉克场质量项是不变的,因为 ψ 涉及 ψ 的复共轭,它按照相因子 eiqλ 变换,与乘以 ψ 的相因子相消。中间项最有趣。修改后的导数 Dψ = ∂ψ −iqAψ 在规范变换下变为
∂ψ −iqAψ


e−iqλψ

−iq(A −∂λ)e−iqλψ

e−iqλ (∂ψ −iq(∂λ)ψ −iqAψ + iq(∂λ)ψ)

e−iqλ(∂ψ −iqAψ) .
(12.30)
换句话说,Dψ 变换为 e−iqλDψ,仅仅乘以与 ψ 自身相同的相因子,因此 Dψ 被称为 ψ 的规范协变导数。中间项

⁴ 本方程及后续方程中所示的 γ 表示伽马矩阵的4-矢量,不应与光子混淆。

408
粒子物理
中的一项 L 包含了 ψ 和 Dψ 的乘积,它们获得相互抵消的相位因子,因此这一项也是规范不变的。
规范不变性之所以重要,有以下几个原因。它确保了光子没有纵偏振的物理态。这与涉及偏振器和光束的简单实验相一致。两个正交的偏振器会阻挡两种横偏振,从而完全阻断光束。此外,如果光有纵偏振态,黑体辐射的能量和熵的公式将会不同,从而与辐射压的测量结果不符。最后,或许也是最重要的一点是,如果没有规范不变性,光子可能通过其相互作用获得质量。那样的话,光在真空中将不会以固定的“光速”传播,从而动摇相对论在物理学各个领域取得的诸多成功。
在 QED 拉格朗日密度中,除了这一项之外的所有项都是二次的
Lint = q(ψγψ) · A
(12.31)
这一项来自规范协变导数的第二部分。正是这一项负责带电粒子、它们的反粒子以及光子之间的相互作用。
我们现在将更详细地探讨由这些粒子相互作用产生的物理。
12.4.2
费曼图 (Feynman diagrams)
费曼(Feynman)设计了一种非常有用的图形化方法来直观地表示粒子的相互作用。对于电子、正电子和光子,QED 拉格朗日密度中的相互作用项是
Lint = −e(ψγψ) · A ,
(12.32)
并且它可以表示为一个被称为顶点的简单图形,如图 12.5(左)和(中)所示。
e–
e–
e–
e–
e–
e–
e–
e+
图 12.5 表示电子发射或吸收光子、电子-正电子湮灭产生光子,以及两个散射电子之间交换光子的费曼图。
在图中,时间向上流逝。实线代表电子和正电子,波浪线代表光子。向前的箭头表示电子,向后的箭头表示正电子。同一个顶点根据其方向可以表示不同的过程。左边的顶点显示一个电子发射或吸收一个光子。中间的图表示一个电子和一个正电子湮灭并产生一个光子。相互作用的强度由耦合常数 −e 决定。在每个顶点,所有与理论相关的守恒定律,例如电荷守恒以及能量和动量守恒,都必须遵守。

作用与相互作用
409
当使用完整的量子场论机制来构造这些图时,这一点自动实现。

这些顶点可以组合起来生成表示粒子散射过程的费曼图。表示两个电子散射的最简单费曼图如图12.5(右)所示。在此图中,一个单光子被两个电子交换。由于光子携带能量和动量,其交换在电子之间传递能量和动量,从而改变它们的轨迹。该图可在微扰论中计算到最低阶,以求得两个电子散射的振幅。振幅正比于e²,因为每个顶点有一个电荷因子。物理上可测量的量,如截面,依赖于散射概率,而散射概率通过取振幅的模平方来计算,因此散射截面正比于e⁴。

完整结果是量子力学中两个电子通过排斥的e²/(4πr)库仑势散射所得结果的相对论性推广。这是一项重大成就,因为在非相对论量子力学中,库仑势只是从诸多可能势中简单地选取的。构建自洽的量子场论要困难得多。只有那些具有最简单相互作用顶点的理论才是自洽的,因此没有选择势的自由。我们通过在规范不变的拉格朗日量中定义最简单的电子-光子相互作用顶点,得到了最低阶结果。本质上没有其他方法将带电费米子与电磁场耦合,唯一的自由度就是通过改变电荷q来改变耦合的值。因此,量子场论为库仑力提供了深刻得多的解释。

图12.6 单圈QED费曼图。

我们可以构造出微扰论中更高阶的表示电子-电子散射的费曼图,如图12.6中所示。包含这些高阶图将对基本结果给出的一系列量子修正。费曼图是跟踪这些高阶项的最简单方法。每个图都可以计算,作为对散射量子振幅的贡献。如果不同图对应的初态和末态相同,那么这些贡献之间可能会发生量子干涉,因为对应这些图的振幅必须在计算最终的散射截面之前相加。要计算到e⁴阶的散射振幅,我们必须包含所有可能的不超过四个顶点的图,且外线代表电子。内线代表只短暂存在的粒子,称为虚粒子。它们可以是光子、电子或正电子。这些图看似给出物理过程的时空图像,尽管每个具有内圈的图实际上对应于对虚粒子可能能量和动量进行的一个相当复杂的积分。只要耦合常数很小,

410
粒子物理
交换单个光子,如图12.5(右)所示,给出散射振幅的主要贡献。图中每增加一个顶点就多一个因子e,这会减小其贡献的大小。这一系列图形代表了一种微扰展开,原则上可以用来计算任意精度下的散射振幅。

计算这些图绝非易事,特别是当它们包含若干内圈时,因为它们编码了多重4-动量积分。这依赖于一种被称为重整化(renormalization)的复杂技术程序。重整化的一个特征是我们必须承认,粒子的质量和耦合参数不由理论确定,而必须通过测量得到,并作为实验输入来处理。然后我们可以高精度地计算散射截面和其他可测量量,且可达到任意高能量。这赋予了量子场论强大的预言能力。

e
μ⁻
μ⁺
e
e
eq
q

e⁻
e⁺
e⁻
e⁺
图12.7 表示电子–正电子湮灭产生μ子–反μ子对(左)或夸克–反夸克对(右)的费曼图(Feynman diagrams)。

带电粒子有多种类型。在完整的QED理论中,我们必须为每一种基本费米子引入一个狄拉克场(Dirac field)。于是我们得到一个描述所有这些不同带电粒子之间电磁相互作用的理论。这种QED过程的一个例子是电子–正电子对转化为μ子–反μ子对。这由一个虚光子介导,该光子短暂地携带全部的能量和动量。对如图12.7(左)所示费曼图代表的过程,其总截面σ的最低阶预言为
σ(e⁺e⁻→μ⁺μ⁻) = 4πα²/(3E²), (12.33)
其中α = e²/(4π¯h) ≃ 1/137为精细结构常数(fine structure constant),E是质心能量。无量纲的α是QED微扰级数的真实展开参数。

12.5 强力
汤川(Yukawa)于1935年提出,将原子核束缚在一起的质子p和中子n之间的强力,可以通过交换三种自旋为0的粒子来解释,这些粒子现在被称为π介子π⁺、π⁻和π⁰。这在第11.9节中已经描述过,但量子场论提供了更深刻的见解。在汤川设计的实际理论中,有一个代表核子N = (p, n)的狄拉克场二重态。该二重态的两个成员

强力 411

通过同位旋⁵来区分;质子p的同位旋为1/2,中子n的同位旋为−1/2。标量π介子场(π⁺, π⁰, π⁻)的同位旋分别为1、0和−1。

汤川(Yukawa)理论的一个简化版本只包含一个质量为参数M₀的狄拉克场ψ,与一个质量为参数m₀的标量克莱因–戈登场φ相互作用。其拉格朗日密度为

L = ½∂φ·∂φ − ½m₀²φ² + iψγ·∂ψ − M₀ψψ + λψψφ . (12.34)

前四项描述自由克莱因–戈登场和自由狄拉克场,只有最后那个非二次的项含有这些场之间的耦合λψψφ,对应于图12.8所示的顶点。这就是所谓的汤川耦合。量子化后的理论包含一个自旋½的狄拉克粒子(我们也称其为ψ)及其反粒子(反ψ),以及一个自旋0的标量粒子φ。在费曼图中,实线代表ψ和反ψ粒子,虚线代表φ粒子。两个ψ粒子的散射由图12.9所示的费曼图表示。这些都是树图的例子——即不含圈图的图。

图12.8 汤川顶点;λ是顶点处的耦合常数。左:一个φ粒子转变为一个ψ粒子和一个反ψ粒子。右:一个ψ粒子和一个反ψ粒子湮灭而形成一个φ粒子。

自由φ场满足克莱因–戈登方程(12.6),

∂²φ/∂t² − ∇²φ + m₀²φ = 0 , (12.35)

或者对于静态场,满足

∇²φ(x) = m₀²φ(x) . (12.36)

该方程的解描述了位于原点的ψ粒子与距离为r处的ψ粒子的相互作用,即汤川势

V(r) = −λ²/(4πr) exp(−m₀r) , (12.37)

其力程为1/m₀。这一势也出现在利用图12.9的图计算出的散射振幅中。回忆一下,ψ粒子的质量为M = ¯hM₀。如果这个质量远大于可获得的动能,那么ψ粒子的对产生⁵

⁵ 同位旋与自旋有些相似,用于对强相互作用粒子进行分类。就我们的目的而言,我们只需要考虑同位旋的一个分量,类似于自旋的s₃分量。

412
粒子物理
图12.9 ψ–反ψ散射的汤川树图。左图:一个ψ和一个反ψ湮灭形成一个虚φ,然后再转化回一个ψ和一个反ψ。右图:一个ψ和一个反ψ交换一个φ。
是不可能的。然而,运动缓慢的ψ粒子通过汤川势发生量子力学相互作用。这就是将核子与π介子的汤川理论作为核子-核子力模型的基础。

在更完整的汤川理论中,包含核子二重态和π介子三重态,二重态中的场在相互作用中混合,三重态中的场也是如此。这意味着一个粒子的身份可能在相互作用后发生改变。中子可能变成质子,反之亦然,如图11.26中的图表所示。同位旋在每个顶点守恒,这约束了这些变换。例如,在图11.26中,左上图展示了一个通过交换π0介导的过程,其中核子的同位旋不改变,但在左下图,左侧顶点处一个中子放出一个同位旋为-1的π−并变成一个质子。质子比中子多一个单位的同位旋,因此同位旋在顶点处守恒。在右侧顶点处,π−被一个质子吸收,该质子转变为中子,同位旋再次守恒。这些过程在原子核中的中子和质子身上不断发生。在这些例子中,同位旋守恒似乎仅仅是确保电荷守恒的一种方式,但同位旋实际上是强相互作用的一种内部旋转对称性,其蕴含的意义更为丰富。例如,它将π0耦合的强度与π±耦合的强度联系了起来。

为了解释强力的力程,汤川(Yukawa)预言π介子的质量mπ应在130 MeV左右的区域。实验观测到的带电π介子π+和π−的静止质量mπ为139.6 MeV。在原子核内部,π介子通常不会衰变,但作为自由粒子,它们通过弱力衰变,平均寿命为2.6 × 10−8秒,过程如下:
π−→µ−+ ¯νµ ,
π+ →µ+ + νµ ,
(12.38)
其中µ−是μ子,µ+是反μ子。中性π介子π0的质量为135.0 MeV。它通过电磁力衰变,这使其具有短得多的半衰期,为8.4×10−17秒。主要的衰变模式(γ表示光子)为:
π0 →2γ
(Br = 0.988) ,
π0 →γ + e−+ e+
(Br = 0.012) ,
(12.39)

强相互作用力
413
其中分支比 $Br$ 是每种衰变所占的比例。
20世纪40年代和50年代,人们为发展汤川理论付出了巨大努力。必须包含π介子场之间的相互作用项,才能构造出一个现实的拉格朗日量,而这些项相当复杂,且很难通过实验确定。然而,原则上,通过遵循这一方法,所有核力以及原子核的性质都可以用少数几个耦合常数来预测。但在实践中,由于耦合常数 $\lambda$ 很大,计算无法可靠地进行。这正是强相互作用之所以被称为”强”的原因。高阶费曼图,类似于图12.6中的圈图,会产生巨大的效应,尤其是在短程范围内,因此,尽管汤川势能很好地描述中等距离(1–5 fm)上的强核子–核子力,但它在更短距离上则不具备预测能力。
另一个复杂之处在于,π介子彼此之间的相互作用足够强,以至于存在一些可以被解释为由两个π介子或三个π介子构成的短寿命束缚态的粒子。这些粒子被称为$\rho$介子和$\omega$介子。原则上,它们的效应已经完全包含在汤川理论中了,但通常将它们视为与核子耦合的独立粒子会更简单。
到1960年左右,核子之间以及π介子与核子之间的高能碰撞导致了更多粒子的发现,而所有这些粒子的强相互作用理论变得极其复杂且不能令人满意。看来,所有构建强相互作用力量子场论的努力似乎都注定要失败。但就在这时,一个非凡的突破出现了,为当前的强相互作用理论铺平了道路。
12.5.1
夸克
像质子、中子和π介子这样通过强相互作用力发生作用的粒子被称为强子。(位于日内瓦的欧洲核子研究中心(CERN)的大型强子对撞机(LHC)的名字即源于此,它是一台质子对撞机。)强子分为两类:一类是介子,如π介子;另一类是重子,如质子和中子。20世纪50年代和60年代的粒子加速器发现了许多介子和重子。我们现在从这些粒子的亚结构来理解它们的性质。默里·盖尔曼(Murray Gell-Mann)意识到,它们的存在可以用自旋为$\frac{1}{2}$的组分粒子来解释,他将这些粒子命名为夸克,这表明质子和中子之间的汤川力是夸克之间一种更深层次相互作用的结果,而这种相互作用最终构成了强相互作用力的基础。
最初,人们假设存在三种夸克:上夸克 $u$、下夸克 $d$ 和奇异夸克 $s$。$u$ 和 $d$ 夸克共同构成一个同位旋二重态,而 $s$ 夸克是一个同位旋单态。⁶ 盖尔曼方案的一个重要部分是,这三种夸克被统一在一个更大的对称性结构中。我们现在知道还有另外三种更重的夸克类型,分别命名为粲夸克 $c$、底夸克 $b$ 和顶夸克 $t$。这六种夸克类型被称为六味夸克。盖尔曼的想法是,像π介子和K介子($K$)这样的介子,是由一个夸克和一个反夸克束缚在一起而形成的。例如,带正电的π介子($\pi^+$)由一个上夸克和一个反下夸克 $u\bar{d}$ 组成。图12.10展示了最轻介子的夸克组成。这个介子八重态中的所有粒子自旋均为0,其组分夸克和反夸克的自旋反平行排列。还有一组类似的质量更大的自旋为1的介子,包括$\rho$和$\omega$介子,其中夸克和反夸克的自旋是反平行的。

⁶ $s$夸克也被认为携带一个(负)单位的奇异数。

414
粒子物理
夸克和反夸克的自旋是平行的。还存在自旋更高的介子,其中的夸克组分携带一定的轨道角动量。这些介子相应地具有更大的质量。

dsˉ
duˉ
uu–dd
ˉ ˉ
suˉ
sdˉ

uu +dd –2ss
ˉ ˉ ˉ
udˉ
usˉ
K 0
K 0
K –
K +
π–
π0
0
π+
Strangeness
Isospin
0
–1
+1
0
+1
–1
1
– 2
1

  • 2
    图12.10 自旋为0的介子及其夸克组分u、d和s。字母上的横线表示反夸克。不带电的介子π0和η0由夸克和反夸克的正交叠加组成。

关键是,在盖尔曼(Gell-Mann)的模型中,粒子还可以通过另一种方式由夸克形成。三个夸克可以结合成一个重子。例如,质子由一个下夸克和两个上夸克构成,即duu;中子由两个下夸克和一个上夸克构成,即ddu。中子和质子具有自旋1/2。这是因为一个夸克的自旋与另外两个夸克的自旋方向相反。自旋1/2重子八重态中每个粒子的夸克组分如图12.11(左)所示。与介子的情况类似,也存在质量更大、夸克自旋和轨道角动量排列不同的重子。由u、d和s夸克可以形成十个自旋3/2的重子,这些夸克的自旋全部平行排列。盖尔曼将这批重子命名为“decimet”,但现在它们通常被称为重子十重态(baryon decuplet)。这些粒子各自的夸克组分如图12.11(右)所示。这些粒子集合的六角形和三角形结构,是盖尔曼夸克味对称性的成功预言。

除质子外,所有这些粒子都是不稳定的。Δ粒子通过强相互作用力衰变成核子和π介子;它们的衰变极为迅速,以至于无法直接观测到,其存在的主要证据是,当π介子与核子在质心系能量约1230 MeV处相互作用时,截面会显著增强。自由中子通过弱相互作用力衰变,半衰期约为10分钟。所有其他粒子都至少含有一个奇异夸克,也通过弱相互作用力衰变,例如,
Σ+ →p + π0
(Br = 0.52) ,
Σ+ →n + π+
(Br = 0.48) ,
(12.40)

强力
415
0
–1
–3
–2
0
–1
–2
0
ddd
∆⁻
∑⁻
∑⁻
∑⁺
∑⁰
0
∆⁰
∆⁺
∆⁺⁺
sdd
Ω⁻
sss
sdu
ddu
ddu
n
p
duu
duu
uuu
suu
奇异数
同位旋
奇异数
同位旋
+1
–1
ssd
Ξ⁻
ssu
Ξ⁰
ssd
Ξ⁻
ssu
Ξ⁰
∑⁺
∑⁰
1
– 2
3
– 2
3

  • 2
    1
  • 2
    0
    sdd
    sdu
    suu
    +1
    –1
    1
    – 2
    1
  • 2
    图12.11 左:自旋为1/2的重子的夸克组成。Σ⁰和Λ⁰由u、d和s夸克的正交叠加构成。右:自旋为3/2的重子十重态的夸克组成。
    它们在衰变前会在粒子探测器中留下径迹。

12.5.2 禁闭
尽管盖尔曼(Gell-Mann)的夸克假说为粒子加速器中观测到的数百种强子的性质提供了简洁的解释,但却存在一个明显的问题。从未有人观测到过夸克。为了匹配质子、中子和其他强子的电荷,上夸克的电荷必须为 qu = 2/3,下夸克的电荷必须为 qd = −1/3(以质子电荷e为单位)。带分数电荷的粒子很容易与其他任何粒子区分开来。例如,该粒子在气泡室照片中的径迹宽度会窄得多。然而,在四十多年的探寻中,从未发现过自由夸克存在的任何证据。

幸运的是,即使不提取和分离出单个夸克,也有可能探测质子和中子并证明它们含有这些点状组分。20世纪60年代末和70年代初,加利福尼亚州斯坦福直线加速器中心(SLAC)进行了一系列实验,旨在寻找质子内部可能存在的隐藏亚结构。这些实验的方法与卢瑟福(Rutherford)的α粒子实验非常相似,但规模要大得多。用能量在5 GeV到20 GeV之间的电子束轰击液态氢靶。结果表明,质子内部确实含有微小的、坚硬的、自旋为1/2的组分,它们散射了电子。自然而然可以推断,质子内部的这些“金块”就是盖尔曼的夸克。

夸克之间的力如此之强,以至于夸克不可能摆脱囚禁而作为独立的自由粒子存在。它们总是被束缚在π介子、质子或中子等复合粒子之中。这一令人惊奇的性质被称为禁闭。在夸克模型的早期,它曾引起极大的困惑,直到人们更好地理解了将夸克束缚在一起的力的作用后,它们真实的物理存在才被接受。

赋予夸克的电荷可以在正负电子湮灭实验中得到检验。当电子与正电子湮灭时,有几种可能的结果。一种是产生一个μ子和一个反μ子,如图12.7所示。

416
粒子物理
Orsay
0
8
,3
5
10
15
20
Q (GeV)
25
30
35
40
CELLO
JADE
Frascati
Novosibirsk
SLAC-LBL
DASP
CLEO
DHHM
u+ d+ s + c + b
u + d + s + c
u + d + s
MARK J
PLUTO
TASSO
6
R
4
2
0
´
´
J/
˝
图12.12 通过截面比R测得的正负电子湮灭实验中产生的强子碎片的比例。Q为碰撞能量。
(左图)。这种事件的截面由方程(12.33)给出。另一种情况是,可能会产生一个夸克和一个反夸克,如图12.7(右)所示。在低能情况下,可能产生的夸克-反夸克对有三种:u¯u对、d ¯d对或s¯s对。这些夸克并不能被直接观测到,因为一旦它们产生,强相互作用力就会立刻参与进来,实验所观测到的是从相互作用点射出的一簇强子。这个过程被称为强子化。这些强子往往被高度准直成粒子喷注,从正负电子撞击点射出。
正负电子的湮灭是一个纯粹的电磁相互作用,其主要贡献来自图12.7(右)中具有两个顶点的费曼图。第一个顶点的耦合系数为e,第二个顶点的耦合系数为夸克电荷eq,因此产生每种夸克-反夸克对的振幅正比于e^2q。所以截面σ正比于e^4q^2,但在其他方面与μ子-反μ子对的产生完全相同。以奇异夸克为例,这给出了如下比值:
σ(e+e−→s¯s)
σ(e+e−→µ+µ−) = e^4q^2
s
e^4
= 1
9 。
(12.41)
我们可以估算正负电子碰撞中产生的强子碎片的比例,即夸克产生的总截面与μ子产生的截面之比R:
R = σ(e+e−→强子)
σ(e+e−→µ+µ−)

∑ σ(e+e−→夸克 反夸克)
σ(e+e−→µ+µ−)



q^2 。
(12.42)
根据盖尔曼(Gell-Mann)的三种夸克味u、d和s,这个比值为
Ru,d,s = 4/9 + 1/9 + 1/9 = 2/3
(12.43)

QCD
417
在简单的夸克模型中。然而,在实验中,该比值被发现接近2,因此强子碎片的数量是预期的三倍。在更高的碰撞能量下,可以产生质量更大的夸克,并产生更多的强子碎片。当碰撞能量 Q 超过产生粲夸克和反粲夸克的阈值(约为 2mc ≃3.0 GeV)时,强子碎片的数量会增加。高于此阈值时,Ru,d,s,c = 4/9 + 1/9 + 1/9 + 4/9 = 10/9。在底夸克–反底夸克阈值 2mb ≃10 GeV 以上,数量会进一步增加。此时,Ru,d,s,c,b = 4/9 + 1/9 + 1/9 + 4/9 + 1/9 = 11/9。但实验表明,强子碎片的数量总是简单夸克模型预期的三倍。这些结果展示在图 12.12 中。

为了解释这些结果,人们假设每种味的夸克都以三种颜色出现:红 r、蓝 b 和绿 g,因此不同类型的夸克数量是原来的三倍。这个看似特别的提议,导致了被称为量子色动力学的理论,并且是理解夸克之间作用力的关键。

12.6 QCD

量子电动力学(QED)最终会发展成为弱力和强力的成功理论。1954年,杨振宁(Chen Ning Yang)和罗伯特·米尔斯(Robert Mills)设计了一种方法,将电磁学的规范不变性推广,以构建类似于 QED 但基于更大规范对称性的理论。电磁力由光子(一种无质量的自旋为1的玻色子)传递。在杨-米尔斯(Yang–Mills)理论中,相互作用由一个场矩阵生成,这些场构成了一组密切相关联的无质量自旋为1的玻色子。

在20世纪70年代初,物理学家们意识到有一个杨-米尔斯理论为解释夸克之间的力提供了完美的方式。这种力被称为色力,或者更正式地称为量子色动力学(QCD)。它将三个夸克束缚在一起,形成质子或任何其他类型的重子。“颜色”这个术语是通过类比红光、蓝光和绿光混合形成白光来使用的,这正是电视屏幕或计算机显示器上产生白光的方式。正如对于电荷相同的不同粒子(例如质子和正电子),电磁力可以是相同的,色力对于六种不同味的夸克也是相同的。

QCD与QED相似,但有一些非常重要的区别。QED中的相互作用取决于单一的电荷,而在色动力学中存在三种不同的荷:红、蓝和绿。将三个夸克(各带一种色荷)组合在一起,可以产生一个粒子,例如质子,它对色荷来说是中性的。换句话说,一个红色荷、一个蓝色荷和一个绿色荷的总和是没有净色荷的,因此有了颜色的类比。

每种色荷都有一个负的对应物,被称为反红、反蓝和反绿。这提供了另一种产生色中性粒子的方法。一个夸克和一个反夸克可以束缚在一起形成一个介子,前提是夸克携带三种色荷中的一种,而反夸克携带相应的反色荷,使得色荷相互抵消,总体上没有净色。例如,夸克可能携带红色荷,而反夸克携带反红色荷,即 r¯r。或者,夸克可能携带蓝色荷,而反夸克携带反蓝色荷,即 b¯b。

12.6.1 胶子

色力源于被称为胶子的杨-米尔斯粒子的交换,之所以这样命名,是因为它们提供了将夸克粘在一起的胶水。我们将胶子记作 G。

418
粒子物理学
b
b
r
r
gs
gs
rbˉ
rbˉ
rr+ bb– 2gg
ˉ
ˉ
ˉ
rr– bb
ˉ
ˉ
rgˉ
grˉ
bgˉ
brˉ
gbˉ
图12.13 左:展示由胶子交换引起夸克散射的费曼图。右:胶子八重态中胶子的颜色荷。
图12.13(左)展示了一个QCD费曼图,表示两个夸克之间发生散射的相互作用。这里,带有箭头的线代表夸克。卷曲的线代表在两个夸克之间交换的胶子。耦合强度为gs,下标指的是强作用力。
夸克之间交换的胶子共有八种。每个胶子携带两种荷,一个颜色荷和一个反颜色荷(这是因为胶子场是一个矩阵)。这八种QCD胶子一起组成一个颜色对称八重态,如图12.13(右)所示。八重态图展示了每种胶子的颜色荷和反颜色荷。例如,在图的左上角那个点代表的胶子携带一个红荷和一个反蓝荷。这个特定的胶子将参与诸如费曼图中所示的那种相互作用。在图的左侧,入射的红夸克发射出(红,反蓝)胶子,从而转变为一个蓝夸克。这一相互作用因为红荷转移到了胶子上而守恒红荷。它也守恒蓝荷,因为夸克上的蓝荷和胶子上的反蓝荷同时产生。然后,在右侧,(红,反蓝)胶子与一个蓝夸克相互作用。胶子上的反蓝荷抵消了夸克上的蓝荷,胶子上的红荷转移给了夸克。交换胶子的总体效果是在夸克之间传递能量和动量,并交换它们的颜色荷。如果蓝夸克发射一个(蓝,反红)胶子并被红夸克吸收,也会产生同样的效果;一个费曼图就代表了这两种过程。考虑到所有胶子类型,介子的颜色态并不像前面简单提示的那样是r¯r或b¯b。它是一个颜色中性、对称的叠加态:r¯r + b¯b + g¯g。同时,并不存在r¯r + b¯b + g¯g的胶子,因为它将不具有任何颜色耦合强度。
光子是电中性的,因此它们自身感受不到电磁力,也不会与其他光子直接相互作用。而胶子则携带颜色荷。因此胶子自身能感受到色力,并与其他胶子相互作用。QCD拉格朗日量包含胶子自耦合的三次项gsG³和四次项g²sG⁴,其中gs是强作用耦合常数,所以一个胶子可以分裂成两个或三个胶子,两个或三个胶子也可以合并形成一个胶子。这极大地复杂化了色相互作用,并使得色力与电磁力截然不同。

QCD
419
图12.14 高阶QCD费曼图。
图12.14展示了几个高阶QCD图。同样,实线代表夸克,卷曲线代表胶子。左侧的两个图与QED中类似图相似,将夸克替换为电子,胶子替换为光子,就会得到等效的QED图。其他三个QCD图涉及胶子与其他胶子的相互作用,因此没有QED中的对应图。例如,在顶部中间的图中,一个夸克发射一个胶子,这个胶子分解成一对胶子,然后这对胶子又重新组合成一个胶子,最后这个胶子被第二个夸克吸收。这些附加的图不仅使QCD计算比QED计算更为艰巨,而且还表明这种力的行为方式完全不同。
u

图12.15 左:两个夸克之间的色场线形成一条通量管。右:当两个夸克分离时,它们之间色场中的能量转化为新的夸克。

420
粒子物理
色力实际上在极短距离处相当微弱,只有在较远距离才变得强大。这一点与电磁力截然不同。这是QCD的巨大成功之一,因为它似乎正确地描述了在对撞机实验中所观察到的强相互作用如何运作。在较远距离处,我们可以把两个夸克之间的力想象成众多胶子之间同时相互作用,并发生极其复杂的交换所得到的净结果。这团缠结的胶子群有效地构成了一个色流管,其行为有点像夸克之间的橡皮筋,如图12.15所示。这意味着两个夸克之间的色力与它们的距离无关,因为色场中的能量近似地随距离线性增加。这表明永远不会有足够的能量把夸克完全拉开。事实上,当距离接近一个强子的典型尺度——大约10−15 m时,色场中的能量就足以形成新的粒子,如图12.15(右)所示。这就是禁闭的实际表现。由于夸克分离时会发生夸克–反夸克对的产生,我们看不到单独的夸克。

如前所述,电子与正电子的正面碰撞导致它们完全湮灭,释放出的能量可能产生一对夸克和反夸克,并带有大量动能。当夸克和反夸克彼此飞离时,它们之间色场中的能量转化为其他夸克和反夸克的簇射。所有这些夸克和反夸克迅速强子化,于是它们裸露的色荷隐藏在了色中性粒子之中,这些粒子就是探测器中所看到的粒子。这样的事件表现为从电子–正电子撞击点沿相反方向射出的两束狭窄的粒子喷注。

图12.16 左:显示电子–正电子湮灭事件的费曼图,产生了一对夸克–反夸克,且夸克放出了一个胶子。这将表现为一个三喷注事件。右:在CERN的OPAL探测器中看到的三喷注事件。

QCD
421
有时会产生三束粒子喷注,如图12.16(右)所示,这正是QCD可以解释的。偶尔,在电子-正电子撞击中产生的夸克或反夸克在出现的瞬间会发射出一个胶子,如图12.16(左)的费曼图(Feynman diagram)所示。胶子的发射产生了第三束强子喷注。有时夸克和反夸克都会发射胶子,此时会观察到四束喷注。单个胶子发射事件的振幅包含一个额外的因子gs,因此单个胶子发射的速率正比于αs = gs²/(4πħ) 乘以夸克-反夸克对的产生速率,其中αs是相当于电磁精细结构常数的强力耦合常数。这为强子产生截面提供了一个正比于αs/π的二阶修正,从而给出
[ R_{\text{QCD}} = \frac{\sigma(e^+e^- \to \text{hadrons})}{\sigma(e^+e^- \to \mu^+\mu^-)} = 3 \times \left(1 + \frac{\alpha_s}{\pi}\right) \sum_{\text{flavours}} q^2, \tag{12.44} ]
其中因子3来自对颜色的求和。当αs ≃ 0.15时,附加项给R的表达式带来5%的修正,这进一步改善了理论与实验之间的一致性。

通过分析喷注内所有粒子的分布,可以区分由夸克形成的喷注和由胶子形成的喷注。从喷注的角分布还可以确定胶子的自旋。这证实了胶子不是标量粒子。它们自旋为1,这正是它们作为杨-米尔斯力(Yang–Mills force)媒介粒子所必须具有的性质。

在SLAC以及后来加速器上进行的深度非弹性散射实验表明,强子的结构比最初认为的要复杂得多。盖尔曼(Gell-Mann)提出,质子的组成为duu。这三个夸克被称为价夸克(valence quarks)。质子内部还存在着不断出现和消失的夸克-反夸克对,它们也可能散射入射粒子,这些被称为海夸克(sea quarks)。此外,这些实验表明,通常质子只有大约一半的动量由其夸克组分携带,其余部分则由在质子内部飞来飞去并将夸克束缚在一起的胶子所携带。

12.6.2 格点QCD
世界上领先的加速器不断验证着QCD的预言,但有些QCD计算过于复杂而难以手动完成,因此物理学家必须求助于超级计算机。QCD在代表空间和时间的离散网格上进行模拟,这种方法被称为格点QCD(lattice QCD)。物理学家希望回答的一个问题是QCD与禁闭之间的关系。所有证据都表明QCD意味着禁闭,而格点QCD支持了这一观点,但尚缺乏决定性的证明。格点QCD的另一个目标是从第一性原理出发,预测由夸克构成的粒子的质量。这类似于计算原子中的能级,但要复杂得多。将计算得出的各种介子和重子的质量与粒子加速器中测得的值进行比较,符合程度非常好;通常,QCD的预测与实验结果的精度偏差优于4%,只有对最轻的介子——π介子(pions)的结果不那么令人信服。尽管这无法与量子电动力学预言的惊人精度或原子物理学中相应的结果相媲美,但仍然非常令人印象深刻。其精度

422
粒子物理
随着更大计算能力的可用以及执行这些计算的技术进一步完善,计算的精度将会提高。

12.6.3 重夸克与奇异强子
1974年,一个质量为3.1 GeV的新介子的发现同时由布鲁克海文国家实验室的丁肇中(Samuel Ting)领导的团队和SLAC的伯顿·里克特(Burton Richter)领导的团队宣布,前者将其命名为J,后者将其命名为Psi (Ψ)。自此,它被称为J/Ψ。这个新介子的重要性在于它是第四种夸克味道——粲夸克的首次出现。J/Ψ介子的组成为c¯c。仅仅三年后,费米实验室由利昂·莱德曼(Leon Lederman)领导的团队发现了宇普西龙介子(Υ),这是包含第五种夸克——底夸克的第一个粒子。宇普西龙是最轻的、夸克组成为b¯b的介子。需要第六种夸克来完成第三代费米子,物理学家们多年来一直在寻找,但未获成功。

顶夸克最终于1995年在费米实验室被发现,距底夸克的发现几乎过去了二十年。这一发现是利用太伏质子加速器(Tevatron)——一台每束能量高达0.98 TeV的质子-反质子对撞机——通过以下过程实现的:
p + ¯p → t + ¯t + X0 , (12.45)
其中X0表示其他强子。顶夸克的质量为173 GeV,大约相当于一个金原子的质量,几乎是底夸克质量的40倍。顶夸克的寿命极短,约为4 × 10^{−25} s。这意味着与其他夸克不同,顶夸克在任何强子形成之前就已衰变。(底夸克和粲夸克的寿命约为10^{−12} s。)

在盖尔曼(Gell-Mann)夸克模型发表后的半个世纪里,已发现了数百种强子,它们都可以归类为夸克组成为q¯q的介子、夸克组成为qqq的重子或反重子¯q¯q¯q。然而,QCD并不排除存在具有其他无色夸克组成的奇异强子,例如二介子或四夸克态qq¯q¯q、五夸克态qqqq¯q,甚至组合q¯qG,其中G是胶子。在经过许多无果的寻找后,LHC于2014年证实了名为Z(4430)的强子共振态的存在,它似乎是由两个夸克和两个反夸克组成的二介子,质量为4430 MeV。次年,CERN宣布了五夸克态的证据。这些态被命名为Pc(4380)+和Pc(4450)+。

12.7 弱力
弱力首次在放射性β衰变中被观察到,如第11.3.4节所述。它发生在某些原子核中,当中子转变为质子并放出一个电子。当原子核发生α衰变时,α粒子以精确确定的能量发射。相比之下,β衰变中发射的电子具有宽广的能量范围。恩里科·费米(Enrico Fermi)意识到,还有另一个粒子与电子一同发射,并带走了β衰变中释放的部分能量和动量。我们现在知道这个粒子是电子反中微子(¯νe)。因此,中子的β衰变是
n → p + e^{−} + ¯νe . (12.46)
与电子一同发射的粒子被定义为反中微子的原因如下:轻子总是成对产生或湮灭。这一事实是

弱相互作用
423
通过引入在所有反应(包括弱相互作用)中都守恒的轻子数这一荷,这一过程被形式化。强子具有轻子数0,因此如果电子具有轻子数+1且轻子数守恒,那么在β衰变中释放的另一个轻子的轻子数必定为−1,因此是反中微子。中微子不带电荷;它们只通过弱相互作用发生作用。中微子通常可以穿过几光年厚的固体材料而不发生相互作用,这是一个令人震惊的事实。
入射
反中微子
γ射线
γ射线
正电子
湮灭
e⁻
e⁺
n
p
Cd

β
衰变
中子俘获
液体闪烁体
加镉
图12.17 在莱因斯-科温实验中,检测到反中微子的信号是正电子湮灭紧随镉核的γ衰变而产生的符合事件。
费米关于中微子的预测直到核裂变反应堆建成、提供了极其强大的粒子源之后才得到验证。1956年,弗雷德里克·莱因斯(Frederick Reines)和克莱德·科温(Clyde Cowan)探测到了美国萨凡纳河反应堆发射的反中微子。探测器包含300升氯化镉溶液。来自核反应堆的反中微子通过与溶液中的质子发生逆β衰变反应被探测到:
¯νₑ + p → n + e⁺ .
(12.47)
正电子迅速与电子湮灭,产生两个方向相反的0.511 MeV γ射线光子,中子则被镉核俘获,镉核具有很大的中子俘获截面:
n + ¹⁰⁸Cd → ¹⁰⁹Cd* → ¹⁰⁹Cd + γ .
(12.48)
¹⁰⁹Cd*核形成于激发态,并在几微秒内发生γ衰变。正电子湮灭紧随其后延迟符合的

424
粒子物理
镉原子核的伽马衰变就是探测到反中微子的信号,如图12.17所示。

在中微子被确认之前,另一种轻子已经被发现。1937年,卡尔·安德森(Carl Anderson)和赛斯·内德迈耶(Seth Neddermeyer)在宇宙线研究中发现了μ子(µ⁻),尽管它的身份在之后的十年里才被明确确定。μ子看起来像是电子的一个更重的复制品,这是一个完全出乎意料的发现。μ子的质量为105.7 MeV,是电子质量的207倍。μ子不稳定,平均寿命为2.2 × 10⁻⁶ s,其衰变方式如下:
µ⁻ → e⁻ + ¯νₑ + νµ 。
(12.49)
如此处所示,与μ子相关联的有第二种中微子,称为μ子中微子,记为νµ。μ子中微子不同于β衰变中放出的电子反中微子,这一点在1962年由莱德曼(Lederman)、梅尔文·施瓦茨(Melvin Schwartz)和杰克·斯坦伯格(Jack Steinberger)首次明确证明。

在20世纪70年代中期,马丁·佩尔(Martin Perl)发现了第三种带电轻子——τ子(τ⁻)。τ子的质量为1777 MeV,几乎是电子质量的3500倍,其寿命为2.9 × 10⁻¹³ s。它有许多衰变道。最常见的如下:
τ⁻ → π⁻ + π⁰ + ν_τ
(Br = 0.255) ,
τ⁻ → e⁻ + ¯νₑ + ν_τ
(Br = 0.178) ,
τ⁻ → µ⁻ + ¯νµ + ν_τ
(Br = 0.174) 。
(12.50)
第三种独立的中微子——τ子中微子ν_τ的存在,于2000年在费米实验室得到确认。

这些粒子及其衰变过程(大部分涉及中微子)的存在,需要一个详尽的弱相互作用理论。这一理论是逐步发展起来的,汇聚了多位物理学家的贡献。弱相互作用中宇称、电荷共轭和时间反演这些分立对称性令人惊讶的破坏,提供了一些重要的线索。

12.7.1 宇称破坏
在量子力学早期,人们认识到原子波函数在空间反演x → −x下可以分为偶函数或奇函数。空间反演用宇称算符P表示,它将波函数Ψ(x, t)变为Ψ′(x, t),其中
Ψ′(x, t) = PΨ(x, t) = Ψ(−x, t) 。
(12.51)
P的本征值称为宇称。若Ψ(−x, t) = Ψ(x, t),宇称为正;若Ψ(−x, t) = −Ψ(x, t),宇称为负。⁷ 空间反演很重要,因为在物理学的多数领域它都是一种对称性。例如,若Ψ(x, t)是一个电子绕位于原点的原子核运动的波函数,则Ψ(−x, t)是一个相关联的波函数,如果它是定态则具有相同的能量,如果不是则演化方式相似。有时Ψ(x, t)和Ψ(−x, t)在物理上是不同的,但往往它们相等,或者只差一个符号;换句话说,波函数具有确定的宇称。

⁷ 这些宇称也分别称为偶宇称和奇宇称。

弱力
425
类似地,我们可以定义时间反演算符 (T),满足
[
\Psi’(x, t) = T\Psi(x, t) = \Psi(x, -t) ,
\tag{12.52}
]
以及电荷共轭算符 (C),它将粒子变换为反粒子,反之亦然,
[
\Psi’(x, t) = C\Psi(x, t) = \overline{\Psi}(x, t) ,
\tag{12.53}
]
其中 (\overline{\Psi}) 是 (\Psi) 的复共轭。
每个这种离散操作作用两次,就会恢复原来的波函数。例如,宇称算符作用两次给出
[
PP\Psi(x, t) = P\Psi(-x, t) = \Psi(x, t) .
\tag{12.54}
]
因此 (P) 的本征值为 (\pm 1),同样 (T) 和 (C) 的本征值也必须是 (\pm 1)。在非常一般的假设下可以证明,如果物理可以用量子场论描述,那么它必须在同时施加这三种算符的作用下保持不变,因此 (PCT) 必然是理论的一个对称性。这就是所谓的 (PCT) 定理。它意味着如果 (\Psi(x, t)) 是一个物理态,那么 (PCT(\Psi(x, t)) = \overline{\Psi}(-x, -t)) 也是一个物理态。我们可能会认为,物理在这些变换分别单独施加时也必须保持不变,但实际情况并非那么简单。
图12.18 左:当 (^{60}\mathrm{Co}) 原子核发生β衰变时,电子优先沿与核自旋反平行的方向发射。右:宇称变换颠倒了 (^{60}\mathrm{Co}) 自旋与电子行进方向之间的关系。但这一图像是非物理的。沿平行于 (^{60}\mathrm{Co}) 自旋方向发射的电子要少得多,因此宇称对称性被破坏。
如果空间反演是基础物理的真正对称性,那么对于每个观测到的过程,都会存在一个概率相等的镜像过程。量子力学中,宇称应该是守恒的。1956年,李政道(Tsung Dao Lee)和杨振宁(Chen Ning Yang)对这一假设提出了质疑。他们花了几周时间回顾过去的实验,得出结论:有许多实验证实了电磁相互作用和强相互作用的宇称守恒,但没有一个实验能说明弱相互作用中宇称是否守恒。他们提出了几个实验,其中

426
粒子物理学
这一点可以得到检验,吴健雄(Chien Shiung Wu)承担了其中的一个检验方案。她着手研究钴-60的β衰变,这是一种自旋值高达5的原子核。
钴-60原子核会发生以下β衰变
60
27Co →60
28 Ni + e−+ ¯νe .
(12.55)
吴将60Co样品冷却到0.01 K,并将其置于强磁场中以使60Co原子核的自旋轴对齐。每个原子核初始时都处于确定的宇称态。如果宇称守恒,那么电子发射的方向与原子核自旋轴之间应该没有任何关联。我们可以这样理解。空间反演是同时反转所有三个空间方向的操作。先进行x轴反演(x →−x),再进行y轴反演(y →−y),等效于绕z轴旋转180°。如果我们把一个60Co原子核放在原点,并将其自旋轴取为z轴,那么在上述旋转下自旋保持不变。在z方向反演(z →−z)下,自旋也保持不变。如果一个电子沿与核自旋相反的方向发射,其飞行方向在绕z轴旋转下也不会改变,但在z方向反演下会反转。如果宇称守恒,那么所有过程必须与它们的镜像过程以相同的速率发生,因此宇称守恒意味着沿平行和反平行于60Co核自旋方向发射的电子数必须相等。但吴发现的并不是这样。她证明电子优先沿与钴-60自旋相反的方向发射,如图12.18(左)所示,从而确立了弱相互作用中宇称对称性被破坏。
在发现宇称破坏之后,人们曾假设宇称与电荷共轭的组合CP是守恒的。然而,1964年发现弱相互作用同样破坏CP守恒。与宇称的破坏不同,CP的破坏是一个非常微小的量子效应。如果存在三代或更多代基本费米子,CP的破坏就可以得到解释。(根据PCT定理,CP的破坏等价于时间反演对称性T的破坏。)如今,P和CP破坏已被纳入电磁力和弱力的统一理论中,该理论构成了标准模型的一大部分。
12.8
电弱力理论
量子电动力学(QED)将电磁力解释为带电粒子之间交换虚光子,而量子色动力学(QCD)则将强力归因于夸克、反夸克和胶子之间交换胶子。这自然会引出问题:对于弱力,是否可能存在一种类似的、规范不变的杨-米尔斯理论?
20世纪30年代,费米(Fermi)提出了一种早期的弱力理论,其中β衰变事件(12.46)源于一个单一的相互作用顶角,在该顶角处四个粒子以由费米耦合常数GF决定的强度耦合,如图12.19(左)所示,其中GF
¯h3 ≃1.17×10−5 GeV−2。如果这种相互作用是由于交换质量为MW的重W玻色子所致,如图12.19(中)所示,那么观测到的弱力的微弱性就可以得到解释。这个图中有两个顶角,其强度gw是弱耦合常数。对于能量满足E2 ≪M 2
W 的低能相互作用,这导致了关系式
GF

2 = g2
w¯h2
M 2
W . (因子

2源于GF的历史定义。)无量纲的弱相互作用精细结构常数对应量为αw =
g2
w
4π¯h,如果假设这个量

电弱力理论
427
p
p
p
udu
udd
n
W
W
n
n
GF
gw
gw
e–
e–
e–
图12.19 左:费米理论中的四粒子顶点。中:W玻色子交换。右:用夸克表示的β衰变。
强度与电磁精细结构常数相当,则αw ≃ α ≃ 1/137。
由此得到
M2
W = 4π¯h3αw

2
GF



2
137 × 1.17 × 10−5 GeV2 ,
(12.56)
这表明交换玻色子的质量必定在100 GeV的量级。当可用能量远小于100 GeV时,弱相互作用比电磁相互作用弱得多,例如在中子β衰变中,但在更高能量下它们变得相当。

用W玻色子交换代替费米的相互作用顶点具有一些理论上的优势,这些优势在W玻色子被实验发现之前就已被认识到。它暗示了电磁相互作用与弱相互作用的统一。然而,存在一个问题。在杨-米尔斯拉格朗日量中添加交换玻色子的质量项½M2
W W · W会破坏理论的规范不变性,并使其在数学上不自洽。最初,这被视为这种模型的一个严重障碍。1964年,几位理论物理学家独立找到了这个问题的解决方案:彼得·希格斯(Peter Higgs);罗伯特·布劳特(Robert Brout)和弗朗索瓦·恩格勒(François Englert);杰拉德·古拉尼克(Gerald Guralnik)、卡尔·哈根(Carl Hagen)和汤姆·基布尔(Tom Kibble)。它被称为希格斯机制(Higgs mechanism),我们将在12.8.1节描述其工作原理。这是电磁与弱相互作用统一理论的关键,该理论以谢尔登·格拉肖(Sheldon Glashow)、史蒂文·温伯格(Steven Weinberg)和阿卜杜勒·萨拉姆(Abdus Salam)的名字命名为GWS理论,于20世纪60年代末发展起来。GWS电弱理论是一种杨-米尔斯规范理论,以一种特殊的方式与标量希格斯场以及夸克和轻子耦合。

根据GWS理论,弱力是通过交换三种有质量的自旋为1的玻色子产生的:W−、W+和Z玻色子。用夸克和轻子的语言,β衰变被解释为交换一个W−,如图12.19(右)所示。中子里的一个下夸克发射出一个虚W−粒子,从而转变为一个上夸克。这使得中子变成了质子。发射出的虚W−粒子然后立即衰变为从原子核中释放出的电子和电子反中微子。类似地,逆β衰变由W+交换来解释。

12.8.1 希格斯机制
我们将描述希格斯提出的希格斯机制的原始版本,这是一个基于电磁学的说明性模型。将该机制推广到物理上

428
粒子物理
图12.20 墨西哥帽势。
电弱理论的重要情形在代数上更为复杂,但其原理是相同的。希格斯(Higgs)提出了拉格朗日密度
L = −1
4F · F + 1
2DΦ · DΦ + 1
2µ2|Φ|2 −1
4λ|Φ|4
(12.57)
以描述单位电荷的复标量场Φ与电磁4-矢势A的耦合,其中F为电磁场强。DΦ = ∂Φ −iAΦ是标量场的协变导数,而希格斯势为
U(|Φ|) = −1
2µ2|Φ|2 + 1
4λ|Φ|4 ,
(12.58)
其中λ和µ为正常数,|Φ|2 = ΦΦ。U被称为墨西哥帽势,如图12.20所示。由于U不依赖于Φ的相位,该势在规范变换下保持不变。项 −1
4F ·F + 1
2DΦ·DΦ 也是规范不变的,其方式本质上与我们在第12.4.1节中讨论的QED拉格朗日密度相同。

为方便起见,我们将希格斯势平移常数 1
4λv4,其中 µ2 = λv2。这对场方程没有影响,但现在
U(|Φ|) = 1
4λ(|Φ|2 −v2)2 .
(12.59)
量子场论中的物理粒子是围绕真空位形的量子化激发,正如我们在第12.2节所讨论的。在希格斯模型中,量子场论的真空位于势U的最小值处。此前我们假设在真空态中Φ = 0,即场为零。然而,希格斯势的构造使得情况并非如此;任何满足|Φ| = v的场都使其最小化。量子场论必须具有唯一的真空态,但这里真空似乎是简并的,这对该理论至关重要。数学上,存在一个由|Φ| = v给出的可能真空态的圆,但这些真空态在物理上是不可区分的,因为它们只相差一个规范变换,该变换改变Φ的相位。我们假设在宇宙演化的极早期,系统经过随机量子涨落后产生了一个唯一的真空态。为简单起见,我们将选择这个真空态为Φ = v。(我们可以通过方便地选择规范固定来自由地做到这一点。)现在,即使Φ场未被激发且不存在Φ粒子时,整个虚空中也存在非零场Φ = v,这是由于Φ场的非线性自耦合所致。

电弱力理论
429
值得注意的是,这仅对标量场可能,因为存在非零背景矢量场将在空间定义一个特殊方向,从而破坏洛伦兹不变性。在真空中,电磁势必须为 A = 0。
在选择唯一的真空态时,系统似乎失去了希格斯势的原始对称性。这被称为自发对称性破缺(spontaneous symmetry breaking)。通常对称性被描述为隐藏而非破缺,因为理论保留了底层的规范对称性,但它以更复杂的非线性方式表现出来。连锁效应是电磁场的规范对称性自发破缺,光子变成有质量粒子。为了展示这一点,我们进行展开
Φ(x, t) = v + η(x, t) (12.60)
并代回拉格朗日量。项
1/2 DΦ · DΦ 包含部分
1/2 (−iAΦ) · (−iAΦ) = 1/2 A · A|Φ|^2。在真空 Φ = v 附近,这一部分的主导项是
1/2 v^2 A · A,这是场 A 的质量项,因此该理论现在描述一个有质量的矢量玻色子,其质量参数 M = v。
在用 Φ = v + η 重写拉格朗日量的其余部分后,涉及 η 的项为
Lη = 1/2 ∂η · ∂η − 1/4 λ((v + η)^2 − v^2)^2 = 1/2 ∂η · ∂η − λv^2 η^2 + . . . . (12.61)
η 是一个实动力学场,是 Φ 偏离真空 v 的偏差,通过量子化该场产生的粒子称为希格斯玻色子。η^2 项的系数是 λv^2,因此希格斯玻色子的质量参数为 mη = √(2λ)v。
无质量自旋为 1 的粒子有两个偏振态,而有质量的自旋为 1 的粒子(矢量玻色子)则有三个偏振态。额外的偏振态如何产生?Φ 场是复的,因此有两个自由度。一个是场 η,另一个是墨西哥帽势中连接简并真空的角变量。这第二个自由度成为矢量玻色子的纵向偏振。另一种观点是,在采用 Φ 为实的规范中,不能再对 A 施加规范条件迫使其纵向分量为零。因此,曾经的无质量光子获得了一个额外的偏振态,成为有质量矢量玻色子。
GWS理论(Glashow-Weinberg-Salam theory, 格拉肖-温伯格-萨拉姆理论)的拉格朗日量更加复杂。它始于四个无质量自旋为 1 的玻色子,它们传递电弱力。它还包含一个标量场 Φ,其自相互作用由希格斯势描述。在此情况下,场 Φ 是一个复二重态,因此有四个实自由度。希格斯势的对称性自发破缺,结果是四个自旋为 1 的玻色子中的三个变成有质量的 W+、W− 和 Z 玻色子,传递弱力。Φ 场的三个自由度成为这些粒子的纵向偏振。剩余的自由度,类似于场 η,独立于它们,经量子化产生一个自旋为 0 的标量粒子,即希格斯玻色子 H。第四个自旋为 1 的玻色子不与 Φ 场相互作用,保持无质量。这就是物理光子。原始的电弱力被分成了两种显然非常不同的力:强大且长程的电磁力和微弱且短程的弱力。
12.8.2
费米子质量
我们现在知道,弱相互作用最大程度地破坏宇称,这是因为,令人惊讶的是,W 玻色子只耦合到左手轻子和夸克以及右-

430
粒子物理
征的反轻子和反夸克。一个左手征的无质量粒子是指其自旋轴与动量方向相反的粒子。W玻色子不与右手征的轻子和夸克以及左手征的反轻子和反夸克耦合。

n
p
ˉ
e–
图12.21 左: 一个在60Co核中、自旋方向朝上的中子发生β衰变之前的状态。
右: β衰变后,质子自旋方向朝下。β衰变中放出的反中微子总是右手征的,因此为了保持角动量守恒,它必须向上发射。而为了保持线动量守恒,电子必须向下发射。

现在我们可以理解在60Co中观测到的宇称破坏了。当中子发生β衰变时,60Co核失去一个单位的自旋。如果原始中子的自旋沿正z方向排列(由磁场实现),那么β衰变之后,产生的质子的自旋就沿负z方向排列。角动量是守恒的,因此反中微子和电子的总自旋必须为1,且方向与质子的自旋相反,所以反中微子和电子的自旋必须都沿正z方向排列。线动量也是守恒的,由于核在β衰变前后动量基本上为零,这意味着反中微子和电子必须沿相反方向发射。反中微子的质量极小,小于1 eV,因此它以极端相对论的速度离去。衰变中的中子放出的虚W玻色子只与右手征的反中微子耦合,所以反中微子的自旋轴必须与其动量矢量方向一致。因此,反中微子沿正z方向发射,而电子沿负z方向发射,如图12.21所示。

宇称破坏给电弱理论带来了一系列后果,包括费米子质量的起源问题。费米子质量之所以是个问题,缘于下面的论证。考虑一个以速度v沿正

电弱力理论
431
方向,其自旋矢量沿相同方向排列。如果我们变换到一个以速度u沿z方向运动的参考系,且|u| > |v|,那么在新参考系中,电子将沿负z方向运动,但其自旋仍沿正z方向排列。我们仅仅通过改变参考系,就将一个右手电子变换成了左手电子。因此,像电子这样的大质量费米子,其场需要同时包含左手和右手部分,而狄拉克(Dirac)4分旋量ψ确实具备这一点,从而可以在拉格朗日密度中包含形如M₀ψψ的狄拉克质量项。然而,电弱力对左手和右手粒子的处理方式不同,在标准模型的拉格朗日量中,要包含一个与电弱规范对称性相容的费米子狄拉克质量项是不可能的。但大多数夸克和轻子确实具有质量。这一悖论通过以下方式得到解决:出发点是无质量的费米子,并让它们通过希格斯机制(Higgs mechanism)动力学地获得其静止质量。

回想一下,汤川相互作用(Yukawa interactions)将费米子、反费米子和标量耦合起来。在GWS模型(GWS model)中,费米子作为无质量粒子被加入到拉格朗日量中,并与希格斯场具有汤川耦合。只有左手费米子参与弱相互作用,因此左手费米子场被组合成二重态,与W和Z规范玻色子耦合。存在一个u和d夸克二重态,一个e和νₑ轻子二重态,另外两代也类似。右手场不与W和Z耦合,因此它们是单态,不携带任何弱相互作用荷。拉格朗日量中的质量项必须同时涉及左手和右手场,而将一个左手二重态与一个右手单态以规范不变的方式耦合起来的唯一方法,就是引入复二重态希格斯场Φ。有了希格斯场,就可以在拉格朗日量中写出如下形式的汤川项:
L_Yuk = g_f ψ_L Φ ψ_R (12.62)
左手费米子二重态ψ_L与二重态希格斯场Φ的乘积是规范不变的,右手费米子单态ψ_R也是如此。因此,该汤川项是规范不变的。

现在,希格斯机制登场了。Φ具有非零的真空值。如果我们围绕真空展开,将Φ = v + H代入汤川项,就得到两项:g_f v ψ ψ 和 g_f ψ ψ H。第一项是费米子的质量项,第二项是与希格斯玻色子H的耦合。在GWS模型中,汤川耦合常数g_f由以下要求决定:希格斯机制负责赋予每个费米子其全部的静止质量。质量本质上是g_f v。v由W和Z粒子的物理性质所知,因此测量每个费米子f的质量就决定了耦合常数g_f。不幸的是,迄今为止,尚无独立的对费米子质量的理解,能够用以预言这些耦合常数g_f。然而,既然已知g_f正比于费米子质量,那么希格斯玻色子H与标准模型中每个费米子之间的汤川耦合g_f ψ ψ H就正比于该费米子质量,因此对每种粒子都不同。希格斯粒子与重夸克(t和b)以及重 τ 子的耦合,远大于其与轻夸克和更轻轻子的耦合,因此希格斯玻色子优先衰变为较重的粒子。希格斯玻色子衰变道的分支比目前正在测量中。最新的结果似乎证实了GWS模型的预言。

432
粒子物理学
W
Z
e⁻
e⁻
e⁻
e⁻
图12.22 左:中微子与电子之间W玻色子的交换。右:中微子与电子之间Z玻色子的交换。
12.8.3 发现W和Z玻色子以及希格斯玻色子
在20世纪70年代早期,从未观察到任何可以归因于电中性Z玻色子交换的效应,但由于Z玻色子与W玻色子耦合强度相同,这种效应非常微小且难以探测。这些后来被称为弱中性流效应的现象包括由图12.22(右)所示的Z玻色子交换产生的中微子散射过程,并于1974年在CERN的加尔加梅勒(Gargamelle)气泡室中首次被观测到。它们的发现对于GWS电弱理论获得认可至关重要。
du
uu
W⁺
e⁺
W⁺
duu
p
duu
p
ˉˉ ˉ
ˉ ˉ
ˉ
图12.23 左:质子-反质子碰撞中W⁺玻色子的产生。右:W⁺玻色子衰变为一个正电子和一个中微子。
uu
uu
Z
e⁺
e⁻
Z
uud
p
duu
p
ˉˉ ˉ
ˉ ˉ
ˉ
图12.24 左:质子-反质子碰撞中Z玻色子的产生。右:Z玻色子衰变为一个电子和一个正电子。

电弱力理论
433
在发现弱中性流之后,卡洛·鲁比亚(Carlo Rubbia)、彼得·麦金太尔(Peter McIntyre)和戴维·克莱因(David Cline)说服CERN将新的超级质子同步加速器(Super Proton Synchrotron, SPS)改造成质子-反质子对撞机,并建造两个名为UA1和UA2的新型探测器。目标是寻找W和Z玻色子。这些探测器于1981年记录到首次碰撞。图12.23(左)显示了在质子-反质子对撞机中产生W⁺玻色子的一种模式。然后W⁺衰变为一个带电轻子和一个未被探测到的中微子,如图12.23(右)所示。因此,W⁺的信号是探测到一个高能轻子,其能量等于W⁺静止质量的一半。图12.24(左)显示了产生Z玻色子的一种模式。Z玻色子有多种衰变模式。最具特色的是衰变为带电轻子-反轻子对,如图12.24(右)所示。Z玻色子的信号是在相反方向探测到一个高能轻子和一个高能反轻子,两者在Z玻色子静止系中的能量都等于Z质量的一半。W玻色子的发现于1983年1月宣布,Z玻色子的发现于同年晚些时候宣布。W的质量为80.4 GeV。Z的质量为91.2 GeV。
图12.25 质子-质子碰撞中产生希格斯玻色子的两种方式。左:通过顶夸克圈的胶子聚变。右:W或Z玻色子交换。
LHC于2008年投入使用时,其首要任务是通过寻找最后缺失的粒子——希格斯玻色子H来完成标准模型。如前所述,标准模型希格斯机制的作用是赋予W和Z玻色子以及基本费米子静止质量,由此可知,这些粒子与H之间的相互作用强度与它们的质量成正比。这对于H的产生和衰变都很重要。质子包含夸克和胶子亚组分,这提供了质子-质子碰撞中可能产生希格斯玻色子的多种途径。顶夸克的质量远大于其他夸克和轻子,因此它与H的耦合强度最大。图12.25(左)显示了如何通过顶夸克圈的胶子聚变产生H。这是在LHC上产生希格斯玻色子的最重要渠道。图12.25(右)显示了通过两个夸克之间的W玻色子交换产生H的过程。

434
粒子物理学
2012年7月,CERN宣布大型强子对撞机(LHC)发现了质量为125 GeV的希格斯玻色子(Higgs boson)。目前人们正在深入研究H粒子的衰变,以检验它们是否符合基于标准模型粒子质量的预期。迄今为止,希格斯玻色子与W、Z粒子以及各种夸克和轻子的耦合与理论吻合良好。希格斯玻色子的自旋也已得到测量并被确认为零。任何与这些模式的偏离都将预示着超出标准模型的新物理。
12.8.4
夸克混合
在GWS模型的一个简单版本中,弱力独立地作用于每一代内部,GWS拉格朗日量的费米子部分由每一代的左手双重态和右手单态构成,如前所述。然而,如果仅此而已,那么第二代和第三代中的最轻夸克将完全稳定,无法转变为第一代夸克。这意味着,一旦在空间上分离,强相互作用过程中产生的K−(s¯u)介子将不会衰变。但实际上,由于s夸克通过W −介导衰变成u夸克,K−介子的寿命相当短。为了正确构建GWS模型,我们还必须考虑其他一些实验结果。尽管弱力与每个带电轻子的耦合强度相同,但在弱相互作用夸克顶点udW处的耦合比µνµW顶点处的耦合小5%。此外,测量到的K−(s¯u) → µ−¯νµ衰变率与π−(d¯u) → µ−¯νµ衰变率之比,仅为假定所有夸克弱耦合强度相同时预期值的二十分之一左右。
解决这些问题的办法是在理论中引入夸克混合。GWS拉格朗日量只能构建于左手夸克双重态(和右手单态)之上,因此我们必须将六种夸克味道组合成三个双重态。按惯例,这三个双重态中的上型夸克就是(u, c, t)。双重态中的下型夸克并非费米子表中的标准夸克(d, s, b),而是它们的混合,记为(d′, s′, b′)。(若要守恒电荷,则只能混合带相同电荷的夸克。)
费米子表中的每种味道夸克都是一个质量本征态,这正是我们在测量介子质量时所看到的。然而,我们没有理由假设弱相互作用所见的夸克态与质量本征态相同。暂且忽略第三代夸克,夸克混合由一个角度参数化,即卡比博角(Cabibbo angle)θC。弱作用本征态(d′, s′)与(d, s)的关系为
[
\begin{pmatrix} d’ \ s’ \end{pmatrix}

\begin{pmatrix}
\cos \theta_C & \sin \theta_C \
-\sin \theta_C & \cos \theta_C
\end{pmatrix}
\begin{pmatrix} d \ s \end{pmatrix}
]
(12.63)
弱相互作用将上夸克u直接耦合到d′,将粲夸克c耦合到s′。因此,u夸克与s夸克的弱耦合正比于(g_w^2 \sin^2 \theta_C),而u夸克与d夸克的弱耦合正比于(g_w^2 \cos^2 \theta_C),它们的比值为(\tan^2 \theta_C)。为了解释观测到的K介子和π介子的衰变率以及其他弱相互作用率,要求(\tan^2 \theta_C \simeq 0.05)。当前卡比博角的最佳值为(\theta_C \simeq 0.23)。
这一方案于20世纪60年代提出,不仅解释了含有奇异夸克的介子衰变,还暗示了需要另一个c夸克来与s夸克配对。1974年11月,随着第四个夸克——粲夸克的发现,这一预言得到了证实。

电弱相互作用理论
435
1974年对于夸克存在性的确立起到了关键作用,并将粒子物理标准模型推向了前沿。

我们现在知道存在三代夸克。弱相互作用中味道的完全混合由卡比博-小林-益川(Cabibbo–Kobayashi–Maskawa, CKM)矩阵描述
[
\begin{pmatrix}
d’ \
s’ \
b’
\end{pmatrix}

\begin{pmatrix}
V_{ud} & V_{us} & V_{ub} \
V_{cd} & V_{cs} & V_{cb} \
V_{td} & V_{ts} & V_{tb}
\end{pmatrix}
\begin{pmatrix}
d \
s \
b
\end{pmatrix}.
\tag{12.64}
]
电荷为(q = \frac{2}{3})的夸克(u, c, t)在电弱相互作用中直接与电荷为(q = -\frac{1}{3})的夸克(d’, s’, b’)耦合,并通过CKM矩阵与(d, s, b)耦合。如果没有CKM矩阵,较重的夸克代就不能衰变到较轻的代。对CKM矩阵元的约束将其矩阵元约化为三个独立的旋转角和一个复相位。该复相位不为零,这导致了弱相互作用中CP对称性的破缺。卡比博的两代模型无法自然容纳CP破缺相位,因此包含三代夸克的理论具有某种必然性。然而,目前尚无更深层次的理解来解释这三个角度和复相位的具体数值。

12.8.5
有多少代?

一个引人注目的事实是,如果基本粒子是任意集合的,标准模型在数学上将是不自洽的。这些潜在的不自洽性被称为反常,它们源于弱相互作用对左手费米子和右手费米子的耦合不同。要使理论自洽,必须由不同基本粒子引起的反常之间相互抵消,而这些抵消意味着粒子所带电荷之间存在关系。结果表明,每一代费米子中的四个粒子之间,反常恰好相互抵消。这意味着对于完整的代,标准模型是自洽的。因此,当τ子(tauon)在1970年代中期被发现时,物理学家就有信心预言第三代中其他三个成员的存在,尽管要等二十年才观察到顶夸克,再等五年才观察到这一代的最后一个成员——τ子中微子(tauon neutrino)。因此,基本费米子至少有三代,但总共有多少代呢?值得注意的是,我们现在对这个问题有了一个明确的答案。

从1989年到2000年,欧洲核子研究中心(CERN)运行了大型正负电子对撞机(LEP)。电子和正电子束的能量被精确调节,以产生大量的Z玻色子,从而可以确定其衰变性质。Z玻色子有几种衰变方式。它可以衰变为夸克-反夸克对,其中夸克可以是五种最轻夸克中的任何一种,此时末态产物是强子。它可以衰变为三种带电轻子(l⁻)及其反粒子(l⁺)中的每一种。它也可以衰变为中微子-反中微子对,例如(Z \to \nu_e \bar{\nu}_e)。关键的是,假设中微子比Z玻色子轻得多,那么这种衰变可能的方式数目就等于代的数目。每一种衰变模式都对Z的衰变率有贡献。在LEP上,总共观测到了1700万次Z衰变。这使得物理学家能够确定中微子的种类数,从而确定代的数目。在Z玻色子衰变为中微子的过程中,中微子逃逸而未被探测到。尽管如此,部分

436
粒子物理学
30
2
3
4
20
10
平均测量值,
误差棒放大
10倍
Γz
σhad (nb)
0
86
88
90
Ecm(GeV)
92
94
图 12.26 实测Z玻色子衰变宽度ΓZ与计算所得对于两种、三种和四种中微子情形的总衰变宽度之间的比较。LEP的测量结果与三种中微子的预言衰变宽度相符。
衰变到中微子的宽度 Γ(Z → νl ν̄l) 可从总宽度公式推出:
ΓZ = Γ(Z →强子) + 3 Γ(Z → l⁺l⁻) + N(ν) Γ(Z → νl ν̄l) , (12.65)
其中 N(ν) 是中微子种类数。测量得到的Z玻色子总衰变宽度为 ΓZ = 2.490 ± 0.007 GeV。测得的衰变到强子的分宽度为 Γ(Z →强子) = 1.741 ± 0.006 GeV,衰变到每一类带电轻子的分宽度为 Γ(Z → l⁺l⁻) = 0.0838 ± 0.0003 GeV。这些测量值与标准模型的计算一致。计算给出的衰变到每种中微子的宽度为 Γ(Z → νl ν̄l) = 0.166 GeV。将上述数值代入方程 (12.65),即得 N(ν) = 2.9840 ± 0.0082,这清楚地表明存在三种中微子,且仅有三种。标准模型只有在费米子构成完整世代时才自洽,因此这一结果说明基本费米子恰好有三代。

中微子振荡
437
12.9 中微子振荡
恒星由于其核心的聚变反应而发射出巨量的中微子。在20世纪60年代末,雷·戴维斯(Ray Davis)设计并建造了一个中微子探测器,它位于南达科他州霍姆斯特克金矿地下1.5公里处,用以研究太阳发射的中微子。平均每天探测到0.48个太阳中微子,而根据戴维斯的合作者约翰·巴考尔(John Bahcall)对太阳中微子通量的计算,预期的探测率大约是每天1.5个。最初,大多数物理学家对这一差异不以为然,因为探测器相对简陋,且中微子通量的计算依赖于难以检验的复杂恒星模型。在戴维斯开创性实验之后的几年里,人们逐渐认识到这种差异是真实存在的,并且可以用中微子相当令人惊讶的行为来解释。

近几十年来,恒星理论得到了日震学这一新科学的支持。太阳表面附近各层中的湍流会产生压力波,这些压力波导致太阳光谱吸收线产生多普勒频移。自2000年以来,位于日地L1拉格朗日点的SOHO(太阳和日球层观测站)空间探测器一直在持续监测这些波。正如地震产生的地震波可以用来探测地球的内部结构一样,太阳压力波也是有关太阳结构的宝贵信息来源。这就是为什么对它们的研究被称为日震学。对这些波的分析使天体物理学家能够精确地确定太阳的关键特征,如其密度分布、核心温度和核心成分。这些测量为我们将在第13章讨论的恒星模型提供了关键的证明。事实上,观测结果以大约0.5%的精度证实了巴考尔的“标准太阳模型”,这使得通过改进对太阳内部聚变反应的描述来解释中微子缺失变得毫无可能。

在太阳物理学取得这些进展的同时,全球范围内中微子探测器的建造也取得了重大进展。其中最大的是日本的超级神冈探测器 ,它装有5万吨超纯水,周围环绕着能够探测单个光子的光电倍增管。偶尔,一个中微子会与水中的一个电子发生散射。这一“踢”给了电子一个与入射中微子方向密切相关的相对论性速度。当电子在水中高速穿行时,它会发射出切伦科夫辐射 8,这些辐射被光电倍增管探测到,从而使探测器能够确定中微子来源的方向。超级神冈证实了霍姆斯特克实验探测到的中微子确实来自太阳。此外,人们还分析了由大气中的宇宙射线相互作用产生的中微子,并比较了从探测器上方到达的中微子数量与在地球另一端的大气中产生后穿行地球而来的中微子数量。

另一个复杂的中微子设施是位于加拿大安大略省的萨德伯里中微子观测站(SNO)。该探测器由1000吨重水组成,可以通过三种方式探测中微子。带电流通道通过以下与氘核的相互作用(由于交换

8 带电粒子在介质中以高于该介质中光速的速度穿行时会发出锥形的切伦科夫辐射。这是一种冲击波,类似于物体以高于音速的速度运动时产生的音爆。

438
粒子物理

交换虚W玻色子:
νe + 2H(p, n) → p + p + e⁻。 (12.66)
接下来是中性流通道,其中氘核通过交换虚Z玻色子而离解:
ν + 2H(p, n) → p + n + ν。 (12.67)
这种相互作用对全部三种中微子都有效,因此决定了中微子的总通量 Φ(νe) + Φ(νμ) + Φ(ντ)。所有三种中微子也可以与电子发生弹性散射,这被称为弹性散射通道:
ν + e⁻ → ν + e⁻。 (12.68)
电子中微子可以通过交换W玻色子或Z玻色子与电子散射,如图12.22所示,而μ子中微子和τ子中微子只能通过交换Z玻色子散射,因此电子中微子的散射率不同。由该通道确定的通量组合计算为 Φ(νe) + 0.15(Φ(νμ) + Φ(ντ))。

SNO(萨德伯里中微子观测站,Sudbury Neutrino Observatory)给出的中微子通量值(单位为10⁻⁸ cm⁻²s⁻¹)如下:
Φ(νe) = 1.76 ± 0.01,
Φ(νe) + Φ(νμ) + Φ(ντ) = 5.09 ± 0.63, (12.69)
因此总中微子通量接近电子中微子通量的三倍。此外,在相同单位下,巴科尔(Bahcall)的太阳标准模型(Standard Solar Model)预测,由太阳核心产生、能量足以(> 2 MeV)离解氘核的电子中微子通量为
ΦBSSM(νe) = 5.05 ± 1.01。 (12.70)
这证实了霍姆斯特克中微子探测器(Homestake neutrino detector)的原始发现,并强烈表明:太阳内部产生的中微子最初全是电子中微子⁹,但当它们到达地球上的探测器时,已经以某种方式转变成了μ子中微子和τ子中微子。这一解释已得到各种其他中微子实验的加强,包括对核电站产生的中微子的研究、对宇宙射线撞击地球大气层产生的中微子的研究,以及利用粒子加速器产生的中微子束的实验。

如果三种中微子各自具有很小但不同的质量,而且弱相互作用本征态与质量本征态并不相同——正如我们在考虑夸克时所发现的那样——那么中微子种类之间的嬗变就可以理解。如果一个中微子通过带电流通道相互作用并产生一个电子,我们可以确定进入探测器的那个中微子是电子中微子。类似地,当一个原子核发生逆β衰变时,我们知道与正电子一起发射出来的中微子就是电子中微子。根据定义,当中微子耦合到

中微子振荡
439
与W玻色子相关联的是电子中微子,对于μ子中微子和τ子中微子情况类似。这些类型的中微子νe, νµ, ντ被称为弱本征态。当中微子发生相互作用时,我们可以确定它的弱本征态,但我们无法确定其质量本征态,因此我们没有理由认为弱本征态与质量本征态相同。根据量子力学,我们只能假设当一个电子中微子产生时,它处于三个质量本征态的叠加态。我们可以将其表示为
Ψ(νe) = Ue1Ψ(ν1) + Ue2Ψ(ν2) + Ue3Ψ(ν3) ,
(12.71)
其中ν1, ν2, ν3是三个质量本征态,Ue1, Ue2, Ue3是一个3×3矩阵的矩阵元,该矩阵类似于CKM矩阵。更一般地有


Ψ(νe)
Ψ(νµ)
Ψ(ντ)

=


Ue1
Ue2
Ue3
Uµ1
Uµ2
Uµ3
Uτ1
Uτ2
Uτ3




Ψ(ν1)
Ψ(ν2)
Ψ(ν3)

.
(12.72)
为简单起见,我们考虑一个两代模型。我们可以用一个角度θ来参数化质量本征态的混合,即

Ψ(νe)
Ψ(νµ)



cos θ
sin θ
−sin θ
cos θ
 
Ψ(ν1)
Ψ(ν2)

.
(12.73)
在时间t = 0时产生的一个电子中微子可以表示为一个量子态,其波函数为
Ψ(0) = Ψ(νe) = cos θ Ψ(ν1) + sin θ Ψ(ν2) .
(12.74)
中微子波函数的演化由含时自由薛定谔(Schrödinger)方程描述。在时间t且距源距离为z处,波函数将为
Ψ(z, t) = cos θ Ψ(ν1)eiφ1 + sin θ Ψ(ν2)eiφ2 ,
(12.75)
其中φi = 1/¯h(piz −Eit),且E_i^2 − p_i^2 = m_i^2。这就是质量如何引入的,也是Ψ(νi)被称为质量本征态的原因。如果两个本征态的质量m1和m2不同,那么中微子波函数的两个分量的相对相位就会改变。
可以利用混合矩阵的逆将质量本征态重新分解为弱本征态,
Ψ(ν1)

cos θ Ψ(νe) −sin θ Ψ(νµ)
Ψ(ν2)

sin θ Ψ(νe) + cos θ Ψ(νµ) .
(12.76)
将这些表达式代入Ψ(z, t),我们得到
Ψ(z, t)

cos θ(cos θ Ψ(νe) −sin θ Ψ(νµ))eiφ1
+ sin θ(sin θ Ψ(νe) + cos θ Ψ(νµ))eiφ2

(eiφ1 cos2 θ + eiφ2 sin2 θ)Ψ(νe) −(eiφ1 −eiφ2) sin θ cos θ Ψ(νµ)

eiφ1{(cos2 θ + ei∆φ sin2 θ)Ψ(νe) −(1 −ei∆φ) sin θ cos θ Ψ(νµ)}

ceΨ(νe) + cµΨ(νµ) ,
(12.77)
其中系数为ce = eiφ1(cos2 θ + ei∆φ sin2 θ)和cµ = −eiφ1(1 −ei∆φ) sin θ cos θ,我们定义了这两个质量本征态之间的相位差∆φ = φ2 −φ1 = 1/¯h((p2 −p1)z −(E2 −E1)t)。

440
粒子物理学

如果 ∆φ = 0,则 |cₑ| = 1 且 c_μ = 0,此时电子中微子将保持为电子中微子。然而,如果 ∆φ ≠ 0,则 c_μ ≠ 0,在初始为电子中微子的束流中探测到 μ子中微子的概率为
P_μ = |c_μ|²
= (1 − e^{i∆φ})(1 − e^{−i∆φ}) sin² θ cos² θ
= (2 − 2 cos ∆φ) sin² θ cos² θ
= sin²(∆φ/2) sin²(2θ) 。 (12.78)
∆φ 是时间和位置的函数,因此这一概率会振荡。因子 sin²(2θ) 给出混合的强度。通过在不同距离处测量来自电子中微子源的 P_μ,可以分离出 ∆φ 与 θ 的效应(见图 12.27)。最大混合要求 sin²(2θ) = 1,此时一束电子中微子将周期性地完全转变为 μ子中微子束,然后再变回来。(对于电子中微子和 μ子中微子,实验测得的 θ 值已接近满足这一条件。)

1.0
初始电子中微子的振荡概率
5000
0.8
0.6
概率
0.4
0.2
0.0 0
10000
15000
20 000
25 000
30 000
35 000
L/E (km/GeV)
图 12.27 从一束能量为 E(以 GeV 为单位)的电子中微子出发,黑线表示在距离 L km 处探测到该中微子仍为电子中微子的概率。蓝线和红线分别表示该中微子是 μ子中微子或 τ子中微子的概率。

三代中微子混合矩阵被称为 PMNS 矩阵(PMNS matrix),以布鲁诺·庞蒂科夫(Bruno Pontecorvo)、牧二郎(Ziro Maki)、中川昌美(Masami Nakagawa)和坂田昌一(Shoichi Sakata)的名字命名。与夸克的 CKM 矩阵一样,它可以简化为三个独立的角度和一个相位 δ。目前的最佳值

中微子振荡
441
混合角的数值为
sin²(2θ₁₂) = 0.87 ± 0.04 ,
sin²(2θ₂₃) > 0.92 ,
sin²(2θ₁₃) ≃ 0.10 ± 0.01 ,
(12.79)
其中下标对表示所涉及的中微子代。目前,相位δ的大小尚不清楚。如果它不为零,那么中微子振荡将违反CP守恒。

与夸克和带电轻子的质量相比,中微子的质量非常微小。它们可以通过涉及一个未观测到的中微子的过程中,所观测粒子的动量和能量来独立确定。目前,它们的精确值尚不明确,但肯定小于1 eV。(相比之下,电子的质量为511 keV。)尽管如此,在中微子振荡实验中,中微子的质量平方差已经被测定,精度优于5%。结果如下:
Δm²₂₁ = m²₂ - m²₁ ≃ (7.6 ± 0.2) × 10⁻⁵ eV² ,
|Δm²₃₂| = |m²₃ - m²₂| ≃ (2.3 ± 0.1) × 10⁻³ eV² ,
(12.80)
因此 |Δm²₃₁| ≃ |Δm²₃₂|。

这些结果的发现过程如下。对于一个具有确定能量且能量远大于其中微子质量的中微子,有 E₁ = E₂ = E_ν 以及 p_i = (E²_i - m²_i)^(1/2) ≃ E_ν - m²_i / (2E_ν)。因此,差值 p₂ - p₁ 与 Δm² = m²₂ - m²₁ 成正比,对于每种类型的中微子振荡,相位随距离z的变化为 Δφ = (1/ħ)((p₂ - p₁)z - (E₂ - E₁)t) ≃ -(Δm²)z / (2E_ν ħ)。对于一束能量为 E_ν = 1 GeV 的中微子,我们得到
|Δφ|/2 = (Δm²)z / (4 × 10⁹ × 1.97 × 10⁻⁷ eV⁻² m⁻¹) = 1.27 × 10⁻³ (Δm²) z eV⁻² m⁻¹ ,
(12.81)
这里我们使用了换算因子 ħ = 1.97 × 10⁻⁷ eV·m。在中微子振荡的相邻峰值之间,函数 sin²(Δφ/2) 的辐角变化了 π。令 |Δφ|/2 = π,并将 Δm²₂₁ = 7.6 × 10⁻⁵ eV² 的值代入方程 (12.81),得到电子-μ子中微子振荡的波长 z = π / (1.27 × 7.6) × 10⁸ m ≃ 33,000 km,这与图12.27中观测到的振荡相符。Δm²₃₂ = 2.3 × 10⁻³ eV² 这个值产生的μ子-τ子中微子振荡的波长为 z = π / (1.27 × 2.3) × 10⁶ m ≃ 1100 km。

目前,有大规模的实验努力来更精确地测量这些波长。这包括长基线测量,即在一个实验室(如J-PARC、CERN、费米实验室(Fermilab))产生的中微子,在数百公里外的另一个实验室(如超级神冈探测器(Super-Kamiokande)、格兰萨索(Gran Sasso)、苏丹矿(Soudan Mine))被探测到。接收实验室都设在地下,以限制宇宙射线产生的非中微子粒子的背景噪声。

442
粒子物理学
12.10
延伸阅读

关于费曼(Feynman)的量子理论方法,特别是光子与物质相互作用的概述,请参阅:
R.P. Feynman, QED: The Strange Theory of Matter and Light (QED:光和物质的奇异理论), London: Penguin, 1985.

关于粒子物理学,特别是夸克、电弱理论和希格斯机制的历史性介绍,请参阅:
N.J. Mee, Higgs Force: Cosmic Symmetry Shattered (希格斯力:破碎的宇宙对称性), London: Quantum Wave, 2012.
A. Watson, The Quantum Quark (量子夸克), Cambridge: CUP, 2004.

关于粒子物理学和量子场论的全面论述,请参阅:
M. Thomson, Modern Particle Physics (现代粒子物理学), Cambridge: CUP, 2013.
M.D. Schwartz, Quantum Field Theory and the Standard Model (量子场论与标准模型), Cambridge: CUP, 2014.
A. Zee, Quantum Field Theory in a Nutshell (简明量子场论), Princeton: PUP, 2003.

关于中微子物理学的最新综述,请参阅:
K. Zuber, Neutrino Physics (中微子物理学) (第二版), Boca Raton FL: CRC Press, 2012.
S. Boyd, Neutrino Physics Lecture Notes—Neutrino Oscillations: Theory and Experiment (中微子物理讲义——中微子振荡:理论与实验), Warwick University, 2015.