无标题
12_Particle_Physics
12
粒子物理
12.1
标准模型
在本章中,我们将探究物质的基本组分。至此,我们已经从四种不同的力的角度考察了宇宙的结构及其所包含的物质:引力与电磁力,再加上两种核力——强力和弱力。引力决定了宇宙的大尺度结构,但引力内在的微弱性意味着它对基本粒子对(例如原子中的电子)之间相互作用的影响完全可以忽略不计。相比之下,其他三种力在粒子物理中都扮演着重要角色。电磁力将原子束缚在一起,强力将质子和中子束缚在原子核中,它在α衰变和核裂变中也至关重要。弱力负责原子核的β衰变,并在恒星内部元素合成中起主要作用。当弱力起作用时,粒子可能会改变其身份。例如,在β衰变中,一个中子转变为一个质子,同时产生一个电子和一个电子反中微子。今天,这三种力被理解在一个单一的结构中,其中包括电磁力和弱力的统一理论,以及与强力的一个相当类似的理论相结合。这个极为成功的理论是现代物理学的辉煌胜利之一,它被称为标准模型。
质量
电荷
2/3
≈2.3 MeV/c²
≈4.8 MeV/c²
≈95 MeV/c²
≈4.18 GeV/c²
≈126 GeV/c²
0.511 MeV/c²
<2.2 eV/c²
<0.17 MeV/c²
<15.5 MeV/c²
105.7 MeV/c²
1.777 GeV/c²
≈1.275 GeV/c²
≈173.07 GeV/c²
1/2
–1/3
1/2
–1
1/2
0
1/2
0
1/2
0
1/2
–1
1/2
–1
1/2
–1/3
1/2
–1/3
1/2
2/3
1/2
2/3
1/2
0
u
上
d
下
e
电子
νₑ
电子中微子
ν_μ
缪子中微子
ν_τ
陶子中微子
μ
缪子
τ
陶子
夸克
轻子
规范玻色子
奇
底
s
b
粲
c
胶子
希格斯玻色子
光子
Z玻色子
W玻色子
G
H
Z
W
γ
t
顶
自旋
0
0
0
1
0
0
1
91.2 GeV/c²
80.4 GeV/c²
0
1
±1
1
图12.1 标准模型粒子表。前三列展示了三代费米子,最后一列展示了玻色子。
The Physical World. Nicholas Manton and Nicholas Mee, Oxford University Press (2017).
©Nicholas Manton and Nicholas Mee. DOI 10.1093/acprof:oso/9780198795933.001.0001
394
粒子物理
12.1.1
基本粒子
所有已知粒子和相互作用都可约化为少数几种基本粒子的相互作用,如图 12.1 所示。每一种粒子都由其静止质量、自旋以及决定其相互作用的各类荷完全定义。粒子还可能具有许多其他性质,比如磁矩,以及它们衰变为其他类型粒子的速率。这些都可以从理论上计算。量子力学将同种粒子视为全同粒子。它们自然地分为两类:玻色子(bosons),具有整数自旋,遵循玻色-爱因斯坦统计;费米子(fermions),具有半整数自旋,遵循费米-狄拉克统计和泡利不相容原理。基本费米子只有 12 种,自旋均为 1/2,连同它们的反粒子,列于表 12.1 中。它们分为两类:夸克(quarks)和轻子(leptons),取决于它们是否受强力影响。夸克通过强力、弱力和电磁力发生相互作用。带电轻子,即电子、μ子和τ子,通过电磁力和弱力相互作用,但不参与强力。不带电的轻子是中微子。它们只通过弱力相互作用。
这 12 种费米子构成了三代,每代包含四个粒子。第一代由上夸克、下夸克、电子和电子中微子组成。普通物质由前三种粒子构成。质子由两个上夸克和一个下夸克结合而成。中子由两个下夸克和一个上夸克组成。第二代的两个夸克称为粲夸克和奇异夸克,两个轻子是μ子和μ子中微子。第三代由顶夸克、底夸克、τ子和τ子中微子组成。第二代和第三代中的每一个粒子都带有与第一代对应粒子相同的荷,似乎只是它们的更重复制品。
大多数粒子是不稳定的,并通过由某种基本相互作用控制的过程衰变。较重的粒子衰变为两个或更多较轻的粒子,释放出的能量以衰变产物的动能形式带走。如果这类粒子的平均寿命为 T(即半衰期 (log 2)T),在时间 t = 0 时有 N(0) 个粒子,那么随后时刻的粒子数为
N(t) = N(0) exp(−ℜt)
(12.1)
其中衰变率为 ℜ = 1/T。通常,在对撞机实验中测量的是衰变宽度
Γ = ¯hℜ = ¯h/T
(12.2)
(以能量为单位)。短寿命粒子的静止质量(或能量)因量子力学不确定性关系而无法精确定义。Γ 是静止质量分布的宽度,例如在图 12.26 中所示。若粒子有多种衰变方式,则有
Γ_total = Σ_i Γ_i
且
Br_i = Γ_i / Γ_total,
(12.3)
其中 Γ_i 是衰变模式 i 的部分衰变宽度,Br_i 是该模式的分支比。
量子场论
395
代
轻子
q
质量 (GeV)
夸克
q
质量 (GeV)
I
电子 (e⁻)
−1
0.0005
上夸克 (u)
2/3
0.002
I
中微子 (νₑ)
0
< 10⁻⁹
下夸克 (d)
−1/3
0.005
II
μ子 (µ⁻)
−1
0.106
粲夸克 (c)
2/3
1.3
II
中微子 (ν_µ)
0
< 10⁻⁹
奇异夸克 (s)
−1/3
0.1
III
τ子 (τ⁻)
−1
1.78
顶夸克 (t)
2/3
173
III
中微子 (ν_τ)
0
< 10⁻⁹
底夸克 (b)
−1/3
4.2
表12.1 标准模型(Standard Model)中的基本自旋1/2费米子。q是以质子电荷为单位的电荷数。(每个粒子都有一个质量相同、电荷相反的反粒子。)
玻色子
q
质量 (GeV)
自旋
作用
胶子 (G)
0
0
1
QCD交换玻色子
光子 (γ)
0
0
1
QED交换玻色子
W±玻色子
±1
80.4
1
弱交换玻色子
Z玻色子
0
91.2
1
弱交换玻色子
希格斯玻色子 (H)
0
125
0
希格斯机制
表12.2 标准模型中的基本玻色子。
在粒子衰变中观察到的寿命通常为:强力,10⁻²⁴−10⁻²⁰ s;电磁力,10⁻¹⁹−10⁻¹⁶ s;弱力,10⁻¹²−10⁻⁶ s。第二代和第三代的夸克以及带电轻子是不稳定的,主要通过弱力迅速衰变。
有两个守恒定律似乎在所有粒子碰撞和衰变中普遍成立。它们是轻子数守恒,其中每个轻子贡献+1,每个反轻子贡献−1;以及重子数守恒,其中每个夸克贡献1/3,每个反夸克贡献−1/3。出现1/3这个因子,是因为重子(如质子和中子)由三个夸克组成,而反重子由三个反夸克组成。
基本玻色子见表12.2。表中列出的这少数几种自旋为1的玻色子的交换,产生了强力、电磁力和弱力,我们稍后将讨论。希格斯玻色子是唯一已知的自旋为0或标量的基本粒子。它在标准模型中扮演着独特的角色,通过赋予W和Z玻色子以及基本费米子质量(但不赋予光子质量)来打破电弱力的对称性。基本粒子(无论是费米子还是玻色子)的质量差异巨大。
标准模型中所有粒子和力的行为,只能由同时结合了量子力学和相对论的理论来解释。实现这种结合的正确语言是量子场论(quantum field theory),我们现在转向它。
12.2 量子场论
爱因斯坦(Einstein)最先引用量子力学来解释光电效应,将电磁波视为由光子组成,光子是无质量、以光速运动的粒子。然而,标准的量子力学显然是一个非相对论理论。薛定谔方程包含对时间的一阶导数,却包含对空间的二阶导数。此外,能量与动量的关系对于一个
396
粒子物理
一个质量为m、不受势场作用的量子力学粒子的能量为E = p²/2m,而非相对论关系E² = p² + m²。为了描述光子及其他以接近光速运动的粒子,需要找到一种与狭义相对论相容的量子力学形式。
最早的尝试是寻找薛定谔(Schrödinger)方程的相对论性不变等价物,并期望其解就是相对论粒子的波函数。起初有两个方程看起来颇有希望。一个是克莱因-戈尔登(Klein–Gordon)方程,我们在第3.2节中提到过。在该方程中,单个时间导数被移除,而负拉普拉斯算子−∇²被波算子∂²/∂t² − ∇²取代。第二个更激进的选项是狄拉克(Dirac)方程。狄拉克认识到在量子力学波动方程中保留单个时间导数的重要性,这样波函数向未来的演化仅取决于初始时刻的波函数本身,而不依赖于它的一阶时间导数。这与波函数坍缩的假设一致,该假设意味着波函数由测量结果决定,其后续演化则由波动方程确定。狄拉克方程将单个时间导数与单个空间导数结合在一起。我们将在第12.3节中描述实现这一点的创新方式。
然而,无论是克莱因-戈尔登方程还是狄拉克方程,都不能被视为薛定谔方程真正的相对论性单粒子类比。以这种方式使用克莱因-戈尔登方程的缺陷在于,无法定义合适的粒子位置概率密度。狄拉克方程的障碍是,除了通常的正能量态外,其解还包括具有任意大负能量的粒子态。
这些问题的根本原因在于,粒子在相对论速度下的相互作用可能涉及足够的能量来产生新粒子。在标准量子力学中,可以为多个相互作用的粒子定义波函数,正如我们在第8.7节所做的那样,但粒子数不随时间改变。然而,当粒子以接近光速运动时,其总能量可能是其静止质量的数倍。在高能粒子碰撞中,能量很容易转化为新的粒子,因此在相对论物理学中,粒子数经常发生变化。这意味着相对论量子力学必然是一个多粒子理论,而且粒子数并不固定。
历史上,理解粒子数可变的多粒子量子力学的进展颇为曲折,但最终的结果是量子场论。克莱因-戈尔登方程和狄拉克方程在这里重新出现,但它们是作为相对论性场方程,其解释更接近经典麦克斯韦(Maxwell)方程组。我们对这一主题的讨论将主要是描述性的,因为量子场论中的计算涉及大量技术细节和复杂的数学工具。
在经典物理学中,物质粒子与场之间有着清晰的区别。粒子是点状的或至少是高度定域的,而场则贯穿时空;场也负责粒子之间的力。量子场论在很大程度上消解了这一区别。例如,存在一个与电子相关的电子场,正如存在一个与光子相关的电磁场一样。然而,仍有一些区别,因为物质主要由费米子粒子组成,而半整数自旋的费米子(如电子)与整数自旋的玻色子(如光子)对应着不同类型的量子化场。
量子场论
397
量子场论的一个强大特征是,它能够解释粒子相互作用的所有方式(引力相互作用除外)。因此,通常用吸引或排斥力来描述的粒子束缚态和粒子散射理论,与粒子产生和衰变的理论被统一起来。这就是为什么我们把中子衰变或Z玻色子产生等现象归因于弱力的原因。
12.2.1 电磁场的量子化
目前人们相信,每种基本粒子都有一个对应的场,而这些场是时空结构的一部分。一个场在空间的每一点都有一个动力学自由度,因此总体来说,一个场拥有无限多个自由度。不同点的场值相互耦合,结果在最简单的情况下,场方程的基本动力学解是波模,具有确定的波矢k和频率ω。场方程用k来决定ω,但由于k可以是任何三维矢量,因此仍然存在无限多个解。在经典理论中,每个波模的振幅A(k)都独立地振荡。
在量子场论中,这些振幅中的每一个都被当作一个量子谐振子来处理,并且对于每一个k都有一个谐振子。(这里进行类比的是谐振子的变量x和波模的变量A(k)。x通常是一个空间位置,但在这里并不重要。)粒子就是这些量子化波模的激发态。它们不是在空间上定域的,但它们具有确定的能量和动量,这些能量和动量与ω和k相关。
自旋为0的粒子是遵循克莱因-戈登方程(Klein–Gordon equation)或其变体的场的激发态。自旋为1/2的粒子是遵循狄拉克方程(Dirac equation)的场的激发态。我们将在适当的时候描述这些粒子,但首先我们将考虑自旋为1的光子。它们是更为人们熟知的电磁场的量子化激发。我们已经在第3章中考察了电磁场的经典理论,而在第10.10节关于黑体辐射的讨论中,光子也扮演了重要角色。
在构建电磁学的量子场论时,我们从服从无源相对论性麦克斯韦方程组(Maxwell equations)的经典电磁场开始。这个场具有无限多个波模,对于每个非零波矢k,有两个独立的偏振方向。(波矢为零的模是非物理的,因为它可以通过规范变换去除。)每个波模都有一个振荡幅度,由4维矢势A的强度,或者等效地由相互关联的电场和磁场强度来描述。麦克斯韦方程组意味着,波矢为k的波模的频率为ω = |k|。将电磁场量子化意味着将所有这些波模量子化。更准确地说,这意味着为一组无限维的谐振子构造一个量子哈密顿算符。这是三维谐振子的一个无限延伸,例如,在11.3.5节关于原子核的尼尔森模型(Nilsson model)中出现过。隐式地,所有谐振子都有一个薛定谔方程(Schrödinger equation),其组合解被称为场的波泛函。
对于具有波矢k和频率ω以及特定偏振选择的模,谐振子的能级为E_n = (n + 1/2)ħω,其中n = 0, 1, 2, …。基态被解释为没有光子的状态。第一激发态的能量比基态高ħω,并被解释为一个具有波矢k和频率ω = |k|的单光子,这与爱因斯坦(Einstein)的假设一致,即频率为ω的电磁波由能量为ħω的光子组成。第n激发态是n个光子的状态,每个光子都…
398
粒子物理
波矢k和能量¯hω,并且这个n光子态是唯一的,因此光子的排列交换没有影响。此外,对n没有限制,因此该理论正确地将光子描述为玻色子。量子场论的定态最好用占有数——即具有各种波矢k的光子数——来描述。一般的态是这些态的叠加。
如果所有模式都处于其基态,那么整个电磁场就处于基态。这个态被称为真空(vacuum),完全没有光子。频率为ω的谐振子的基态能量为1/2¯hω,因此所有波模式的基态能量之和(其数量为无穷大)似乎是一个无穷大的总能量。然而,这种能量在物理上是不可探测的,所以可以简单地将其舍弃,将基态能量定义为零。¹ 这可以通过将每个谐振子的量子哈密顿量移动一个常数来实现,使得其基态能量为零,而不是1/2¯hω。
经典电磁场既携带能量也携带动量。用波模式的振幅及其波矢k可以表达动量,由此我们可以在量子场论中推导出动量算符。它是每个波模式各自贡献的项之和。对于波矢为k的波模式,其动量算符与哈密顿量类似,只是将ω替换为k。因此,该模式的一个1光子态同时具有动量p = ¯hk和能量E = ¯hω。由于ω = |k|,这意味着光子满足相对论性的能量-动量关系E = |p|。所以光子是无质量的。
光子是自旋为1的粒子(矢量粒子)。一个有质量的自旋1粒子会有三个独立的极化状态,因为在其静止参考系中,所有三个正交的空间方向都可用。但由于光子是无质量的且不能静止(即不能具有零动量),因此它只有两个独立的极化状态,并且沿k方向没有极化状态,这是自洽的。这是经典矢量势中平行于k的纵向部分可以通过规范变换(如3.7节所述)消除的直接结果。然而,光子仍然是一个矢量粒子,因为在围绕k轴的空间转动下,其极化状态会像矢量一样旋转。
电磁场的量子化导出了一个完整的光子理论,将光子描述为无质量、自旋为1的粒子。这一方法的成功表明,其他粒子或许可以通过对满足适当场方程的不同类型场进行量子化来理解。
12.2.2 量子化的标量克莱因-戈登场
量子场论最方便的出发点通常是场的经典拉格朗日量密度。由此,利用最小作用量原理(principle of least action),可以推导出经典的动力学场方程,如2.3节所述。
让我们考虑一个实标量场φ(x, t)的如下拉格朗日量密度:
L = 1/2 ∂φ · ∂φ − 1/2 m₀²φ² = 1/2 (∂φ/∂t)² − 1/2 ∇φ · ∇φ − 1/2 m₀²φ², (12.4)
其中m₀是一个正的质量参数。总作用量是L在时空上的积分,
S = ∫ L d⁴x , (12.5)
¹ 这个步骤在我们将要考虑的电磁场或其他场的量子理论中不会带来任何问题,但这对于引力的量子理论来说会是一个问题,因为所有的能量都是引力场的源。
量子场论
399
由该作用量导出的场方程是克莱因-戈登(Klein–Gordon)方程
∂²φ
∂t² − ∇²φ + m₀²φ = 0 。 (12.6)
这就是我们的方程(3.18),但由于现在它满足相对论性要求,我们已取 c = 1。(同时将 µ 替换为 m₀。)
克莱因-戈登方程比麦克斯韦(Maxwell)方程组更简单,因为 φ 只有一个大小量,没有矢量极化,也无需考虑规范变换。它对 φ 是线性的,因此其独立解同样是波模,具有波矢 k 和频率 ω。将波形式
φ(x, t) = A e^{i(k·x − ωt)} (12.7)
代入方程(12.6),我们得到关系式
ω² = k² + m₀² 。 (12.8)
这个特解是复数的,但与其他涉及振荡的问题一样,可以利用复数解的线性组合得到实数解。此时,场以正频率 ω = √(k² + m₀²) 作简谐振荡。
量子化的处理方法是将每个波模视为一个量子谐振子,就像电磁场情形那样。对每个模,将谐振子振幅 A 量子化。频率为 ω 的模式的基态能量为 ½¯hω,并存在能量间隔为 ¯hω 的激发态。在真空中,所有模式都处于基态。无穷多个模式贡献的总基态能量同样被抛弃,并将真空定义为零能量。波矢为 k 的模的第一激发态被解释为一个单粒子态,类似于单个光子。该粒子的能量为 E = ¯hω = ¯h√(k² + m₀²),并且通过寻找代表场总动量的量子算符可以再次证明,该粒子具有动量 p = ¯hk。将式(12.8)乘以 ¯h² 表明,粒子的能量和动量满足关系
E² = p² + (¯hm₀)² , (12.9)
其中 E 为正。这正是质量为 m = ¯hm₀ 的相对论性粒子的能量-动量关系。因此,量子化后的实克莱因-戈登场理论描述了一种质量为 m 的单一类型粒子。若某个谐振子模式处于第 n 激发态,则该态代表 n 个全同粒子,每个粒子具有相同的动量和能量。与光子情形相同,我们得到的是一个玻色子理论。克莱因-戈登粒子的自旋为 0,因为单粒子态完全由其动量决定,不存在极化矢量。这类粒子被称为标量玻色子。
注意,粒子质量 m = ¯hm₀ 是一种涉及普朗克(Planck)常数的量子现象。这相当令人惊讶。m₀ 是场的质量参数,有时被不严谨地称为场的质量,但它本身的量纲并不匹配粒子质量。波模在空间上并非定域的,因此作为克莱因-戈登场激发的粒子并不具有明确的位置。动量与波矢之间是德布罗意(de Broglie)关系 p = ¯hk,因此在非相对论极限下,克莱因-戈登场与单个量子
400
粒子物理
力学粒子。克莱因-戈登场方程的解在波矢远小于 m0 时,表现得就像一个非相对论粒子的量子态。这是因为在小动量情况下,能量–动量关系 (12.9) 变为 E ≃ m + p²/2m。常数项 m 仅在场中产生一个普适的、依赖于时间的指数因子 e⁻ⁱᵐ⁰ᵗ。提取出这一因子后,剩下的就是一个满足质量为 m 的自由粒子薛定谔方程的场。通过组合不同动量的模式,我们可以像在非相对论量子力学中一样,构造一个空间局域的单粒子态。然而,动量必须很小,这限制了空间局域化的程度。任何过度局域化一个粒子的尝试,实际上都会产生一个多粒子态,因此,不存在与相对论一致的、精确截断到单粒子量子理论的情况。
12.3 狄拉克场
狄拉克场 ψ 满足一个在时间和空间导数上都是一阶的相对论性方程。这样的方程只有当使用四个 4 × 4 矩阵 γ(现在称为狄拉克矩阵或伽马矩阵)来构造时才有可能,因此 ψ 必须具有排列成一列的四个复分量。在第 8.5 节中,我们引入了自旋为 ½ 的电子的波函数是一个二分量旋量的概念。狄拉克场 ψ 是这一概念的修正,被称为四分量狄拉克旋量²。量子化后,它描述了两个相关粒子的态,这两个粒子的自旋都是 ½。我们将在下文中更仔细地解释这一点,但提前预告一下:如果其中一个粒子是电子,那么另一个粒子就是它的反粒子,即正电子,这是反物质的一个例子。狄拉克场的量子化给出了一个多粒子理论,但和克莱因-戈登情况一样,单粒子态是基本的状态。
12.3.1 狄拉克方程
使用我们在第 4 章和第 6 章中用过的简写 4-矢量符号,狄拉克方程是
(iγ · ∂ − m₀)ψ = 0 , (12.10)
其中 m₀ 是一个质量参数。展开 4-矢量的点积 γ · ∂,方程变为 iγᵘ ∂ψ/∂xᵘ − m₀ψ = 0,或者完整写出:
iγ⁰ ∂ψ/∂x⁰ + iγ¹ ∂ψ/∂x¹ + iγ² ∂ψ/∂x² + iγ³ ∂ψ/∂x³ − m₀ψ = 0 。 (12.11)
我们看到,它以对称的方式涉及时间 (x⁰ = t) 和空间 (x¹, x², x³) 的单阶导数,且无疑看起来是相对论性的。乍一看,γ 似乎是某个恒定的、普适的 4-矢量,但这不可能正确,因为选择一个特定的 4-矢量会破坏相对论性理论所必需的洛伦兹变换对称性。相对运动的不同的观测者,将需要 γ 是不同的 4-矢量。
狄拉克(Dirac)找到了这个问题的解决办法。他没有让 γ 的分量使用普通数,而是用四个恒定的方矩阵 γ = (γ⁰, γ¹, γ², γ³) 构造了这个 4-矢量,这些矩阵集合起来具有所期望的洛伦兹变换性质。这四个伽马矩阵需要满足某些代数关系,以确保与狭义相对论相容。其结果是,ψ 的每个分量都满足相对论性的克莱因-戈登方程。波动模式解随之满足频率与波矢之间的相对论关系,ω² = k² + m₀²。
² 它不是一个 4-矢量,因为旋量和矢量在洛伦兹变换下的变换方式不同。
狄拉克场
为了找到这些代数关系,我们假设 ψ 满足狄拉克方程 (12.10),然后从左侧作用算符 iγ·∂ + m₀,得到
(iγ·∂ + m₀)(iγ·∂ − m₀)ψ = 0 (12.12)
或者更具体地写为
$$
\left( i\gamma^\nu \frac{\partial}{\partial x^\nu} + m_0 \right) \left( i\gamma^\mu \frac{\partial}{\partial x^\mu} - m_0 \right) \psi = 0 .
$$ (12.13)
展开此方程给出
$$
\gamma^\nu \gamma^\mu \frac{\partial^2 \psi}{\partial x^\nu \partial x^\mu} + m_0^2 \psi = 0 .
$$ (12.14)
由于双重偏导数在交换 μ 和 ν 下是对称的,γ^νγ^μ 中唯一有贡献的部分是对称组合 ½(γ^μγ^ν + γ^νγ^μ)。对于 ψ 的每个分量,方程 (12.14) 约化为克莱因-戈登方程
$$
\frac{\partial^2 \psi}{\partial t^2} - \nabla^2 \psi + m_0^2 \psi = 0 ,
$$ (12.15)
只要满足
$$
\gamma^0 \gamma^0 = 1_n , \quad \gamma^1 \gamma^1 = \gamma^2 \gamma^2 = \gamma^3 \gamma^3 = -1_n ,
$$ (12.16)
其中 1_n 是某个 n × n 单位矩阵,并且当 μ 和 ν 不同时
$$
\gamma^\mu \gamma^\nu + \gamma^\nu \gamma^\mu = 0
$$ (12.17)
恒成立。将代数关系 (12.16) 和 (12.17) 写为更紧凑的形式,即
$$
\gamma^\mu \gamma^\nu + \gamma^\nu \gamma^\mu = 2\eta^{\mu\nu} 1_n ,
$$ (12.18)
其中 η^{μν} = diag(1, −1, −1, −1) 是(逆)闵可夫斯基度规张量,由方程 (6.11) 所定义。
关系 (12.18) 被称作狄拉克代数,或者等效地称为伽马矩阵反对易关系(式中“反”指的是左侧两项之间的加号)。这些关系确实可以满足,并且基本解是用 4 × 4 矩阵来表示的。不存在更小的可行矩阵。例如,1 × 1 矩阵仅仅是数,尽管方程 (12.16) 可以用 ±1 和 ±i 来求解,但方程 (12.17) 却无法同时满足。一种给出解的方式是将 4 × 4 矩阵写成 2 × 2 分块形式,这些分块要么是零矩阵、单位矩阵 1₂,要么是第 8.5 节所定义的泡利矩阵 σ₁, σ₂, σ₃。于是伽马矩阵为
$$
\gamma^0 = \begin{pmatrix} 1_2 & 0 \ 0 & -1_2 \end{pmatrix}, \quad \gamma^i = \begin{pmatrix} 0 & \sigma_i \ -\sigma_i & 0 \end{pmatrix}, \quad i = 1, 2, 3,
$$ (12.19)
这样写是可行的,因为 σ_i σ_j + σ_j σ_i = 2δ_{ij} 1₂。虽然这个解不唯一,但使用 4 × 4 矩阵的变体解仅仅是在狄拉克旋量空间中的基变换下有所不同,而这并不产生物理上的差异。存在更大矩阵的解,但它们只是由上面 4 × 4 矩阵解的若干份拷贝构造而成,对应于拥有
402 粒子物理
多个表示多种狄拉克场的旋量。因此我们给出的解本质上是唯一的。
在任意时空维度中都存在狄拉克代数 (Dirac algebra) 的一个版本,且每个时空坐标既可以是类时的,也可以是类空的。特别地,在任意维数的欧几里得空间 (Euclidean space) 中同样存在一个版本。每当维数增加二,狄拉克矩阵 (Dirac matrices) 的尺寸就加倍。因此在十维时空中,矩阵为32 × 32,但它们仍然可以由12和泡利矩阵 (Pauli matrices) 构建而成。
现在让我们回到四维时空,寻找狄拉克方程 (Dirac equation) 的解。由于伽马矩阵 (gamma matrices) 以2 × 2分块形式写出,将ψ分解为一对二分量旋量会很方便。狄拉克方程不显含空间和时间的函数,因此很自然地可以寻求如下形式的波模解
ψ(x, t) = ei(k·x−ωt)
χ
ξ
,
(12.20)
其中χ和ξ为常二分量旋量。将此式代入狄拉克方程(12.10),我们得到耦合方程组
(ω −m0)χ −k · σ ξ
0
k · σ χ −(ω + m0)ξ
0 ,
(12.21)
其中
k · σ = k1σ1 + k2σ2 + k3σ3 =
k3
k1 −ik2
k1 + ik2
−k3
(12.22)
为2×2矩阵。若取χ为任意常二分量旋量,则第二个方程将ξ确定为
ξ = k · σ χ
ω + m0
.
(12.23)
代入第一个方程并利用恒等式 (k · σ)2 = k2 12,我们得到
(ω −m0)χ −k2
χ
ω + m0
= 0.
(12.24)
非平凡解通常要求χ非零,这就需要有 ω2 −m2
0 −k2 = 0,或等价地
ω2 = k2 + m2
0 .
(12.25)
这一条件确保了狄拉克方程得以满足,其结果是狄拉克旋量 (Dirac spinor) ψ的每个分量都满足克莱因–戈登方程 (Klein–Gordon equation)。
这里没有理由固定ω的符号。对于给定的k,频率ω是 k2 + m2
0 的平方根,可正可负。若m0取定为正,则当ω为正时有 ω ≥ m0,当ω为负时有 ω ≤ −m0。(若k为零且ω = −m0,则χ为零而ξ为任意常二分量旋量。)狄拉克方程是线性的,因此各种波模解相互独立且可叠加。
由于ψ的每个分量都遵从克莱因–戈登方程,现在狄拉克方程在相对论上自洽是显而易见的。然而旋量场ψ的四个分量并不独立,寻找ψ的恰当洛伦兹变换 (Lorentz transformation) 需要
狄拉克场
403
更多的代数工作。事实上,我们可以验证狄拉克方程允许洛伦兹变换。一个推进(boost)会混合上、下二分量旋量 χ 和 ξ,但空间转动的作用更简单。每个二分量旋量的转动方式与非相对论二分量旋量的转动方式相同。这正是所需要的。这意味着 χ 的变换如同一个自旋 1/2 粒子的自旋态,自旋可以沿任意方向排列。在 χ 固定的情况下,ξ 由公式 (12.23) 确定,并以相同的方式变换。
12.3.2 狄拉克场的量子化——粒子和反粒子
我们可以尝试像处理其他类型的场那样,将狄拉克场量子化,把每个波模当作谐振子处理。在朴素真空(na¨ıve vacuum)中,所有模都处于未激发态。然而,这一步骤存在一个严重问题。负频率 ω 的解对应于负能量的粒子态。负频率模的每一次激发都会降低总能量,这将导致无法遏制的能量坍缩。狄拉克场与另一个场之间的相互作用会激发正、负频率模,从而产生无限多的负能量粒子。简而言之,该理论将是不稳定的。
现在,狄拉克场是为描述电子而发明的,电子是费米子。狄拉克(Dirac)认识到负能态问题与泡利不相容原理密切相关,并提出了以下每个模的显式费米子量子化方案。每个波模只有两种可能的量子态。它要么未激发,此时没有粒子存在;要么激发,此时恰好存在一个粒子。换言之,波模要么未被占据,要么被占据一次。没有两个粒子可以处于相同的动量、能量和自旋态。在真空态中,所有正频率模都未被占据。一个正频率 ω 模的占据态具有比空态高 ¯hω 的能量,并被解释为一个正能量粒子。若波矢为 k,则粒子具有动量 ¯hk 和能量 q ¯h2k2 + ¯h2m2 0,因此与克莱因-戈登(Klein–Gordon)理论中一样,粒子质量为 m = ¯hm0。
↑
↑
2m
图 12.2 从左到右:朴素真空;朴素单粒子态;填满的狄拉克海,即真正的真空态;代表反粒子的单空穴狄拉克态;具有一个粒子和一个反粒子的态。
那么负频率模呢?狄拉克假设在真正的真空态中,所有这些模都被占据了。这个狄拉克真空态也被称为填满的狄拉克海。如图 12.2 中间所示。狄拉克真空赋予理论一种显著的对称性,这种对称性不同于朴素真空的对称性。它是
404
粒子物理学
一种交换正负能量、同时交换占据态与未占据态的对称性。
现在考虑一个负频率波模从占据态变为未占据态时会发生什么。由于ω为负,能量以负值减少;换句话说,能量增加了。未占据态的能量比占据态高出¯h|ω|。我们可以将这份正能量视为一种新型粒子的能量,即反粒子(antiparticle)。(反粒子最初被称为空穴(hole),因为它是狄拉克海(Dirac sea)中的一个空穴。)
该理论描述了粒子和反粒子,两者都可以存在于具有动量p = ¯hk且自旋向上或向下的态中。动量为p = ¯hk的粒子是波矢为k的波模的激发。动量为p = ¯hk的反粒子是波矢为−k的波模的去激发。粒子和反粒子具有相同的正质量m = ¯hm0,并且都具有正能量
p
p2 + m2。那么是什么区分了粒子和反粒子呢?通常,它们会参与不同的相互作用。在许多情况下,我们可以通过它们的电荷来区分它们³。当与电磁场耦合时,狄拉克场具有确定的电荷,这对所有波模都是相同的。当一个未占据态变为占据态时,电荷会改变一个固定的量q。因此粒子带有电荷q。但反粒子是在一个占据态变为未占据态时产生的。这使电荷改变−q,因此反粒子带有电荷−q。
当狄拉克场与量子化的电磁场耦合时,一个光子有可能将狄拉克海中一个占据的负能态(一个负能粒子)提升到一个正能态。这同时产生狄拉克海中的一个空穴和一个正能粒子。这被解释为粒子-反粒子对的产生,如图12.3所示。电荷是守恒的,因为光子和粒子-反粒子对都具有零净电荷。负能态和正能态之间的能隙是2m,因此该过程只对至少具有此能量的光子才可能发生。
如果q是电子的电荷−e,且m是电子质量me,那么狄拉克理论描述了相对论性电子(e⁻),并预言了带有电荷e的电子的反粒子的存在。这些反粒子现在被称为正电子(e⁺),因为它们带正电。这是对反物质(antimatter)的首次预言。1932年,在狄拉克提出该理论后不久,正电子被正在用云室研究宇宙射线的卡尔·安德森(Carl Anderson)发现。图12.4展示了首张发表的正电子径迹照片。正如预言的那样,正电子具有与电子相同的质量,但电荷相反。它们的发现是该理论的伟大胜利。
从历史上看,填满的狄拉克海(Dirac sea)这一思想非常重要,因为它导致了反粒子的发现,但它也引发了许多关于真空态的问题。这个态必须具有零净能量、零净动量和零净电荷,但它却被假定为由无限多的负能粒子海填满,潜在地具有无限的负总能量和负总电荷。尽管反粒子最初以我们描述的方式被解释为狄拉克海中的空穴,但今天的粒子物理学家认为填满的狄拉克海是一个不必要的拐杖。如今通常直接讨论粒子和反粒子作为狄拉克场的独立激发。这样就避免了需要论证掉一个无限的负能粒子海。
³ 对于不带电的狄拉克粒子,例如中微子,我们可以定义一种新的荷,称为ψ粒子数,并定义ψ粒子带有荷+1,ψ反粒子带有荷−1。
狄拉克场
405
能量
光子
m
–m
狄拉克海
反粒子(空穴)
粒子
图12.3 从狄拉克海中产生粒子对。
图12.4 第一张正电子照片。其路径在探测器中的磁场作用下发生弯曲。正电子从右上角入射,在穿过位于探测器中心的铅板时逐渐减速。
量子化的狄拉克场不仅适用于电子和正电子;它适用于所有自旋为1/2的粒子。具体而言,对于每一个其他的大质量轻子——μ子和τ子及其反粒子,以及每一类夸克和反夸克,都存在一个单独的狄拉克场。这些粒子通过其质量、电荷以及它们的场与其他场的相互作用方式而彼此区分。
中微子更为复杂,目前仍未完全理解。它们也具有自旋1/2,但在量子场论中最适合描述它们的方式尚待确定。直到20世纪90年代,中微子通常用一种质量参数为零的狄拉克场的变体来描述。我们现在知道,中微子具有极小但不为零的静止质量。非常引人注目的是,它们可以在真空中从一种类型转化为另一种类型,甚至可能
406
粒子物理学
中微子与其反粒子完全相同。我们将在第12.9节描述对其性质的持续研究。
12.4
作用量与相互作用
到目前为止,我们一直在考虑服从线性场方程的场的量子化,其激发代表无相互作用的自由粒子。一个应用是模拟黑体辐射的光子盒。大量光子可能被困在盒子中,但它们彼此之间几乎没有散射。
相互作用的粒子在高能碰撞中相互散射,它们的动能可能转化为新的粒子。这正是粒子物理学成为令人兴奋的实验学科的原因。粒子碰撞后,如果我们要看到出射粒子的径迹并测量其能量和动量,探测器内的进一步相互作用至关重要。相互作用还导致粒子衰变,其中不稳定的粒子通常会衰变成两个或更多较轻的粒子。
为了描述相互作用粒子,我们必须考虑相互作用场,这需要在场方程中加入非线性项。于是,一种场成为另一种场的源。在经典非线性理论中,一种场的波模振荡可以激发另一种场的波模振荡。在量子场论中,这对应于粒子的产生和衰变。即使只有一种场,非线性项也可以将不同频率和波矢的波模耦合起来。这在量子力学中被解释为粒子散射,即粒子碰撞中能量从一个方向的运动转移到另一个方向的运动。
场拉格朗日量提供了编码场与粒子相互作用的最简洁方式。二次型拉格朗日量通过最小作用量原理导出线性场方程,其量子化场论没有粒子相互作用。包含场的高次幂的拉格朗日量导致非线性场方程和粒子相互作用。除少数特殊情况外,精确求解相互作用的量子场论是不可能的。通常的策略是假设任何非二次项的系数都很小,这样相互作用对自由粒子理论产生小的修正。这些系数称为耦合常数。然后,该理论预言的可测量量的振幅可以计算为耦合常数的级数展开,这一过程称为微扰论。正是这种方法导致了费曼图(Feynman diagrams)。
12.4.1
量子电动力学
粒子相互作用的微扰方法是首先由物理学家在模拟光子与带电粒子的相互作用时发展起来的。这些努力的巅峰是有史以来最成功的理论之一——量子电动力学(quantum electrodynamics,简称QED)。在这个理论中,电磁力源于带电粒子(如质子和电子)之间光子的交换,或者更基本地说,源于夸克和带电轻子之间光子的交换。QED的预言已经在实验室中得到检验,并与实验测量结果以惊人的精度相符,在某些情况下接近万亿分之一(1012)。
电磁学的一个非常重要的方面是存在通过进行规范变换(gauge transformation)重新定义势的自由,正如第3章所讨论的。规范变换保持电磁场 (F) 不变,因此对任何物理可测量量没有影响。它只是我们描述中冗余性的反映。