15_Frontiers_of_Physics

15 物理学的前沿
尽管现代物理学取得了巨大成功,仍有一些问题有待解答。在本章中,我们将探讨这些开放性问题。它们分为几类。有宇宙中尚未解释的特征,如物质–反物质不对称性、暗物质的存在,以及更加神秘的暗能量。有与理论不完整性相关的问题,如标准模型未了结的线索,以及需要一种量子引力理论,能将其整合到所有力的理论中。还有需要解决的深刻哲学问题——粒子究竟是什么,空间和时间的基本性质又是什么?首先,我们将探讨如何诠释量子力学这一仍未解决的问题,以及量子力学是否代表了实在的终极理论,还是可能存在更深层次的理论。

15.1 量子力学的诠释
正如我们所见,量子力学提供了一套极其精确的方法,用于预测实验的概率性结果。没有任何实验或观察对量子力学有效这一事实提出过质疑。然而,当我们探究其形而上学含义时,量子力学暗示,宇宙与我们经典直觉可能认为的相比,非常不同,而且奇妙得多。
量子力学的标准诠释是1927年在哥本哈根,玻尔(Bohr)、海森堡(Heisenberg)和泡利(Pauli)的一次会议上敲定的。它包括不确定性原理、波粒二象性、波函数的概率性诠释,以及将本征值认定为可观测量的测量值。这套思想被称为哥本哈根诠释(Copenhagen interpretation)。标准量子力学的最后一个要素——波函数坍缩(wavefunction collapse)——由约翰·冯·诺依曼(John von Neumann)在其1932年出版的专著《量子力学的数学基础》(Mathematical Foundations of Quantum Mechanics)中添加,通常被认为是哥本哈根诠释不可分割的一部分。冯·诺依曼提出,量子力学由两个独立的过程组成。首先,在没有任何测量影响的情况下,量子系统按照含时薛定谔方程(time-dependent Schrödinger equation)进行确定性演化,在这一演化过程中,状态通常由任何给定可观测量的本征函数的叠加组成。其次,当该可观测量被测量时,以及测量后立即,系统的波函数就是对应于测量本征值的特定本征函数,正是测量行为将系统投影到这个本征函数上。这种投影被称为波函数坍缩。我们在之前所有关于量子力学的讨论中都遵循了哥本哈根诠释,例如在第12.9节中考虑中微子振荡时。
The Physical World. Nicholas Manton and Nicholas Mee, Oxford University Press (2017).
c⃝Nicholas Manton and Nicholas Mee. DOI 10.1093/acprof:oso/9780198795933.001.0001

量子力学的诠释
515
量子理论的某些先驱,尤其是爱因斯坦(Einstein)、薛定谔(Schrödinger)和德布罗意(de Broglie),无法接受哥本哈根诠释(Copenhagen interpretation),并投入了大量精力来寻找反驳论据和替代方案。我们可以用一个简单的例子来说明这些哲学分歧。一个放射性原子核,例如铀-238,可能存在数十亿年,然后突然衰变并发射出一个α粒子。但衰变时刻无法预测。我们只能给出原子核在一定时间内衰变的概率。同样的行为也发生在基本粒子中,比如μ子,其衰变半衰期约为一微秒。在爱因斯坦看来,我们无法确定衰变时刻,仅仅是由于我们对所有相关变量的无知。他深信,在这类过程的量子描述背后,必定存在着某种准经典的隐变量(hidden variables),它们精确决定了粒子何时衰变。铀原子核是一个复杂的对象,我们或许可以想象其组成部分来回运动,直到达成一个相当不可能的构型,此时衰变发生。然而,被认为是无内部结构的基本粒子的μ子,也表现出相同的行为。根据爱因斯坦的观点,即使在这些情形下,也必定存在我们尚未意识到的隐变量,决定着衰变的时刻。如果这是真的,那么它将把量子力学约化为某种类似于经典统计力学的东西——对一个复杂系统”表面上随机”的动力学过程的概率性描述。

量子力学的哥本哈根诠释则以一种截然不同的方式描述粒子的衰变。根据这一观点,我们必须用一个以状态叠加(superposition)方式演化的波函数,来描述包含一个不稳定粒子(例如μ子)的系统。这种叠加既包含描述未衰变μ子的态,也包含描述μ子衰变后产物的态。该系统作为一组潜在可能性的集合而演化,直到进行一次测量,此时波函数坍缩(wavefunction collapses),系统随后便处于μ子已衰变或未衰变的状态(视具体情况而定)。我们只能预测测量各种可能结果的概率。这里不存在隐藏的信息。

由玻尔(Bohr)、冯·诺依曼(von Neumann)等人所倡导的哥本哈根诠释,或许与观测结果一致,但它引发了诸多问题。根据量子力学,μ子是全同粒子,甚至在原则上也无法区分一个μ子和另一个μ子。因此,同样无法区分此刻的μ子和片刻之前的同一个μ子,但在某个不可预测的时刻,该μ子突然改变并衰变了。这是相当奇怪的,因为它似乎是一种没有原因的结果,并暗示我们可能不得不放弃决定论。同样奇特的是,物理学的终极理论竟然依赖于一个该理论本身未用数学描述的过程——波函数坍缩。此外,波函数坍缩被假设为瞬时发生,这至少与相对论的精神相悖。它还要求某种外部干预——测量——这就引出了一个问题:究竟什么才构成一次测量。

15.1.1 薛定谔的猫与维格纳的朋友
爱因斯坦对哥本哈根诠释感到非常不安,因为他觉得它否定了常识性实在的存在。玻尔曾论证说,我们对原子这么小的实体没有直接经验,因此不应预先判断它们可能的行为方式。爱因斯坦与薛定谔之间的一次通信往来,催生了旨在证明玻尔立场荒谬性的最著名尝试——薛定谔的猫思想实验

516
物理学前沿
薛定谔在1935年发表的这个思想实验旨在表明,量子力学的奇异观念不能被局限于微观世界,而是必然蔓延至宏观世界,得出与日常经验相悖的结果。

实验装置如下:一个放射性原子与一个装有猫的封闭钢箱中的仪器相连。该原子的半衰期为一小时,并由盖革计数器监测。如果原子发生放射性衰变,盖革计数器会触发一个开关,释放出毒气,将猫杀死。一小时后,原子有50%的概率已经衰变,50%的概率尚未衰变,但装有猫的箱子是封闭的,因此无法得知原子衰变是否已发生。根据量子力学的哥本哈根诠释,一小时后,原子必须被描述为“已衰变”和“未衰变”的叠加态,而且由于尚未进行任何测量,描述整个系统的唯一方式,就是假设整个装置和猫现在都处于态的叠加之中。在其中一种叠加态中,猫是活的;在另一种态中,猫是死的。这种态的叠加持续存在,直到我们通过打开箱子窥视内部来进行测量。在那一刻,波函数坍缩,展现出要么生要么死的猫。

我们或许可以接受一个原子存在于态的叠加中,因为原子的微观世界我们无法直接触及,但我们在日常生活中从未经历过叠加态,那么我们真的能接受一只猫可能存在于这种状态的可能性吗?我们见过活猫,也见过死猫,但从未见过两者的叠加。况且,如果我们放进去的是一个人而不是猫呢?

尤金·魏格纳(Eugene Wigner)是量子力学正统观点的支持者,甚至可说是其缔造者之一,因为冯·诺依曼在撰写其论文期间,魏格纳正是他的密切合作者。魏格纳构想了一个被称为“魏格纳的朋友悖论”的思想实验,其内容如下:魏格纳事务繁忙,于是他请一位朋友去检查某项实验的结果,这个实验可能涉及箱子里的猫,但更可能是关于大型强子对撞机(LHC)碰撞的记录。¹ 魏格纳的朋友注意到了一个有趣的结果,或许是一个罕见事件,比如前一天记录到的希格斯粒子的产生。她依程序将此结果报告给了魏格纳。问题是:描述希格斯粒子产生的波函数是何时坍缩的?是当LHC的ATLAS探测器记录下该事件时,还是当魏格纳的朋友查看结果时,又或者是当她向魏格纳报告此消息时?

根据哥本哈根诠释,波函数在前一天就坍缩了——当时存在一个确定的希格斯粒子,它与测量设备相互作用并随后衰变。然而,在魏格纳朋友的意识中,波函数的坍缩发生在她查看记录的那一刻。现在,魏格纳的朋友去告诉魏格纳她所看到的情况,只有到这时,魏格纳本人的波函数才坍缩。换言之,在那之前,魏格纳知道前一天的事件中可能存在一个希格斯粒子,但这只是量子叠加态的一部分,而在这个叠加态中,出现希格斯粒子的振幅非常小。魏格纳的波函数既没有在前一天坍缩,也没有在他朋友检查记录时坍缩。那时候(从魏格纳的观点来看),所发生的一切仅仅是在可能的希格斯信号与魏格纳朋友的意识之间建立了一种关联。直到她告诉他发生了什么,魏格纳的波函数才真正坍缩。

¹ 我们关于魏格纳朋友悖论的讨论在时代背景上略有出入。该悖论发表于1961年,远早于LHC的建造。

量子力学的诠释
517
如果我们相信客观外部实在,那么这些选项中只有一个可能是正确的,但究竟是哪一个呢?维格纳(Wigner)认为,像ATLAS这样的探测器,其所有组成部分都是由原子和其他遵循量子力学规则的粒子构成的,因此它们必须按照某种极其复杂的薛定谔方程(Schrödinger equation)以状态的叠加形式演化,仪器内部没有任何东西能够导致波函数坍缩(wavefunction collapse)。维格纳知道,当实验结果被报告给他时,波函数已经坍缩了。他可能会认为坍缩就发生在这一刻。但这意味着只有他能够使波函数坍缩。这实质上等于说维格纳是唯一有感知能力的存在,而他的朋友以及其他所有人都只是自动机器。这种相当灾难性的哲学立场被称为唯我论(solipsism)。维格纳自然否定了这种可能性。他认为,唯一合理的假设是,他的朋友也是一个有感知能力的存在,并且在向维格纳报告之前,她就已经有意识地意识到了实验结果。维格纳的结论是,可观测量的测量只能由像人类这样的有意识的存在来完成,正是意识与量子系统之间的这种相互作用导致了波函数坍缩。

这是否意味着我们人类才是终极测量装置,只有我们——而非猫——才能使波函数坍缩?这看起来像是一个颇具吸引力的提议。它意味着所有那些复杂的实验室测量设备及其内部的物理过程,比如像ATLAS这样对出射粒子做出响应的粒子探测器,以及存储碰撞事件长期记录的计算机,都愉快地遵循着一个复杂的多粒子薛定谔方程,没有任何波函数坍缩发生。坍缩只发生在我们观察的时候。然而,正是这最后一个阶段成为了真正的谜题。人类有什么不同,使得他们置身于物理学的其余部分之外,并遵循不同的法则呢?

维格纳将意识与波函数坍缩联系起来的做法相当奇特。“从事”物理学研究时最基本的要求就是相信外部客观实在。援引意识在波函数坍缩中的作用,有可能破坏这一原则。它暗示宇宙就像一个虚拟现实游戏,其细节会随着我们进一步探索而不断更新。当我们参观一个新地方,或者通过望远镜观察一个遥远的星系时,难道真的可以相信会发生一连串的波函数坍缩,仿佛大自然以某种方式合谋,在时间上回溯到大爆炸(Big Bang)来构建一个自洽的宇宙吗?在第一个人类变得有自我意识之前,世界真的存在于一个定义不清的叠加态之中吗?还是说,维格纳只是将两个我们尚未理解且颇为不同的难题——量子测量问题和意识的起源——混为一谈了呢?尽管我们对意识的理解还远不够透彻,但将不同程度的意识赋予从人类到类人猿、海豚、大象、猫等各种实体,似乎是合理的。佛教徒甚至会使我们相信,树木、变形虫、岩石和基本粒子也都有某种程度的意识。那么,这些实体中哪些能够使波函数坍缩呢?波函数坍缩必定是一个离散的过程,因为波函数要么坍缩,要么不坍缩。它真的能与像意识这样存在于连续谱上的性质相关联吗?

一个更简单的替代方案可能是一种纯力学的测量问题解决办法。不难想象,当一个波函数达到适当的复杂程度——可能由它所描述的粒子数量或质量大小决定——时,它就必须自发坍缩。这需要在……

薛定谔方程中新的非线性项。添加一个仅在比如 10^10 个粒子相互作用时才变得显著的小项,并不一定会削弱其巨大的预言成功。

518
物理学前沿
量子力学的问题。其中一个设想由罗杰·彭罗斯(Roger Penrose)勾勒出来,他提出当波函数所描述的总纠缠粒子质量接近普朗克质量(Planck mass)——大约为10⁻⁸ kg——时,波函数坍缩可能会被触发。这在原子尺度上非常大,但在人类尺度上却非常小。

15.1.2 多世界诠释
量子力学还有另一种诠释,由休·埃弗雷特三世(Hugh Everett III)于1957年提出,试图规避与波函数坍缩相关的问题。它被称为多世界诠释(many-worlds interpretation)。根据这种观点,波函数并不会坍缩。相反,每当粒子相互作用时,无论是否有人为干预,宇宙都会分裂。当我们进行一次测量,宇宙就分裂了。我们可能发现自己处于一个宇宙中,其中我们测得的值是λ₀,测量后的波函数是Ψ₀,因此如果重复测量,我们将再次得到值λ₀;在另一个宇宙中,测量值可能是λ₁,测量后的波函数是Ψ₁,依此类推。这样一来,单次测量可能会极大地增加宇宙的数量,但我们避免了令人不快的叠加态。例如,那只死与活的薛定谔猫(Schrödinger cats)存在于不同的宇宙中。在一个宇宙中,猫已被毒死;在另一个宇宙中,猫活着且健康。

多世界诠释的一个问题是,什么构成一次测量仍不清楚。测量不一定需要宏观仪器,所以几乎所有发生的事情都是一次测量。如果两个粒子碰撞,一个粒子就在测量另一个粒子的位置。因此,宇宙并不仅仅在罕见场合分裂;它时时刻刻都在发生。如此难以置信的不可观测宇宙的多重性,考验着我们的轻信。我们栖居于一个单一的宇宙吗?我们也许会这样认为,但其实不是——我们同时处于多个宇宙中,所有这些宇宙在某种意义上都存在。这与我们对周围世界的直觉产生了剧烈的冲突。我们体验的是一个单一的世界,比如我们支持的足球队刚刚输掉了比赛。但根据多世界诠释,另一个“我们”正处在一个我们球队赢了的宇宙中。我们怎样到达那里?为什么我们只体验到一个单一的、未分裂的宇宙?多世界诠释暗示,自大爆炸(Big Bang)以来的每一次相互作用,都已将宇宙分裂成无法分类的无穷多个宇宙,因为诸如动量和散射角等变量对于量子系统而言具有连续的可能取值。多世界诠释并未提供宇宙分裂的机制,它依然是一个没有定量结果、且带有大量多余包袱的想法。

这些其实是相当形而上学的思辨,纯靠内省很难得出任何确凿的结论。然而相当引人注目的是,近几十年来,量子测量问题的某些特征已在实验室中得到了检验。

15.1.3 EPR佯谬
一项由爱因斯坦(Einstein)、鲍里斯·波多尔斯基(Boris Podolsky)和内森·罗森(Nathan Rosen)于1935年发表的思想实验,被称为EPR佯谬(EPR paradox),不过该佯谬最清晰的表述来自大卫·博姆(David Bohm),我们将考虑这个版本。设想一个处于静止系的自旋为0的粒子X。粒子X衰变为两个自旋为½的粒子A和B,并沿相反的方向z和−z远去。(这些衰变产物可以是例如一个电子和一个正电子。)我们布置好仪器,测量粒子A在垂直于z的方向x上的自旋。这次测量确定了粒子A在x方向上是自旋向上还是自旋向下。我们知道衰变产物的总自旋必须为零,

量子力学的诠释
519
因此粒子B必定具有与粒子A相反的自旋。测量粒子A的自旋态将因而同时确定粒子B的自旋态。

这或许并不那么令人惊讶。我们熟悉这样的情形:我们获得关于一个物体的一条信息,同时也就揭示了关于第二个物体的一条信息。例如,我们可以将一个黑球和一个白球放入一个袋子,请某人从袋中取出一个球。如果他们取出白球,我们便知道黑球留在袋中。我们通过观察被取出的球获得了关于袋中球的信息。这里没有神秘之处;我们知道球在整个过程中保持了自身的同一性。袋中的球并未因我们的观察而受影响。

然而,当考虑量子粒子的自旋态时,情况大不相同,因为根据哥本哈根诠释,这些自旋态直到我们进行测量时才被定义。测量之前,粒子A和B被描述为纠缠的,它们必须由一个波函数φAB来描述,该波函数是两种可能自旋态的叠加,使得总自旋为零。采用φ↑Ax表示粒子A在x方向自旋向上的波函数这一记法,两个粒子的自旋态由以下波函数描述:

φAB = 1/√2 (φ↑Ax φ↓Bx − φ↓Ax φ↑Bx) . (15.1)

当我们进行测量时,波函数发生坍缩,叠加态之一——或者是φ↑Ax φ↓Bx,或者是φ↓Ax φ↑Bx——被投射出来。这影响了两个粒子的状态。同样重要的是,我们本可以将仪器安排为测量粒子A在y方向的自旋,或者任何其它方向。这意味着这些粒子并非经典的陀螺,其自旋矢量并非在它们由粒子X衰变而产生的那一刻就已确定;它们的自旋值在被测量之前并非确切定义。此外,我们进行测量时,粒子A与B之间的距离没有限制。这似乎意味着我们与粒子A的相互作用对粒子B有瞬时影响。如果我们测得粒子A的自旋向上,则波函数坍缩意味着紧接着之后,粒子B的自旋向下,但就在此前一瞬间,粒子B的自旋还处于叠加态中。我们无法利用这一事实来传递信息;然而,它似乎违背了相对论的精神。爱因斯坦(Einstein)将纠缠称为鬼魅般的超距作用(spooky action at a distance)。

约翰·贝尔(John Bell)证明,EPR思想实验意味着,如果量子力学是正确的,那么测量之间存在任何隐变量理论无法解释的关联。这些关联首次由阿兰·阿斯佩(Alain Aspect)领导的一系列实验所检验。这些实验以及随后所有改进实验都非常清晰地表明,量子力学反直觉的预言得到了遵守。

15.1.4 阿斯佩实验
1982年,由阿兰·阿斯佩领导的一个团队受EPR佯谬启发,进行了一系列实验来探究量子测量问题。他们的装置建在巴黎理论与应用光学研究所的地下室。这些实验测量的是纠缠光子的偏振态,而非像电子和正电子这类粒子的自旋态,但其含义是相同的。钙原子具有一个激发态,该状态下最外层的两个4s电子被提升,形成自旋为0、

520
物理学前沿
4p² ¹S₀态,这就是实验中使用的纠缠光子的来源。该激发态通过两步过程迅速衰变至基态,首先在光谱的绿色区域发射一个波长为551.3 nm的光子,随后在光谱的蓝色区域发射一个波长为422.7 nm的光子。这些光子沿相反方向发射,并且由于激发态和基态的自旋均为0,两光子具有相反的偏振。

{|x, x) +|y, y }
| (v1, v2)
符合计数
探测器
x
z
y
A
B
v2
v1
+1
–1
+1
–1
a
b
1

2
图15.1 阿兹佩(Aspect)实验所用装置的示意图。(图片经授权转载自Physics 8, 123, December 16, 2015。版权(2015)归美国物理学会所有。)

在阿兹佩实验中,一束密度相对较低(约每立方米3×10¹⁶个原子)的准直钙原子束进入一个腔室,在那里原子被暴露于两束波长分别为406 nm和581 nm的极强激光束下,从而通过双光子同时吸收将原子激发到自旋为0的4p² ¹S₀态。(设计此技术是为了避免用于激发钙原子的光子与原子衰变产生的光子之间发生任何混淆。)如图15.1所示,对钙原子发射的光进行监测。左侧的滤光片选择标记为A的绿色光子,右侧的滤光片选择标记为B的蓝色光子。这些光子随后进入偏振分析器,这些分析器是由两个棱镜胶合在一起并在其公共面上涂有介电涂层的立方体。垂直偏振的光子入射到这个面上时直接透射,而水平偏振的光子则以90°反射。然后光子进入光电倍增管被探测。通过这种方式,可以确定任何穿过该装置的光子的偏振。每个偏振分析器都安装在一个平台上,允许其绕自身光轴旋转,从而可以改变两个分析器的相对取向。受激钙原子发射第二个光子的半衰期约为5 ns,因此电子学设备被设置为寻找在20 ns内光子A和B到达的符合事件。

量子力学的解释
521
这足以收集真实符合事件,但又足够短,使得不同光子对之间重叠的概率非常低。测量到的符合计数率在每秒0–40次之间变化,具体取决于两个分析器之间的角度。
通过考虑一种通常称为偏振片(Polaroid)的薄塑料偏振器,我们可以深入了解阿斯佩(Aspect)装置内部发生的情况。偏振片包含针状晶体,全部沿同一方向排列。当随机偏振的光照射到偏振片上时,它会分解为两种正交偏振态,平行和垂直于晶体方向。相对于偏振片,它们被称为垂直(+)和水平(-)偏振。只有垂直偏振的光能透过,其强度为1/2 I₀,其中I₀为原始强度。在透射光路径上放置第二个偏振片,会将光再次投影为垂直和水平分量。如果两个偏振片的偏振方向之间的夹角为α,则透过第一个偏振片的光的电场E会分解为一个透过第二个偏振片的垂直分量E cos α,以及一个被消光的水平分量E sin α。透过两个偏振片的光强度为1/2 I₀ cos² α。这一观测结果称为马吕斯定律(Malus’ law)。如果两个偏振片相互垂直,则α = π/2,无光透过。量子力学的一个显著结果是,如果在两个垂直偏振片之间再放置一个偏振片,则会有一些光透过。如果第一个与第二个偏振片之间的夹角为α,第二个与第三个偏振片之间的夹角为π/2 − α,则透射光的强度为1/2 I₀ cos² α sin² α = 1/4 I₀ sin² 2α,当α = π/4时,其最大值为1/4 I₀。

现在我们可以考虑光子在阿斯佩装置中通过时发生的情况。当受激钙原子衰变时,它发射出一个绿色光子,几乎紧接着又发射出一个蓝色光子。根据量子力学的哥本哈根解释(Copenhagen interpretation),这两个光子以总自旋为零的叠加态发射。当绿色光子与偏振分析器PA1相互作用时,它被投影为垂直或水平偏振(概率各为1/2)。这一波函数坍缩同时影响了蓝色光子,它瞬间投影到相对于PA1具有相同偏振、但相位相对于绿色光子移动了π的状态。然后蓝色光子遇到与PA1成角α的PA2。该光子现在经历第二次投影,变为相对于PA2的垂直或水平偏振。如果蓝色光子相对于PA1是垂直偏振,那么相对于PA2投影为垂直的概率是cos² α,投影为水平的概率是sin² α。对于检测到的每对光子,总共有四种可能的结果:(++)、(−−)、(+−)、(−+),其中第一个符号表示绿色光子相对于PA1的偏振,第二个符号表示蓝色光子相对于PA2的偏振。每种结果的概率是两个投影概率的乘积:P++ = 1/2 cos² α , P−−= 1/2 cos² α , P+−= 1/2 sin² α , P−+ = 1/2 sin² α。这些结果可以用符合函数来概括
E(α)

P++ + P−−−P+−−P−+

1/2 cos² α + 1/2 cos² α − 1/2 sin² α − 1/2 sin² α

cos 2α ,
(15.2)
该函数随两个偏振分析器之间的夹角α变化。阿斯佩团队在角度α = 0, π/8 , π/6 , π/4 , π/3 , 3π/8 , π/2处测量了符合函数,结果符合

522
物理学前沿
如图15.2中曲线所示。这与量子力学的预言完美吻合。
量子力学
1
E( )
00
4
π
–1
隐变量
2
π
图15.2 曲线表示量子力学对E(α)的预言。直线表示文中描述的简单隐变量模型的预言。Aspect及其他量子纠缠实验的结果均落在曲线上,从而排除了定域隐变量理论。
我们预期另一种隐变量理论会给出什么结果呢?在这样一种理论中,光子的偏振在钙原子衰变时即已确定。我们将考虑一个简单的理论,其中这一信息存储在一个随机变量ϑ中,它代表光子偏振的方向。如果绿色光子发射时其偏振方向相对于PA1的角度为ϑ,那么蓝色光子相对于同一方向的偏振角则为ϑ + π。我们将假设,当该理论描述的光子通过一个偏振分析器时,它会根据哪个方向更近而投影到垂直或水平方向;即,当π/4 < ϑ < 3π/4 和 5π/4 < ϑ < 7π/4 时变为水平偏振,当3π/4 < ϑ < 5π/4 和 7π/4 < ϑ < π/4 时变为垂直偏振。关键在于,我们不认为蓝色光子会受到绿色光子投影的影响。根据这一理论,计算结果是直接的。绿色光子被PA1垂直投影的概率为1/2。若PA2的设置相对于PA1的角度为α,则蓝色光子被PA2垂直投影的概率为(1/π)×(π−2α),而被水平投影的概率为(1/π)×2α。将所有四种可能的结果考虑在内,可得出符合函数如下:
E(α) = P++ + P−− − P+− − P−+
= 1/2 × 1/π [ (π − 2α) + (π − 2α) − 2α − 2α ]
= (π − 4α) / π。
(15.3)
该函数在图15.2中显示为一条直线。

量子力学的诠释
523
在阿斯佩(Aspect)实验中,偏振分析器相距13米。以光速从一个分析器向另一个分析器传输信号大约需要40纳秒。这比检测纠缠光子对所允许的最大时间窗口长一倍,因此该实验排除了光子之间通过某种未知的亚光速相互作用发生串通的可能性。该实验的一个变体称为延迟选择实验,其中每个偏振分析器的角度都有两个可供选择的设定,而具体选用哪个设定是在光子飞行途中决定的。这排除了衰变原子与偏振分析器之间任何隐藏的关联。自最初期的阿斯佩实验以来的几十年里,人们进一步努力设计量子纠缠实验,以堵住任何可能想到的、能用定域隐变量进行解释的剩余漏洞。这些改进包括确保探测器之间以及偏振分析器之间具有类空间隔。探测器效率也得到了大幅提升,以确保实验不会受到不公平采样的影响,并排除系统只能探测到表现出量子关联的非典型粒子子集的可能性。此外,还使用了量子随机数发生器来决定每次测量的取向,以确保结果不会受到系统内以往构型的任何记忆的影响。2015年,代尔夫特(Delft)大学的一个团队报告了首个无漏洞实验,该实验测量了两个电子的纠缠,每个电子分别被囚禁在金刚石晶格的一个空位中,且相距1.3公里。现在人们普遍认为,这些实验的结果排除了所有可能的定域隐变量理论。

一个似乎无法回避的事实是,量子力学的基础在于粒子之间的非定域性影响,而且正如阿斯佩实验所证明的那样,这些影响不受光速的限制。然而值得注意的是,没有任何信号可以通过这种方式传输。监测偏振分析器2(PA2)的物理学家可以将偏振片设定在任意角度,而对于每个进入PA2的蓝色光子,它总是有1/2的概率是垂直偏振的,有1/2的概率是水平偏振的。这完全没有提供任何关于PA1取向或绿色光子偏振的信息。只有当PA1和PA2的结果被汇集到一起并进行比较时,这些统计结果之间的关联才会显现出来。因此,尽管我们可能会对这些实验结果感到震惊,但它们并没有为因果性超光速相互作用提供证据。此外,如果PA1和PA2处的测量具有类空间隔,那么在某些参考系中,PA2处的测量将发生在PA1处的测量之前。在这些参考系中,结果会有相当不同的诠释,但这并不会产生任何不一致。现在我们将PA2处的测量解释为导致了波函数坍缩,而PA1处的测量则作用于由此产生的本征态。两次测量的结果完全相同,并且它们之间存在相同的关联。

量子纠缠已经成为一种新技术——量子密码学——的基础,并预示着如量子计算等进一步的创新,尽管还有相当大的技术障碍有待克服。
这些量子奥秘的核心在于波粒二象性的观念。在某些情形下,我们所关注的实体——无论是电子、光子还是中微子——表现得像波,而在另一些情形下它们又表现得像粒子。那么它们到底是什么?粒子常常被当作点状物来处理,但这不可能在字面上成立,因为点状的

粒子是高度奇异的。或许,对粒子更好的描述能够阐明围绕量子力学诠释的一些问题。

524
物理学前沿
15.2
点粒子问题
粒子的理想经典图像是它是一个几何点,在时空中描绘出一条世界线。这导致了微分运动方程,包括牛顿(Newton)运动定律和粒子在爱因斯坦(Einstein)弯曲时空中的测地线运动方程。这些方程都是被充分确立的。标准模型的基本粒子在大型强子对撞机(LHC)已探索的距离尺度上(小至约10⁻¹⁸ m)表现得如同点粒子。然而,粒子具有有限的质量并且通常带有非零的电荷,这意味着如果它真的是点粒子,那么它将具有无限的质量密度、无限的电荷密度和无限的静电能量。此外,考虑到点粒子所发出的辐射,似乎不可能精确而自洽地确定其经典运动。因此,我们必须将粒子的点状本质视为一种理想化,仅在粒子间距离远大于粒子大小的情形下成立。

在标准非相对论量子力学中,粒子的点状模型被保留下来。波函数的模平方 |ψ(x)|² 决定了在 x 处找到粒子的概率。ψ(x) 通常是平滑且弥散开的,但粒子本身并非如此。通常假设粒子本身保持点状,并且波函数可以任意窄地尖峰化,至少在某个初始时刻如此,这意味着位置不确定度可忽略。之后,波函数按照薛定谔(Schrödinger)方程演化,变得宽阔得多。这是由于不确定性原理。一个精确局域化的粒子具有很大的动量不确定度,因此(启发式地)粒子会迅速从初始位置向所有方向离去。于是位置概率密度也迅速扩散。

在量子力学中,点状模型必须再次被视为一种理想化,它只是近似成立的。在结合了量子力学与相对论的量子场论中,对于粒子能够有多小存在一个真正的限制,尽管这个限制并不非常精确。其思想是,如果一个粒子被过于高度地局域化,那么它有显著的概率具有大的动量,因而其动能远大于其静质量。这份能量可以重新表现为一个新粒子,或者粒子-反粒子对。当周围存在多于一个粒子时,我们就不再确切知道原始粒子在哪里。假设粒子被局域在距离 L 内。那么它的动量至少为 2π¯h
L 。相对论能量-动量关系是 E² = p² + m²,当 p 与 m 同数量级时,粒子数开始变得不确定。如果 2π¯h
L
与 m 同数量级,或者说,如果 L 与 2π¯h
m 同数量级,这种情况就会发生。因此,2π¯h
m 被称为质量为 m 的粒子的康普顿波长(Compton wavelength),粒子不可能被有意义地局域在比这更小的半径内。质子的康普顿波长约为 1 fm(10⁻¹⁵ m),而电子的康普顿波长为质子的 1836 倍,数量级为 10⁻¹² m。这两个距离都远小于原子半径。

这些论证给出了粒子可以有多小的重要限制,但未能对粒子的内禀结构或精确大小提供任何深入理解。目前的认知是,电子在其康普顿波长尺度上没有内禀结构。事实上,实验尚未探测到电子小至约10⁻¹⁸ m尺度上的任何空间结构。类似地,单个夸克似乎没有亚结构。另一方面,质子由三个夸克构成。在简单模型中,夸克

点粒子问题
525
有一个空间波函数,它赋予质子的内禀尺寸几乎与其康普顿波长相同。

物理学家仍然没有令人信服的关于基本粒子终极结构的图像。依赖量子不确定性的论证,以及将它们视为由越来越小的亚单位组成的解释,并不完全令人满意。还有一种不同的方法,我们接下来将考虑,它进一步利用了场论的非线性性。像克莱因-戈登(Klein–Gordon)理论这样的线性场论,本质上是一种完全没有空间局域性的波的理论。量子理论有满足 E2 = p2 + m2 的态,仅从这一点就推断出存在质量为 m 的粒子。另一方面,非线性场论通常具有更加局域化的解,这些解甚至在量子化之前就具有粒子性。这些解被称为孤子(solitons),它们不是点状的。它们提供了一种根本不同的基本粒子模型。

15.2.1 孤子
到目前为止,我们在场论中所考虑的激发就像沿着长绳或弹性介质传播的波。只有将波量子化之后,我们才能找到粒子态。孤子则不同。它们是原始经典场方程的类粒子解。一个恰当的孤子类比是默比乌斯带(Möbius strip)中的扭曲。孤子本质上是局域化的,光滑而非点状,其大小取决于理论的参数。它的经典能量被认定为它作为粒子的静止质量。当场论被量子化时,孤子的性质不会受到太大影响。

我们将首先考虑正弦-戈登(sine–Gordon)孤子。这是1维空间中的孤子,因此它并非真实的物理粒子。然而,它产生于一个数学上优雅的场论,该场论可以在经典和量子力学层面进行非常详细的分析。这个模型的名称是在戏仿克莱因-戈登。我们将讨论的第二种孤子是3维空间中的斯格明子(Skyrmion)。这是一个具有物理意义的质子或中子的实际模型,尽管人们并不认为它像这些粒子的QCD模型那样基本。

还有许多其他类型的孤子。一个例子是孤子磁单极子,具有非零磁荷。具有磁荷的粒子在麦克斯韦(Maxwell)理论中是不可能的,因为它们违反方程 ∇· B = 0,但在一些更复杂的杨-米尔斯(Yang–Mills)理论中发现了它们,这些理论中麦克斯韦方程与其他场的方程结合在一起。标准模型本身没有任何磁单极子,这很幸运,因为磁单极子从未被观察到过。孤子也存在于经典波动情境中,包括水波和光纤中的波,以及多体量子系统。例如,某些磁性材料中存在斯格明子的2维类似物。最近关于斯格明子的许多文献现在指的是这些对象,但它们不是基本粒子。

正弦-戈登(sine–Gordon)场论是克莱因-戈登场论在一维的版本,带有一个特定的相互作用项。该理论在2维时空中是洛伦兹不变的。它有一个拉格朗日量,描述一个实标量场 φ(x, t),由此可以导出正弦-戈登场方程
∂2φ
∂t2 −∂2φ
∂x2 + sin φ = 0 .
(15.4)
(我们已固定时间和能量单位,将其化为最简形式。)sin φ 相互作用

526
物理学前沿
该项赋予了模型其名称。对于小的φ,若将其展开,sine-Gordon方程变为
∂²φ
∂t² −∂²φ
∂x² + φ −1
6φ³ + · · · = 0 。
(15.5)
φ项赋予场一个质量,而φ³项则产生相互作用,正如第12章所讨论的,这种相互作用可用费曼图(Feynman diagram)顶点来表示。
回想我们之前对希格斯机制(Higgs mechanism)的讨论,场论的真空不必唯一。在sine-Gordon理论中,真空可以建立在任意一个满足场方程的稳定、均匀场上。一个真空解是φ = 0,但对于任意正整数或负整数N,解φ = 2πN也是一个真空。
6
4tan⁻¹(e^{±x})
5
4
3
2
1
–4
–2
2
4
x
孤子解
反孤子解
图15.3 一维sine-Gordon理论中的孤子与反孤子解。
sine-Gordon方程有许多依赖时间的、类波的解,而且令人称奇的是,其中有无数个解可以用闭合形式写出。然而,我们感兴趣的正是孤子解。这是一种局域的静态解,在左边和右边的空间无穷远处趋向于不同的真空,并且具有有限能量。为找到它,我们注意到,如果一个静态场满足

dx = 2 sin 1
2φ ,
(15.6)
那么它就满足sine-Gordon方程,因为
d²φ
dx² = (cos 1
2φ) dφ
dx = 2 cos 1
2φ sin 1
2φ = sin φ 。
(15.7)
一阶方程(15.6)很容易求解,并且有一个解log tan 1
4φ = x,或等价地
φ(x) = 4 tan⁻¹(e^{x}) 。
(15.8)
这个孤子解示于图15.3中。

点粒子问题
527
孤子的场变量 φ 具有一个单位的卷绕数。当 x → −∞ 时,e^x → 0,我们可以选取 tan⁻¹(e^x) 的值使得 φ → 0。当 x → ∞ 时,e^x → ∞ 且 tan⁻¹(e^x) → ½π,因此 φ → 2π。孤子在空间线的两端都趋近于真空,但由于 φ 沿着线增加了 2π,它具有非平凡且不可移除的拓扑特性,我们称之为单位卷绕。因此,正弦–戈登孤子是拓扑孤子的一个例子。

通常,正弦–戈登场 φ 被视为一个角变量,在这种情况下,我们之前讨论的真空实际上是不可区分的。最终只有一个真空,因为将 φ 移动 2π 没有物理效应。然而,孤子仍然具有单位卷绕,就像一个完成一整圈运动的单摆,它不能连续形变为恒定的真空解。

正弦–戈登孤子显然具有光滑的特征和有限的宽度。它有几个变体。我们可以将孤子向左或向右平移(在求解方程 (15.6) 时利用任意的积分常数)。我们也可以将孤子加速到任何低于光速的速度 v。完整场方程 (15.4) 的一个解为
φ(x, t) = 4 tan⁻¹(e^{γ(x−vt)}), (15.9)
其中 γ = (1−v²)^{−1/2} 是通常的相对论性 gamma 因子。孤子的场能量和动量也可以计算出来。静态孤子的能量为 E = 8,当它运动时具有相对论能量 E = 8γ,动量为 p = 8γv。因此,该孤子被解释为一个静质量为 8 的粒子。

取相反符号的方程 dφ/dx = −2 sin(½φ) 同样意味着 d²φ/dx² = sin φ,其解为具有负单位卷绕数的反孤子,但能量与孤子相同。孤子和反孤子均展示在图 15.3 中。

正弦–戈登孤子是一种新型粒子,但在真空中 φ = 0 附近对波进行量子化时,该理论还会产生基本的标量粒子。由于线性化场的质量参数为 1,这个粒子的质量为 ħ(在我们的单位制下),如果 ħ 很小,这远轻于孤子的质量 8。两种质量都会获得进一步的量子修正,但如果 ħ 很小,这些修正也很小。孤子不仅更重,而且由于其卷绕,它具有拓扑稳定性,不能衰变为一组较轻的粒子。

关于正弦–戈登理论及其孤子,人们已知的远不止这些。我们可以构造具有多重卷绕的经典解,但它们都不是静态的。这些解对应于多个相互作用的孤子。孤子之间的力可以计算,孤子的经典散射和量子化散射也是可计算的。量子化的反孤子表现为孤子的反粒子,并且存在孤子与反孤子的束缚态,这些束缚态为无卷绕、质量为 ħ 的基本标量粒子提供了一种局域化的图像。

15.2.2 斯格明子
斯格明子是一种更真实的孤子,因为它出现在三维空间的理论中。该理论由托尼·斯格明(Tony Skyrme)在 1960 年左右提出,是对汤川(Yukawa)的 π 介子与核子理论的发展。基本场是三个标量 π 介子场,但不存在用于描述核子的显式狄拉克场。斯格明的想法是以一种非线性的方式组合 π 介子场,从而允许出现卷绕数和拓扑稳定的孤子。正如正弦–戈登场是一个取值于圆上的角场,斯格明场取……

528
物理学前沿
一个3维球面上的值。这是通过引入四个场σ, π₁, π₂, π₃并施加约束
σ² + π₁² + π₂² + π₃² = 1 (15.10)
来实现的。局域地,σ可以被消去,而物理场是π介子场π₁, π₂, π₃,它们与π介子粒子π⁻, π⁰, π⁺密切相关。真空解在时空中处处具有σ = 1,且π介子场为零。此外,还存在接近真空的波动解,其中π介子场处处幅度很小,σ接近于1。对这些拓扑平凡的波场进行量子化,就给出了一个相当真实的、包含强相互作用的、自旋为0的π介子粒子模型。如果愿意,还可以在理论中加入电磁和弱相互作用效应。

图15.4 斯格明子(Skyrmion)。

该理论中最有趣的经典解是斯格明子,它是一个静态孤子。斯格明子在空间无穷远(所有方向)处趋近于真空,但在围绕某个中心点的区域内,场完全卷绕在由约束方程(15.10)定义的3-球面上。该解在图15.4中给出图示。箭头表示π介子场(π₁, π₂, π₃)的值,以矢量形式呈现。σ在无穷远处趋近于1,但在斯格明子中心处取值为-1。单位的卷绕数意味着,在这一理论框架内,斯格明子是绝对稳定的,不会衰变为π介子波。

具有多重卷绕数的静态和动力学解也是可能的。卷绕数被等同于重子数B。这是斯格明(Skyrme)的伟大想法。重子数守恒是一条自然定律,但尚未以一种根本的方式被理解。在斯格明的模型中,它是一条拓扑守恒定律。

对标准模型的评判
529
斯凯尔姆理论(Skyrme theory)并不像正弦–戈登场论那样被透彻理解。对于低能现象,可以计算出近似的量子结果,这些结果非常有趣。但归根结底,若要为物理实在建模,在比斯凯尔姆子(Skyrmion)尺度更短的距离上,该理论看来必须被量子色动力学(QCD)取代。在经典层面上,重子数 $B=1$ 的斯凯尔姆子可以绕通过其中心的任意轴转动。由于拓扑原因,转动斯凯尔姆子的最低能量量子态具有自旋 $\frac{1}{2}$。这些态同样具有同位旋 $\frac{1}{2}$,因为$\pi$介子矢量的取向随斯凯尔姆子一起转动。因此,斯凯尔姆子有四个能量基本相等的基态量子态,每个态的重子数均为 $B=1$。其中两个态代表质子,自旋向上或向下;两个态代表中子,自旋向上或向下。具有自旋 $\frac{3}{2}$和同位旋 $\frac{3}{2}$的更高能量态则代表$\Delta$共振态 $\Delta^{++}$、$\Delta^+$、$\Delta^0$、$\Delta^-$。此外还有反斯凯尔姆子的态,其卷绕数相反,代表反重子。

令人瞩目的是,仅从一个含有三个标量场的场论出发,我们就得到了两类粒子——$\pi$介子和核子——而且,尽管核子具有自旋 $\frac{1}{2}$,我们并不需要一个基本的狄拉克方程(Dirac equation)。当相互作用产生拓扑孤子时,这种可能性正是量子场论的一个迷人之处。

与正弦–戈登场论一样,在斯凯尔姆理论中我们能够构造出远比具有单位重子数的静态孤子更多的解,但这需要数值计算的辅助。这些解包括具有多重重子数$B$的斯凯尔姆子束缚构型,它们已被用于原子核建模。其量子态既描述原子核的基态,也描述某些激发态。斯凯尔姆子的有限尺寸在此有重要影响。通常,原子核中的质子和中子被当作具有强排斥力的点粒子处理,排斥力使它们彼此至少保持 $1,\text{fm}$ 的距离。在斯凯尔姆理论中,排斥力自动出现,但斯凯尔姆子在相互靠近时会发生显著的形变。因此,斯凯尔姆理论给出的原子核图像,不同于图11.9中用硬质且相互接触的红球与黄球来代表质子和中子的熟悉描绘。

总而言之,粒子的孤子模型是量子场论中较正统粒子模型颇具前景的替代方案。它们本质上依赖于非线性相互作用,而为了保持稳定,它们需要理论和场方程具有某种拓扑结构,这种结构单凭费曼图是难以识别的。孤子范式提供了一种统一的粒子内部结构模型,如图15.3和图15.4所示,同时也描述了粒子如何相互作用和散射。孤子模型确有其局限性。我们仅有一个使用斯凯尔姆子的质子和中子近似模型,而目前尚不存在成功的电子及其他轻子的孤子模型。就我们目前所知,轻子是完全无结构的。

眼下,我们必须暂且放下对粒子有限尺寸的疑虑,回到我们已有的最好的粒子物理学理论——标准模型。

15.3 对标准模型的评判
所有与电磁、弱和强相互作用相关的现象,基本上涵盖了整个非引力物理学,竟然被标准模型这一单一自洽的理论所囊括,这确实相当了不起。而且,该理论能用于做出详细的定量预言,迄今为止进行的每一项实验都与这些预言一致,某些情况下甚至达到非凡的精度。然而,标准模型肯定不可能是粒子物理学的终极定论。

530
物理学前沿
标准模型包含若干自由参数,目前理论家无法计算这些参数,必须通过实验室测量作为理论的输入。它们分别是十二种基本费米子的静止质量,以及W、Z和希格斯玻色子的质量。此外,还有CKM矩阵的三个角度和一个相位,控制着弱相互作用中夸克味道的混合;类似地,PMNS矩阵的三个角度和一个相位控制着中微子味道的混合。最后,还有电磁相互作用和强相互作用的耦合强度。(弱相互作用的耦合通过W和Z质量之比与电磁相互作用的耦合相关联。)这十五个质量、八个混合参数和两个耦合强度,总计25个自由参数,理论无法给出解释。

至于标准模型为何呈现我们所见的这种形式,同样没有任何解释。
理论中的交换玻色子反映了相互作用背后的对称性。弱力的对称群被称为SU(2),色力的对称群是SU(3)。正是这个SU(3)对称性决定了有八种胶子来传递这种力。但为什么是SU(2)和SU(3),而不是其他对称群?关于标准模型的其他特征,也可以提出类似的问题:为什么存在三代物质粒子?为什么只有左手征粒子参与弱相互作用?为什么希格斯势恰好呈现我们所观察到的形式,恰好能够自发破缺电弱力的对称性?

我们如何才能构建一个比标准模型更好的理论来解决这些问题?至今无人知晓,但在接下来的几节中,我们将探讨一些可能指向答案的路径。

15.4 拓扑学与标准模型
宇宙中有若干重要特征难以解释。这包括大量暗物质的存在以及观测到的物质-反物质不对称性。我们在第14章讨论了暗物质的证据。现在我们来思考物质-反物质不对称性的含义。我们可以定义重子数B,令质子和中子的重子数B = 1,反质子和反中子的重子数B = −1。在通常的标准模型相互作用中重子数是守恒的,因此我们可能会预期宇宙应含有等量的物质和反物质。然而,如果宇宙中存在反物质占主导的区域,那么在物质主导区和反物质主导区的交界面处,就会发生物质-反物质湮灭,并伴随着伽马射线的发射。这会产生一个高能伽马辐射背景,但这样的背景并未被观测到。因此,我们可以确信整个可观测宇宙是由物质主导的。

1967年,安德烈·萨哈罗夫(Andrei Sakharov)列出了三个必要条件,如果一个初始B = 0的宇宙要演化成物质-反物质不对称的状态(正如我们现在所见的重子数B ≫ 0)。第一,宇宙必须处于热力学非平衡态,否则正逆反应将以相同速率进行,一切都将保持不变,B将保持为零。不难想象,在其最早期瞬间,一个急剧膨胀的宇宙会处于热平衡之外。第二,必须存在违反重子数守恒的相互作用。第三,必须破坏C和CP对称性,否则,对于每一个产生额外重子的过程,都会有一个等效过程产生额外的反重子。我们知道在

拓扑学与标准模型
531
在标准模型中,C 破坏与 P 破坏在弱相互作用中几乎达到最大程度。CP 也有破坏,但这是一种小得多的效应,可能不足以解释宇宙中观测到的物质–反物质不对称性。可能需要一种更强的 CP 破坏机制,涉及超出标准模型的新物理。

值得注意的是,重子数守恒的破坏也是标准模型的一个特征,尽管它依赖于一种拓扑非平凡的过程,而这一过程至今尚未在加速器实验中观测到。标准模型具有某种拓扑结构,这源于 SU(2) 和 SU(3) 对称群以及希格斯机制的运作方式。它没有任何稳定的孤立子(soliton),但它确实有一个具有拓扑意义的、不稳定的静态解,称为 sphaleron。sphaleron 是一种平滑且局域化的场构型,坐落在场构型能量景观中的一个山口处。它是不稳定的,因为能量在某个特定方向(及其相反方向)上会降低,而在所有其他方向上则会升高。

仅考虑 SU(2) 规范场和希格斯场时,存在一条从真空出发、翻越 sphaleron 山口再沿另一侧下山回到真空的通道,但这条通道会显著改变费米子粒子的状态。有些费米子被创生,有些则被湮灭。这是因为规范场和希格斯场的拓扑结构与每个费米子的狄拉克海(Dirac sea)之间发生了相互作用。狄拉克海就像一个”无限酒店”。无限酒店的房间编号为 1, 2, 3, ……直至无穷,且所有房间都已住满。当又有一位客人要求入住时,经理请所有住客都搬到隔壁号码更大的房间。他们都可以这样做。这样便在 1 号房间制造了一个空位,可以容纳这位新客人。

类似地,通过 sphaleron 从真空到真空的通道在某些费米子的狄拉克海中制造了空穴,因为所有能级都被向下推了。狄拉克海中产生的这个空穴被观测为一个反粒子。反过来,当能级上升时,某个原本处于负能态的费米子最终进入正能态,如图 15.5 所示。这被观测为一个粒子。净效果是产生了一些粒子和一些反粒子。它们并非同一种类,事实上,对于每一代标准模型费米子,可以产生三个夸克和一个轻子。这总共产生了三个重子和三个轻子。重子数 B 和轻子数 L 各自改变了 3,但 B − L 是守恒的。同时,净电荷也没有变化。由于 CP 破坏,产生反重子和反轻子的逆过程速率可能略有不同。因此,随机过程可以有利于正物质的产生而非反物质。

这些过程确实需要真实的能量来创生费米子,但与临时产生一个 sphaleron 并翻越山口所需的能量相比,这点能量很小。sphaleron 的能量可以计算出来,大约为 9 TeV,相当于约一百个 W、Z 和希格斯粒子紧密聚集在一起的能量。这个能量刚好在大型强子对撞机(LHC)质子–质子对撞的可达范围内,但据信,在这个能量附近 sphaleron 的产生和衰变速率小到无法观测,因为这些对撞无法以相干的方式产生大量的 W、Z 和希格斯粒子。最近有观点提出,仅涉及两个夸克且能量高于 9 TeV 的对撞可能使 sphaleron 介导的过程更容易发生。物理学家相当确信,在早期宇宙极高温度的条件下,sphaleron 过程更为频繁,并且与某种形式的 CP 破坏一起,可能部分地造就了我们今天所观测到的物质–反物质不对称性。

532
物理学前沿
E
0
S
图 15.5 sphaleron 介导的大质量费米子产生。在 sphaleron S 的背景中,费米子具有零能态。

15.5 超越标准模型
在第 12.9 节我们讨论了中微子振荡,其中电子中微子、缪子中微子和陶子中微子会在数千公里的距离上互相转变。位于意大利格兰萨索 (Gran Sasso) 的中微子观测站一直在研究这样一种可能性:可能至少还存在一种额外的中微子,能与三种已知类型的中微子发生混合。这种粒子被称为惰性中微子 (sterile neutrino),因为它不会通过弱力或标准模型描述的其他任何过程发生相互作用。这类短距离中微子振荡实验使用一个强电子中微子源,由铈同位素 ¹⁴⁴Ce 构成,放置在距 Borexino 液体闪烁体探测器几米的范围内,该探测器周围布置有光电倍增管。对光子到达时间进行精确计时,可以确定中微子在 Borexino 内部发生相互作用的位置。该实验旨在测量探测到的电子中微子数量随到中微子源距离的变化。这套实验系统规模太小,不足以发生明显的向缪子中微子或陶子中微子的振荡,因此,如果探测到的电子中微子数量出现短缺,就意味着存在与第四种中微子的混合。这种新中微子的质量随后可以从振荡的波长推导出来。

如果通过这种方式发现惰性中微子,将是一项重大突破,因为它将代表着超越标准模型物理的一个信号。这也很重要,因为惰性中微子可能在大爆炸之后立即大量形成,并且现在可能构成暗物质的一部分。

超越标准模型
533
15.5.1 大统一理论
标准模型由 GWS 模型和 QCD 组合而成,分别描述电弱力和色力,如第 12 章所述。GWS 模型将电磁力和弱力统一为一个单一理论,该理论依赖于希格斯机制在 100 GeV 能量区域打破部分规范对称性。几乎在标准模型刚建立起来,统一各种力的下一步就显得相当明确。1974 年,谢尔登·格拉肖(Sheldon Glashow)和霍华德·乔治(Howard Georgi)提出可能存在两个阶段的对称性破缺。在极高能量下,色力和电弱力将由一个单一的杨-米尔斯理论统一描述。这类理论被称为大统一理论或 GUT。在 GUT 能标——约为 10¹⁵ 到 10¹⁶ GeV 的区域——第一轮对称性破缺产生了分立的色力和电弱力。接着在低得多的能量(100 GeV)下发生标准模型的电弱对称性破缺。最简单、也是最早被提出的此类理论由一个称为 SU(5) 的对称群描述。

GUT 的交换玻色子包含在一个矩阵中。在 SU(5) 大统一理论中,这是一个 5×5 矩阵,有 24 个独立分量。其中 12 个是标准模型的交换玻色子(八个胶子加上 W⁺、W⁻、Z 和光子)。另外 12 个是新的,通常被称为 X 玻色子和 Y 玻色子。第一轮对称性破缺赋予 X 和 Y 玻色子一个非常大的、约在 GUT 能标量级的质量,而其他交换玻色子始终保持无质量(直到我们达到电弱破缺能标)。因此,该理论需要一组质量在 GUT 能标区域的希格斯玻色子矩阵。

类似地,物质粒子——轻子和夸克——组合成 GUT 多重态,这产生了一个有趣且可检验的预言,因为它意味着 GUT 力能够将反轻子转化为夸克,以及将夸克转化为反轻子,这在标准模型中是不可能的(除非可能通过 sphaleron 过程)。这样的相互作用将由 X 和 Y 玻色子以图 15.6 所示的方式传递。这些相互作用破坏重子数 B,但 B−L 守恒,其中 L 是轻子数。

d
u
Y
e⁺

图 15.6 假想的 Y 玻色子可以传递导致质子衰变的过程。(Y 玻色子的电荷为 +1/3。)该过程的半衰期约为 M_Y⁴ 的量级,因此非常长。

如果这是正确的,那么质子 duu 可能会不稳定地衰变为
p → e⁺ + π⁰ . (15.11)

534
物理前沿
由于X和Y玻色子质量如此之大,这类相互作用将极为微弱,因此质子的半衰期会非常漫长。对于原始的SU(5)大统一理论,质子寿命估计在10³⁰年这个量级。

尽管标准模型的力和粒子在一些较简单的大统一理论(GUT)中似乎能以相当自然的方式结合在一起,但这些模型面临着严重的理论和实验问题。例如,质子衰变从未被观测到。超级神冈探测器(Super-Kamiokande)的结果给出了质子寿命的下限在10³⁴年量级,这排除了最简单的大统一理论,比如原始的SU(5)理论。大统一理论还预言了磁单极子的存在。这些东西也从未被观测到,而且它们的存在会给我们对宇宙学的理解带来问题。

构建大统一理论的动机是为了统一强力和电弱力。如果能够实现这一目标,那么通过建立强力和电弱力耦合常数之间的关系,可以移除标准模型中的一个未定参数,但这是以引入大量新粒子——交换玻色子、希格斯玻色子以及通常还有额外的费米子——为代价的,而这些粒子的质量并不能由理论确定,因此总体而言,未定参数的数目大大增加了。

更为严重的是一个理论问题,它与基于希格斯机制进行两轮对称性破缺的思想有关。我们知道,如果存在对应的未破缺规范对称性,自旋为1的粒子必须是无质量的。自旋为1/2的粒子,如果其左手和右手分量携带了未破缺规范对称性的不同荷,也必须是无质量的。这被称为手征不对称性。并不存在类似的原则来保证自旋为0的粒子的无质量性。因此,我们应该预期任何自旋为0的粒子都具有与理论的自然质量标度相当的质量。对于大统一理论,合适的标度在10¹⁵ GeV这个量级。因此,一个大统一理论竟能包含质量仅为125 GeV的标准模型希格斯玻色子,这实在是个谜。这就是所谓的层级问题(hierarchy problem)。

针对层级问题,人们已经提出了若干可能的解决方案。一种建议是,或许希格斯玻色子并非基本标量粒子,而是两个新的自旋为1/2粒子的束缚态。这类粒子被称为techniquarks(超夸克),而这类理论则被称为technicolor(超色理论)。该提议认为,超夸克通过一种类似于量子色动力学(QCD)的未知规范力相互作用,而希格斯玻色子则是一种超介子(technimeson),类似于π介子。然而,要构建不自相矛盾且不与现有实验结果明显冲突的超色理论,是一项艰巨的挑战,需要引入许多新粒子和未定参数。

解决层级问题最流行的方案是假设费米子和玻色子之间存在一种对称性。这种被称为超对称(supersymmetry)的对称性,只要理论中包含无质量的自旋为1/2粒子,就能保证存在无质量的自旋为0粒子。因此,在我们这样一个包含低质量自旋为1/2粒子的世界里,低质量希格斯玻色子的存在就成为了可能。接下来,我们来看看超对称及其带来的影响。

15.5.2
超对称
多年来,理论家们一直着迷于超对称量子场论的可能性,这种理论在其费米子场和玻色子场之间具有对称性。这些理论包含相等数量的玻色子和费米子波模,这意味着这些场的零点能可以相互抵消。我们在12.2.2节中看到,场的两个分量……

弦论
535
复标量场的每个模式的零点能都是 1/2 ħω,而在第 12.2.1 节中我们展示了,具有两个自旋态的狄拉克场包含能量为 -ħω 的负能激发。对于狄拉克场的这些模式,其零点能为 -1/2 ħω。因此,一个复标量场与一个狄拉克场的零点能之和为零。这是此类理论的一个吸引人的特征,它表明超对称(supersymmetry)可能为量子场论提供一个很好的起点,尤其是如果我们的最终目标是将引力纳入这样一个理论的话。

在超对称理论中,费米子和玻色子是成对出现的。例如,电子(费米子)必须有一个玻色子伙伴,而光子(玻色子)必须有一个费米子伙伴。已知的基本粒子无法这样配对,因此如果宇宙确实是超对称的,那么必然有大量新粒子等待我们去发现。假如超对称是一种完美无破缺的对称性,这些粒子对将具有相同的质量,那样的话伙伴粒子早就该被发现了。所以,如果超对称在粒子物理学中扮演任何角色,那么它必定像是电弱力那样是自发破缺的。标准模型最简单的超对称扩展被称为最小超对称标准模型(minimal supersymmetric Standard Model, MSSM)。

理论家们已经为超对称所预言的那些假想新粒子起了名字。电子的伙伴被称为标量电子(selectron)。一般而言,一个费米子的玻色性伙伴的名称是在该费米子名称前加上表示超对称的前缀“s”,因此中微子的伙伴称为标量中微子(sneutrino),夸克的伙伴称为标量夸克(squarks)。光子的超对称伙伴是一个费米子。理论家称之为光子微子(photino)。一般来讲,玻色子的超对称伙伴都以后缀“ino”结尾,这便有了 W 微子(Winos)、Z 微子(Zinos)、胶微子(gluinos)和希格斯微子(Higgsinos)。

大型强子对撞机(LHC)正在寻找这些新粒子的迹象。如果超对称是宇宙的一个真实对称性,那么应该会有一大批奇妙的新粒子可供收获,而它们的发现将能解答宇宙学中最大的谜题之一。几乎所有基本粒子都是不稳定的,会迅速衰变成其他更轻的粒子。物质由少数几种稳定的粒子构成。超对称的一个非常重要的结果是,最轻的超对称伙伴粒子将是完全稳定的。这预计会是一个自旋为 1/2、不带电荷的粒子,被称为中性微子(neutralino)。(它是由光子微子、Z 微子和两种中性希格斯微子组合而成的四个粒子中最轻的一个。)这种粒子在宇宙诞生最初时刻曾被大量产生,并且由于它是稳定的,现在它会与过去一样丰富。这使得中性微子成为解释暗物质的另一个候选者。

这些试图将物理学推进到标准模型之外的尝试,没有一个特别具有说服力。如果我们通过一个理论包含的未定参数的数量来衡量其优雅程度,那么这些理论——大统一理论(GUTs)、人工色(technicolor)理论和超对称——每一个都需要在标准模型的参数之外至少再多引入 100 个参数。更为严重的是缺乏物理支持,甚至与观测证据完全不相容。四十年来,标准模型一直占据统治地位,赢得了一次又一次的成功。接下来会发生什么,多少是个谜。

15.6 弦论
对于基础物理学,除了我们一直在考虑的自下而上的进路之外,还有一种替代方案。我们不必从标准模型出发并围绕它构建一个更复杂的理论,而是可以寻找一条自上而下的途径通往标准模型。

536
物理学前沿(Frontiers of Physics)
模型。此类研究的最终目标是发现一个独特、自洽的宇宙理论,并证明它包含标准模型(Standard Model)作为其低能极限。弦理论(string theory)是这一终极理论的第一个严肃候选者。弦理论的目标是囊括构建宇宙的所有力和粒子。该理论的新特征在于,基本对象不是被视为零维点状实体的粒子,而是一维的弦。这个看似简单的想法具有非常深远的后果,带来了大量有趣的反响,并在近几十年来将理论家引向了许多非凡的方向。该理论不是假定存在众多不同的粒子,而是只有一种基本对象——弦——它可以以多种方式振动,每种振动模式代表一种不同类型的粒子。例如,一种模式可能是电子,另一种模式可能是夸克,第三种模式可能是光子。弦理论被证明远比任何人所能想象的更为丰富和令人惊讶,而该理论的完整含义还远未被理解。由于缺乏实验支持,它是否与现实世界有任何联系仍无定论。它依然是一种对自然终极理论的纯粹思辨性探索。在这篇非常简短的综述中,我们只能浅尝这一极其丰富理论的些许滋味。那么,弦理论究竟是关于什么的,它为何如此重要?

弦理论首次提供了建立自洽的引力量子理论的可能性。广义相对论建立在与量子力学根本不同的原理之上。然而,普遍认为,当作为量子场论考虑时,引力由一种被称为引力子(graviton)的无质量自旋为2的粒子所传递。引力子的自旋为2,因为它们是形成引力波的量子激发,而引力波具有两种不同的四极极化,每种极化在绕波矢k方向旋转180°下是对称的,这可以从图6.13和6.14中看出。物理学家们多年来努力构建一个自洽的引力量子理论,但未获成功。这个问题如此困难的原因似乎在于此类理论在极短长度尺度上的行为。在引力量子理论中,我们可以预期时空几何在极短距离下经历剧烈的虚涨落。这使得该理论极难定义。我们可以通过结合基本常数¯h、G和c来估计量子效应在引力中变得重要的尺度,从而得到一个具有长度量纲的基本量,即普朗克长度(Planck length),lP = √(¯hG/c^3) ≃1.6 × 10^-35 m。

弦可以是开弦或闭弦。开弦是一条有两个端点的曲线,闭弦是一个圈。闭弦的基本振动模式看起来与无质量自旋为2的粒子完全相同。这就是引力子。它的存在意味着弦理论包含了一个引力理论。如果弦要解释引力,那么有理由预期它们的大小处于普朗克长度的量级范围。弦的基本振动模式对应于质量最低的粒子,而弦的谐波对应于质量更大的粒子;谐波越高,粒子的质量越大。对于普朗克长度的弦,这些谐波会产生质量是普朗克质量倍数的粒子,普朗克质量 mP = √(¯hc/G) ≃2.2 × 10^-8 kg。这等于10^19 GeV,该能量并未大大超出大统一理论(GUT)的尺度,但仍然约为大型强子对撞机(LHC)质子碰撞释放能量的10^15倍。弦的激发形成了一系列状态,其质量是普朗克质量的倍数。我们不会期望发现处于这些激发态的弦,除非在最极端的

极端情形,例如黑洞中心或大爆炸(Big Bang)刚发生后的极早期

弦理论
537
大爆炸,但它们对于理论的一致性至关重要。如果弦理论正确,那么日常物理中的所有现象都源于弦的最低振动模式,这些模式对应于无质量粒子。
图15.7 左:粒子物理学中的费曼(Feynman)图顶点。右:弦理论顶点。
量子引力在极短距离下可能出现的问题,似乎在弦理论中得到了缓解。当弦在时空中运动时,它会扫出一个二维曲面,称为弦世界面。弦之间的相互作用,可以类比点粒子,用费曼图来表示。例如,图15.7展示了一个相互作用,其中两根闭弦结合形成一根闭弦。这有时被称为裤子图。粒子物理中的相互作用发生在点上,这些点对应于费曼图中粒子线交汇的顶点。这在极短长度尺度上会导致量子场论产生奇异的结果。相比之下,弦理论的费曼图处处光滑,这使得该理论的行为表现要好得多。当然,这只有在能够定义弦的量子理论时才成立,而这并非必然的结论。
当试图构建弦的量子理论时,会出现一些复杂情况。尽管可以写下包含某种对称性的经典理论,但有时在理论的量子版本中,这种对称性会丢失。当这种情况发生时,就称之为一个反常。如果丢失的对称性是规范对称性或洛伦兹(Lorentz)不变性,而这对理论的一致性至关重要,那么我们必须得出结论,该理论的一致量子版本并不存在。几乎所有人们考虑的弦理论都是这种情况。(由于反常而丢失的对称性是洛伦兹不变性。)
只有在具有临界维度数的时空中,才有可能存在一致且无反常的弦量子理论。在称为玻色弦的最简单理论中,时空的临界维度数是26,但该理论是纯玻色性的,不包含任何自旋1/2粒子,因此不被认为是现实的物理学候选理论。在包含玻色子和费米子的超对称弦理论中,临界时空维度是十。这种被称为超弦的理论,拥有描述真实世界粒子和力所需的所有要素,但十维时空的要求意味着,如果要用它来解释四维时空中的真实物理,那么必然存在六个我们通常无法察觉的额外空间维度。爱因斯坦(Einstein)

物理前沿
向我们展示引力决定了时空的几何形状。弦论学家们相信,以类似的方式,弦场塑造了弦在其中运动的背景时空。这决定了隐藏维度的形状,而这些额外维度控制着非引力相互作用所采取的形式。这有望为基本物理学提供一个完整的几何化方案。

弦论并不仅仅是一种引力理论。开弦的最低量子化振动模式是一种无质量的自旋为1的粒子,我们会将其视为光子。如果色荷附着在弦的端点上,那么这个理论就变得更加有趣了。此时,代表光子的不再是单一的零能量模式,理论中包含了多种对应于弦上不同荷组合的无质量自旋为1的粒子。这些粒子我们会认为是胶子。在临界维度中,弦论自动地包含了像QCD那样的杨–米尔斯(Yang–Mills)作用力的对称性。更准确地说,它包含了一种大统一理论的超对称版本。²

与普朗克能量 (m_P) 相比,已知的全部物理学都被视为低能物理。如果弦要描述既有的物理学,那么它必须通过弦的零能量态来描述。超弦的完整零能量态集合,在普通的4维时空中进行解释时,对应于无质量的自旋为0、1/2、1、3/2和2的粒子。唯一一种无质量自旋为2的粒子是引力子,它赋予了我们引力。无质量自旋为3/2的粒子,最多可以有八种类型,被称为引力微子。其中一个引力微子是引力子的超对称伙伴,它的存在意味着超弦的低能极限包含了超引力,即量子引力的超对称版本。无质量自旋为1的粒子是某种大统一理论(GUT)的交换玻色子。超弦还包含了无质量自旋为1/2的粒子,这是描述GUT的费米子(进而包括标准模型的费米子)所必需的,以及无质量自旋为0的粒子,这对于理论中包含希格斯玻色子是必要的。因此,弦论包含了描述低能物理所需的所有要素。

那么理论所要求的额外维度呢?

15.6.1 紧致化
弦论学家假设,六个额外的空间维度是紧致化了的,这意味着它们被卷曲得比我们所熟悉的三个宏观空间维度要小得多。它们如此微小,以至于我们完全察觉不到它们的空间广延。通常假设它们的尺寸与普朗克长度相当,这实在太小了,无法在实验室中探测它们的结构。然而,这些维度以何种精确方式卷曲,对于低能物理至关重要。弦可以缠绕在隐藏的维度上,这会影响弦的能量以及不同弦态之间的对称性。这意味着隐藏维度应该决定在粒子加速器中观测到的粒子谱,以及非引力的相互作用力的本质。弦论学家面临的挑战在于,证明弦紧致化能产生一个与观测相符的粒子谱。

大多数紧致化方案的出发点都是假设低能物理中超对称性的存在。如果超对称性得以保留,那么六个额外的维度必须形成一种被称为卡拉比–丘流形(Calabi–Yau manifold)的超曲面或流形。理论家们探索了可能的卡拉比–丘几何,希望找到一个唯一的……

² 即使在超弦的临界维度中,也只有两种可能的无反常GUT,即SO(32)理论和E8×E8理论。

一系列解决方案,它们类似于已有的物理学。已发现的一些紧致化方案,几乎能产生最小超对称标准模型,具有正确的对称群和正确数量的费米子代,但不幸的是,这些解远非唯一。6维卡拉比-丘(Calabi–Yau)流形尚未被分类,因此没人知道究竟有多少种。肯定有数千种,甚至可能有无穷多种。弦理论家无法求解弦方程以确定正确的真空态,所以他们不知道大自然会如何在无数可能性中做出选择。是什么让某一种流形比其他选项更适合宇宙的诞生?没人知道。存在一整片可能性的景观。事实上,解释大自然如何选择合适真空的问题被称为景观问题(landscape problem)。这使理论家们能否将弦理论的预测与可在实验室检验的物理对应起来,变得扑朔迷离。

弦理论有一些可能被大型强子对撞机(LHC)证实的普适预言。超对称性在没有弦理论的情况下也可能存在,但如果在LHC上发现它,将会鼓励弦理论家们相信,他们在自然定律结构中寻求更大对称性的方向是正确的,而由于超对称性在弦理论中如此自然地契合,任何超对称的迹象都会被视为对他们努力的证明。大多数紧致化方案都会在电弱力和强力之外引入额外的力。LHC上的物理学家正在寻找能传递这些力的新玻色子粒子。同样,即使没有弦理论,粒子物理学中也可能存在超出标准模型描述的力。额外的空间维度也可能在没有弦理论的情况下存在。在缺乏一个独特的、令人信服的理论时,就需要实验结果来指导未来的理论工作。

15.7 进一步阅读

量子力学诠释中的基本问题可参考:
J. 巴戈特(J. Baggott),《超越测量:现代物理学、哲学和量子力学的意义》(Beyond Measure: Modern Physics, Philosophy and the Meaning of Quantum Mechanics),牛津:牛津大学出版社,2004年。
J.S. 贝尔(J.S. Bell),《量子力学中的可言说与不可言说》(Speakable and Unspeakable in Quantum Mechanics)(第2版),剑桥:剑桥大学出版社,2004年。

孤子(包括斯格明子)的数学理论和物理应用,参见:
N. 曼顿(N. Manton) 和 P. 萨克利夫(P. Sutcliffe),《拓扑孤子》(Topological Solitons),剑桥:剑桥大学出版社,2004年。
T. 多索瓦(T. Dauxois) 和 M. 佩拉尔(M. Peyrard),《孤子物理学》(Physics of Solitons),剑桥:剑桥大学出版社,2006年。

弦理论的入门导论,参见:
B. 兹维巴赫(B. Zwiebach),《弦理论初级教程》(A First Course in String Theory),剑桥:剑桥大学出版社,2004年。