来简单说一下当前可以确认的理论物理的高度。我们最早的理论物理是为实验服务的。在那个年代,我们依然处于做大量的实验,然后总结规律的阶段。所以在这一阶段涌现出了一系列比较初等的定律,比如
- 热力学第n定律
- Snell 定律(光的折射定律)
- 万有引力定律
- Coulomb 定律(静电相互作用)
- Faraday 定律 (电磁感应定律)
等等。这个时候物理学理论和其它任何科学分支的理论没有本质上的差别。
后来,我们开始发现不同的定律之间有一些相同之处,尤其是发现电学和磁学之间的巨大相似性,进而发现原来电和磁是同一样东西。于是我们开始做抽象,把电学和磁学(以及一部分波动光学)的规律都吸收到了一套理论中,这就是 Maxwell 的电磁理论。这一阶段的画风是这样的
- 一切电磁相关的现象均可被 Maxwell 电磁理论描述
- 一切引力相关的现象均可被 Einstein 引力理论描述
- 一切热学相关的现象均可被 统计理论描述
…………
再接下来,我们还发现不同的理论之间还有一些相同之处。于是我们开始了进一步的抽象,创造了所谓的 theory generator,或者说是一种通用的,用于生产理论的方法。典型的案例包括 Lagrange 动力学,Hamiltonian 力学等等。这一阶段的画风是这样的
一切经典理论均可由如下原理生成:
这里面 是作用量, 被称为 Lagrangian。为了得到 Maxwell 电磁理论,你只需要 ,为了得到广义相对论,你只需要 。是的,你只要指定一个 Lagrangian,然后上述原理就可以自动给你生成一个理论。
这看上去好像用处不是非常大。事实上在牛顿那个年代之后不久,这种方法的雏形就已经出现了。不过真正让它焕发光彩的是 1918 年(正好100年前)的一件大事:著名数学物理学家 Emmy Noether 提出了 Noether 定理,这一定理利用上述原理证明了 Lagrangian 的对称性可以导致守恒量。
这是非常强大的一条数学定理。要知道,物理学的对称性几乎就等同于普适性,而普适性是一套理论作为科学理论的底线级要求。所以,这条定理几乎就是在说任何物理理论里均存在守恒量,并且只要你写出 Lagrangian,我们就能用一套标准流程把这些守恒量找出来!
一个重要的例子就是能量。能量是与时间对称性绑定的一个守恒量,或者换句话说,我们会把能量定义为与时间对称性相关联的那个守恒量。更具体一点,我们写出一个具有时间对称性的 Lagrangian,Noether 定理就能给出一个对应的守恒量,而这个量就被定义为能量。自此,能量守恒便不再是所谓的经验定律,而是一条有严格证明的定理。
除了上述的两个经典的 theory generator,现在我们熟知的量子力学(当然你得把 Schroedinger 方程写成 这样的抽象形式),量子场论,以及曾经火过两回的弦理论,都是 theory generators。它们当中都有类似于 Lagrangian 或 Hamiltonian 这一类的抽象的量,在给定这些量的情况下,就自动生成理论。
总结来说,我们最早根据实验得到了一些定律,然后发现定律之间有共同点,于是把这些定律抽象成了理论,然后又发现理论之间也有共同点,于是又抽象成了 theory generator。反过来,给定 theory generator 里面所需要的量,它就会自动给我们生成理论,将理论应用于不同的情景,我们又可以获得具体的一些定律。
其实现在 theory generators 的威力还远不止于此。不过这已经涉及到目前最前沿的理论物理。你点个赞,我看看要不要继续写。
感谢大家的热情,那我更一波。不过这些内容可能就未必像之前那么好懂,也未必如 Noether 定理一般精彩,不过我会尽量写得通俗易懂一些。
一般的 Lagrangian 是某个动力学变量(比如粒子的位置 或者某个场 )以及它的导数(比如速度 或者场的梯度 )的函数。我们通常把含导数的项称为动能项,其余的称为势能项。
先来看动能项。我们发现无论是哪一种理论,动能项往往能够被写成一阶导数的平方,比如通常经典力学里的动能项 就是速度的平方,再比如标量场的动能项 也是一阶导数的平方。个别例子中有出现仅仅是一阶导数,没有平方,比如 Dirac 场的动能项。不过无论如何,我们基本没有见过动能项中含有超过两个求导算子的情况。这并不是偶然,因为如果动能项中含有超过两个求导算子,就会造成一种被称为 Ostrogradsky Instability 的现象。
具体来说,就是这样的理论会允许物理系统可以有一直到负无穷的能量。为了理解这一点,我们需要 Hamiltonian。Hamiltonian 是 Lagrangian 经过一个简单的变换生成的,它的主要作用是告诉你这个系统的能量可以取哪些值。举个例子,一个经典的自由粒子的 Hamiltonian 是 ,其中 是动量, 是质量。动量可以从 一直取到 ,此时 Hamiltonian 可以取 ,也就告诉你自由粒子的能量一定是 的。
但是如果你的 Lagrangian 中含有超过两个求导算子,那么我们可以证明,Hamiltonian 会出现如下的形式
其中 是某种动量(术语上叫广义动量), 是某个坐标。这个时候我们发现如果 可以随意在 中取值,那么 Hamiltonian 的范围也是 。这就造成了一个严重的问题,如果能量没有下界,那么这个系统(或者其中一部分)就会无止境地向能量较低的状态去演化,从而造成强烈的不稳定性,这是不可接受的。
因此,现在主流的基本理论都只含有两个一下的求导算子。含超过两个求导算子的理论其实也存在,比如用于解决某些特定问题的宇宙学模型。不过在这种情况下,我们会被迫引入一系列约束条件来消除 Ostrogradsky instability。如果你希望你的理论具有一定的普适性,这么做其实得不偿失。不过针对某些特定问题有时候还是有点用。
再来看势能项。势能项只包含我们的动力学变量(比如坐标 或者某个场 ),因此我们可以将其进行展开(类似于微积分里面的 Taylor 展开)。展开之后具有幂级数的形式
每一个 之前都会有一个系数 ,这个系数控制了对应的相互作用的强度。比如,我们知道弹簧系统的势能项是
这并不意味着其它的项前面的系数都是0,它们可能只是很小,从而使得相应的相互作用很弱因而被忽略。
这个系数的量纲是一个很值得说道的东西。在这之前我们需要知道自然单位制,没见过的同学看文末[1]。在量子场论中,这个系数并不是标准的“常数”,而是一个会随系统能标(可以是系统总能量,或者其中某个实体的能量)而变化的一个量。也就是说,相互作用的强度会随着能标而变化。
如果某个项的系数具有正的质量量纲,比如标量场论中,系数是 ,质量量纲是+2,那么它的强度会随着能标的下降而上升,这种项被称为 relevant;反过来,如果系数具有负的质量量纲,比如引力常量 ,那么它的强度会随着能标的下降而下降,这种项被称为 irrelevant。而没有量纲的被称为 marginal。
这个事情有什么用呢?通常情况下我们的能标是较低的,至少我们目前还不能做到让一个系统达到任意能标。在较低能标的情况下,所有 relevant 的项具有较高的强度,所有 irrelevant 的项具有较低的强度。因此我们只需要考虑 relevant 的项即可。
在场论中,Lagrangian 的量纲是+4,标量场 是+1,因此 的项就是 marginal 了, 及以上就是 irrelevant 了。于是低能情况下我们只需要考虑至多3个项。这个结论对于很多理论均适用,也即 relevant 的项总是有限个,因此低能下只需要考虑有限个势能项。
所以这是不是意味着我们通常是见不到这些 irrelevant 的项的作用呢?并不是。在高能标下,一切都要倒过来,也即 relevant 项会很弱,而 irrelevant 项很强。要获得高能标,除了注入能量以外还可以注入质量。所以在注入足够多质量以后,我们发现了 irrelevant 项的作用 —— 这就是引力。引力相互作用的系数是引力常量 ,具有负的质量量纲。
就先讲这么多,希望大家可以感受到现代理论物理工具的强大。通过 theory generators,我们可以高屋建瓴地做一些判断,可以得到一些对许多理论都适用的结论。我们不需要知道Lagrangian 太多的细节,就可以根据 Noether 定理断言守恒量的存在。对于量子场论甚至弦理论这样的 generators 也一样。我们现在对弦理论依然知之甚少,不过已经足以让我们推测量子引力和量子纠缠很可能是一回事(所谓的 ER=EPR)。我们可以对 Lagrangian 进行细致的分析,从而判断出怎样的形式会带来怎样的结果。因此,对于现在的理论物理学家来说,与其说我们是在从现实中寻找规律从而创立理论,不如说我们在尝试设计一些理论。正如我们提到的,Lagrangian 不是可以随便写的,否则就要出问题。这些探索的经验让我们知道,这个自然界之所有有这些规律,这些规律之所以是这些形式,都是有更深层次的原因的。这也是为什么理论物理吸引了如此多的顶级智力为之工作。
[1] 在自然单位制下, 。也就是说,我们把长度单位定义为光在1秒内走过的距离,这样光速的值就是1。这样一来我们有 ,也就是说从量纲角度上讲,长度和时间的量纲是一样的。同理根据 我们有 。这个故事就是告诉你长度,时间,质量三个量纲,现在我们只需要一个,这里我们选质量。
来源:知乎 www.zhihu.com
作者:影转细枫
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 61 个回答,查看全部。