第1章拉格朗日量

@Charge , @Hey&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;#39;u and @胡大师

在这一章中，我们将会介绍经典力学中的拉格朗日量，并且解释为什么拉格朗日量适合用来描述量子场论。

1.1 费马原理

图1.1 一束光通过一块玻璃时的折射。光线走的路径是从A到B所需时间最少的的路径。

我们从光学研究的一个例子开始。如图1.1所示，考虑一条通过玻璃板的光线。当已知玻璃和空气的折射率时，空气/玻璃界面附近的光线弯曲可以使用著名的斯涅尔定律计算。斯涅耳定律以于1621年描述过的Willebrord Snellius的名字命名，但他不是第一个发现这条规律的，它在984年首先由阿拉伯数学家Ibn Sahl发现。1662年，皮埃尔·德·费马（Pierre de Fermat）提出了一种巧妙的推导斯涅尔定律的方法，这种方法基于他的最短时间原理（principle of least time）。这个原理认为通过两点 $A$ 和 $B$ 之间的光线采取的是光在最短时间内穿过的路径。由于光在玻璃中比在空气中更慢，光线穿过玻璃时与法线的夹角将会变小，从而使得在玻璃中的传播距离减小。如果光在 $A$ 、 $B$ 点之间以直线行走，所花费时间将会更长。这种说法非常优美，但是并没有解释为什么会这样；为什么光线愿意选择时间最短的路径？为什么光总是这么着急？

费马最小时间原理是漂亮的，看起来告诉了我们一些事情，但是一开始看它并不是有帮助的。因为它试图把一个简单的，可以带入数值计算出轨迹的公式（斯涅尔定律）替换为需要微积分变分原理才能解决的问题。但是我们将要看到，费马原理是理解量子场论的基础。

1.2 牛顿定律

图1.2：在时间间隔τ内，一个粒子从点A移动到点B，粒子的轨迹由牛顿运动定律确定。

在动力学中我们可以找到一个类似问题。考虑一个一维空间中质量为 $m$ 的物体，在力 $F$ 的作用下从点 $A$ 移动到点 $B$ ，如图1.2的时空图所示。这张图中，横轴表示时间，纵轴表示空间。粒子的精确轨迹 $x(t)$ 由牛顿运动定理给出：

$F=m \ddot{x} \\ 1.1$

我们可以对这个公式积分求出 $x(t)$ 。但是当你停下来仔细考虑的时候，你会发现这是一个对量子非常不友好的方法。牛顿运动方程的解告诉了我们从 $t=0$ 到 $t=τ$ 的每一个时刻粒子的位置。量子力学告诉我们你可以在 $t=0$ 时测量粒子的位置，发现它在 $A$ ；你可以在 $t=τ$ 时再次测量它，发现它在 $B$ ，但是你并不能确切知道在这两个时刻之间，粒子的确切位置。因此，这个可以通过解微分方程计算出 $x(t)$ 的方法不是一个好的出发点。

如果要将这个话题推广到量子力学，动力学需要以完全不同的方式表达。这正是Joseph-Louis Lagrange[1]和William Rowan Hamilton[2]所做的，尽管他们那时并不知道他们所做的事情会使动力学更具量子友好性。我们将采用一种与他们略有不同的方法，得到动能 $T$ 和势能 $V$ 在运动轨迹上是如何变化的最终答案。我们知道它们的求和，也就是总能量 $E = T + V$ ，在运动中必须是常数。但在轨迹中，动能和势能之间的平衡可能会发生变化。

我们可以写出轨迹中的平均动能 $\bar{T}$ ，

$\bar{T}=\frac{1}{\tau} \int_0^{\tau} \frac{1}{2}m[ \dot{x}(t)]^2 \ \mathrm{d}t \\1.2$

平均势能 $\bar{V}$ ：

$\bar{V}=\frac{1}{\tau} \int_0^{\tau} V[x(t) ]\ \mathrm{d}t \\1.3$

这两个量的求和一定等于总能量 $E$ 。但是，我们想考虑的是 $T$ 和 $V$ 如何在轨迹中变化。为了做到这一点，我们需要在下一节中学习一些数学。

1.3 泛函

方程1.2和1.3中的表达式是轨迹 $x(t)$ 的泛函。这是什么意思呢？

让我们回想一下函数（function）是什么（如图1.3），函数可以把一个数字转化为另一个数字。例如，函数 $f(x)= 3x^2$ 将数字1变为数字3，将数字3变为数字27。给函数一个数字，它将返回另一个数字。

泛函（functional）是一个将函数转换为数字的机器。你给这个机器一个完整函数，例如 $f(x)= x^2$ 或 $f(x)= \sin x$ ，它将返回一个数字。

例1.1
下面是一些泛函的例子。
1. 泛函 $F[f]$ 作用在函数 $f$ 上的规则如下：
$F[f]=\int_0^1f(x) \ \mathrm{d}x \\1.4$
因此，给定函数 $f(x)=x^2$ ，泛函返回的数字是
$F[f]=\int_0^1 x^2 \ \mathrm{d}x=\frac{1}{3} \\1.5$
2. 泛函 $G[f]$ 作用在函数 $f$ 上的规则是：
$G[f]=\int_{-a}^{a}5[f(x)]^2 \ \mathrm{d}x \\1.6$
所以，如果给定函数 $f(x)=x^2$ ，泛函返回的数字为：
$G[f]=\int_{-a}^{a}5x^4\ \mathrm{d}x=2a^5 \\1.7$
3. 函数本身也可以看做一个简单泛函。例子，可以定义泛函 $F_x[f]$ :
$F_x[f]=\int_{\infty}^{\infty}f(y) \delta(y-x) \mathrm{d}y=f(x)\\1.8$
这个泛函将会返回函数在 $x$ 处的函数值。

现在我们想知道，当你改变输入泛函的函数时，泛函的值将如何改变。这里重要的概念的是泛函微分（functional differentiation）。回忆函数微分的定义为：

$\frac{\mathrm{d}f}{\mathrm{d}x}=\lim_{\epsilon \rightarrow 0} \frac{f(x+\epsilon)-f(x)}{\epsilon} \\1.9$

函数的导数告诉你，当你改变进入函数机器的数 $x$ 一丁点时，函数 $f(x)$ 本身如何变化。同样的，我们可以定义泛函 $F[f]$ 的泛函导数（functional derivative）如下：

$\frac{\delta F}{\delta f(x)}=\lim_{\epsilon \rightarrow 0} \frac{F[f(x')+\epsilon \delta(x-x')]-F[f(x')]}{\epsilon} \\1.10$

泛函导数告诉我们当函数 $f(x)$ 改变时，泛函 $F[f(x)]$ 的返回值如何变化。

例1.2
下面是一些计算泛函导数的例子。你可以通过计算他们获得计算泛函导数的技能，当然如果你相信计算结果的话，也可以直接跳到下一部分。
1. 泛函 $I[f]=\int_{-1}^{1}f(x) \mathrm{d}x$ 的导数为：
$\begin{align} \frac{\delta I[f]}{\delta f(x_0)}&=\lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int_{-1}^{1}[ f(x) + \epsilon \delta(x-x_0)] \mathrm{d}x -\int_{-1}^{1}f(x) \mathrm{d}x \right] \\ &= \int_{-1}^1 \delta (x-x_0) \mathrm{d}x \\ &= \left\{ \array{1 & -1 \leq x_0 \leq 1\\0 & \rm{otherwise}} \right. \end{align} \\ 1.11$
2. 泛函 $J[f]=\int [f(y)]^p \phi (y) \mathrm{d}y$ 对 $f(x)$ 的导数为：
$\begin{align} \frac{\delta J[f]}{\delta f(x)}&=\lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int[ f(y) + \epsilon \delta(y-x)]^p \phi(y) \mathrm{d}y -\int_{-1}^{1}[f(y)]^p\phi(y) \mathrm{d}y \right] \\ &= p [f(x)]^{p-1} \phi(x) \\ \end{align} \\ 1.12$
3. 已知 $g$ 是一个函数，它的导数是 $g'= \mathrm{d} g/\mathrm{d} x$ ，同时定义泛函 $H[f]=\int_a^b g[f(x)] \mathrm{d}x$ ，此时，泛函的导数为：
$\begin{align} \frac{\delta H[f]}{\delta f(x_0)}&=\lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int g [ f(x) + \epsilon \delta(x-x_0)] \mathrm{d}x -\int g[f(x)] \mathrm{d}x \right] \end{align} \\ 1.13$
令 $f=f(x) + \epsilon \delta(x-x_0)$ ， $f_0=f(x)$ ，所以有
$g(f)=g(f_0)+(f-f_0)g'(f_0)+O(f^2)= g(f(x))+( f(x)+ \epsilon \delta(x-x_0)-f(x))g'(f(x))$
所以：
$\begin{align} \frac{\delta H[f]}{\delta f(x_0)}&=\lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int g [ f(x) + \epsilon \delta(x-x_0)] \mathrm{d}x -\int g[f(x)] \mathrm{d}x \right] \\ &= \lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int (g [ f(x) + \epsilon \delta(x-x_0)g'[f(x)]) \mathrm{d}x -\int g[f(x)] \mathrm{d}x \right] \\ &= \int \delta(x-x_0)g' [f(x)] \mathrm{d}x \\ &= g' [ f(x_0)] \end{align} \\ 1.13$
4. 使用上一个例子的结果，可以求出 $\bar V[x]=\frac{1}{\tau} \int_0^{\tau}V[x(t)] \mathrm{d}t$ 的导数为：
$\frac{ \delta \bar{V} [x]}{\delta x(t)}=\frac{1}{\tau} V' [x(t)] \mathrm{d}t\\1.14$
5. 定义泛函 $J[f]=\int g(f') \mathrm{d}y$ ，这里的 $f'=\mathrm{d}f/\mathrm{d}y$ 。所以有：
$\frac{\delta J[f]}{\delta f(x_0)} =\lim_{\epsilon \rightarrow 0} \frac{1}{\epsilon} \left[ \int \mathrm{d}y \ g \left( \frac{\partial }{\partial y} [f(y)+ \epsilon \delta ' (y-x)] \right) -\int \mathrm{d}y \ g \left( \frac{\partial f}{\partial y} \right) \right] \\1.15$
使用
$g \left ( \frac{\partial}{\partial y} [ f(y)+ \epsilon \delta(y-x)] \right)=g (f'+ \epsilon \delta '(y-x)) \approx g(f')+ \epsilon \delta '(y-x) \frac{ \mathrm{d} g(f')}{\mathrm{d} f} \\1.16$
然后使用分部积分，有：
$\frac{\delta J[f]}{\delta f(x)} = \int \mathrm{d}y \delta ' (y-x) \frac{ \mathrm{d} g(f')}{\mathrm{d} f}=\left [ \delta (y-x) \frac{ \mathrm{d} g(f')}{\mathrm{d} f} \right]- \int \delta (y-x)\frac{\mathrm{d}}{\mathrm{d}y} \left( \frac{ \mathrm{d} g(f')}{\mathrm{d} f} \right) \\1.17$
当 $x$ 在积分区间内时，中括号项等于0，我们得到：
$\frac{\delta J[f]}{\delta f(x)} = \frac{\mathrm{d} }{ \mathrm{d}x } \left( \frac{ \mathrm{d} g(f')}{\mathrm{d} f'} \right) \\1.18$
6. 对前面的结果，我们给出例子，如果 $F[\phi]=\int \left( \frac{\partial \phi}{\partial y} \right)^2\mathrm{d}y$ ，可以得到：[3]
$\frac{ \delta F[\phi]}{\delta \phi(x)}=-2 \frac{ \partial ^2\phi }{\partial x^2 } \\1.19$
7.另一个例子是，如果令 $\bar{T}=\frac{1}{\tau} \int_0^{\tau} \frac{1}{2}m[ \dot{x}(t)]^2 \ \mathrm{d}t$ ，我们有：
$\frac{ \delta \bar{T} [x]}{\delta (x)}=- \frac{ m \ddot{x} }{\tau } \\1.20$

1.4 拉格朗日量与最小作用量

在学习了这些数学之后，我们可以回到我们之前的叙述中来。当我们改变轨迹时，平均动能和平均势能如何变化？

公式1.14和公式1.20告诉我们：

$\frac{ \delta \bar{V} [x]}{\delta x(t)}=\frac{ V' [x(t)] }{\tau} , \ \ \ \ \frac{ \delta \bar{T} [x]}{\delta x(t)}=- \frac{ m \ddot{x} }{\tau } \\1.21$

事实上，牛顿定律告诉我们对经典粒子的轨迹，有 $m \ddot{x}=-\mathrm{d} V/ \mathrm{d}x$ 。这意味着，对粒子轨迹的变分，有：

$\frac{ \delta \bar{V} [x]}{\delta x(t)} = \frac{ \delta \bar{T} [x]}{\delta x(t)} \\1.21$

也就是说，如果你稍稍改变经典轨迹，平均动能和平均势能都会增加[4]相同的量。我们可以重新把这个公式重新写为：

$\frac{\delta}{\delta x(t)} ( \bar{T} [x]-\bar{V}[x])=0\\1.23$

也即，平均动能和平均势能的差对于经典的轨迹来说是处于极值点上的。这意味着动能和势能的差这个量很可能是有意义的，这启发我们定义一个量，也叫拉格朗日量（Lagrangian） $L$ ：

$\boxed {L=T-V}\\1.24$

拉格朗日量对时间的积分叫做作用量（action） $S$ ：

$S=\int_0^{\tau} L \mathrm{d}t \\1.25$
所以作用量的量纲为能量×时间，单位是焦耳-秒。这个单位与普朗克常数 $h$ 的单位相同。我们将在本章的后面看到，为什么用普朗克常数来度量 $S$ 是合理的。利用 $S=\int_o^{\tau}(T-V) \mathrm{d} t=\tau (\bar{T}[x]-\bar{V}[x])$ ，我们可以把将平均动能的变化和平均势能的变化联系起来的变分原理（公式1.23）写为更紧凑的形式：

$\boxed{\frac{\delta S}{\delta x(t)}=0} \\1.26$

这个公式被叫做哈密顿最小作用量原理（Hamilton’s principle of least action）[5]。它告诉我们，经典粒子走的轨迹的作用量取得极值（如图1.4所示）；改变粒子走过的轨迹只会增大作用量（同样的，改变由斯涅耳定律所确定的光线路径只会增加光走过的时间）。

例1.3
拉格朗日量 $L$ 可以写为位置和速度的函数。通常来讲，我们可以认为它依赖于一个广义坐标 $x(t)$ ，和这个广义坐标对应的广义速度 $\dot{x}(t)$ 。此时， $S$ 对 $x(t)$ 的变分 $\delta{S} / \delta x(t)$
可以写为：
$\begin{align} \frac{\delta S}{\delta x\left(t\right)}&= \frac{\delta\int_{0}^{\tau}{L\left(x\left(t\right),\dot{x}\left(t\right)\right)\mathrm{d} t}} {\delta x\left(t\right)}\\ &=\lim_{\epsilon\rightarrow0}{\frac{1}{\epsilon} \left\{\int_{0}^{\tau}{L\left(x\left(t^\prime\right)+\epsilon\delta\left(t-t^\prime\right), \frac{\mathrm{d} \left[x\left(t^\prime\right)+\epsilon\delta\left(t-t^\prime\right)\right]} {\mathrm{d}t^\prime}\right)\mathrm{d} t^\prime}-\int_{0}^{\tau}{L\left(x\left(t^\prime\right), \frac{\mathrm{d} x\left(t^\prime\right)}{\mathrm{d}t^\prime}\right)\mathrm{d} t^\prime}\right\}} \end{align}$
Let $u\equiv t^\prime$
$\begin{align} \frac{\delta S}{\delta x\left(t\right)}&= \lim_{\epsilon\rightarrow0}{\frac{1}{\epsilon}\int_{0}^{\tau} {\left\{L\left(x\left(u\right)+\epsilon\delta\left(t-u\right), \frac{\mathrm{d} \left[x\left(u\right)+\epsilon\delta\left(t-u\right)\right]}{\mathrm{d}u}\right) -L\left(x\left(u\right),\frac{\mathrm{d} x\left(u\right)}{\mathrm{d}u}\right)\right\}\mathrm{d} u}} \\ &=\lim_{\epsilon\rightarrow0}{\frac{1}{\epsilon}\int_{0}^{\tau}{\left\{L\left(x\left(u\right)+\epsilon\delta\left(t-u\right),\dot{x}\left(u\right)+\epsilon\delta^\prime\left(t-u\right)\right)-L\left(x\left(u\right),\dot{x}\left(u\right)\right)\right\}\mathrm{d} u}} \end{align}$
所以这个结果就等价与下面的全导数，
$\begin{align} \frac{\delta S}{\delta x(t)}&=\frac{\delta \int_0^{\tau} L \mathrm{d}t}{\delta x(t)} \\ &= \int \mathrm{d}u \left[ \frac{ \delta L}{\delta x (u)} \frac{ \delta x(u)}{\delta x(t)} + \frac{ \delta L}{\delta \dot{x} (u)} \frac{ \delta \dot{x}(u)}{\delta x(t)} \right] \\ &=\int \mathrm{d}u \left[ \frac{ \delta L}{\delta x (u)} \delta (u-t)+ \frac{ \delta L}{\delta \dot{x} (u)} \frac{\mathrm{d}}{\mathrm{d} t}\delta(u-t) \right] \\ &= \int \mathrm{d}u \left[ \frac{ \delta L}{\delta x (u)} \delta (u-t)\right]+ \int \mathrm{d}u \left[ \frac{ \delta L}{\delta \dot{x} (u)} \frac{\mathrm{d}}{\mathrm{d} t}\delta(u-t) \right] \end{align} \\1.27$
因为 $\mathrm{d}u=\frac{\mathrm{d}u}{\mathrm{d}t} \mathrm{d}t$
所以 $\int \mathrm{d}u \left[ \frac{ \delta L}{\delta \dot{x} (u)} \frac{\mathrm{d}}{\mathrm{d} t}\delta(u-t) \right]=\int \frac{\mathrm{d}u}{\mathrm{d}t} \frac{\delta L}{\delta \dot{x}(u)} \mathrm{d} \delta(u-t)$
对 $\int \frac{\mathrm{d}u}{\mathrm{d}t} \frac{\delta L}{\delta \dot{x}(u)} \mathrm{d} \delta(u-t)$ 应用分部积分有：
$\int \frac{\mathrm{d}u}{\mathrm{d}t} \frac{\delta L}{\delta \dot{x}(u)} \mathrm{d} \delta(u-t)=\left[ \delta(u-t) \frac{\mathrm{d}u}{\mathrm{d}t} \frac{\delta L}{\delta \dot{x} (u)} \right]_{t_i}^{t_f}-\int \delta(u-t) \mathrm{d} \left[ \frac{\delta L}{\delta \dot{x} (u) } \frac{\mathrm{d}u}{\mathrm{d}t} \right]$
所以最小作用量原理（公式1.26）可以改写为：
$\boxed{ \frac{ \delta L}{\delta x (t)}- \frac{ \mathrm{d}}{\mathrm{d}t} \frac{ \delta L}{\delta \dot{x}(t)}=0 }\\1.28$
这个方程也叫做欧拉-拉格朗日方程[6]（Euler–Lagrange equation）。

拉格朗日量 $L$ 与拉格朗日量密度 $\mathcal{L}$ 的关系为：

$L=\int \mathrm{d}x\mathcal{L} \\1.29$

所以作用量 $S$ 为：

$S=\int \mathrm{d}t L=\int \mathrm {d} t \ \mathrm{d}x \ \mathcal{L}\\1.30$
下面的例子介绍了引入拉氏量密度的原因。拉氏量密度的概念在后面将会很常见，它提供了一个推导经典波方程的好途径。

图1.5 绳子上的波。绳子与平衡位置的偏移是ψ(x, t)，我们可以把绳子当成长度为dx，质量为ρ dx的微元从而推导出运动方程。这幅图显示了一端被固定的绳子的一小段，所以有ψ(0, t)=ψ(l, t)。

例1.4
考虑质量为 $m$ 长度为 $l$ 的绳子上的波。定义质量密度为 $\rho =m/l$ ，张力为 $\mathcal{T}$ ，与平衡位置相比的位移为 $\psi (x,t)$ （如图1.5所示）。动能 $T$ 可以写为： $T=\frac{1}{2} \int_0^l \mathrm{d}x \rho ( \partial \psi/\partial t)^2$ ，势能可以写为： $V=\frac{1}{2} \int_0^l \mathrm{d}x \mathcal{T} ( \partial \psi/\partial x)^2$ 。所以作用量可以写为：
$S[ \psi(x,t)]=\int \mathrm{d}t (T-V)=\int \mathrm {d} t \ \mathrm{d}x \ \mathcal{L} \left( \psi, \frac{\partial \psi}{\partial t},\frac{\partial \psi}{\partial x} \right) \\1.31$
其中，
$\mathcal{L} \left( \psi, \frac{\partial \psi}{\partial t},\frac{\partial \psi}{\partial x} \right)= \frac{\ \rho}{2} \left( \frac{\partial \psi}{\partial t} \right)^2-\frac{\mathcal{T} }{2}\left( \frac{\partial \psi}{\partial x} \right)^2 \\1.32$
是拉氏量密度。应用变分原理，我们有：
$\begin{align} 0=\frac{\delta S}{\delta \psi }&= \frac{ \delta \mathcal{L}}{ \delta \psi}-\frac{ \mathrm{d} }{ \mathrm{d} x}\frac{ \delta \mathcal{L}}{ \partial( \partial \phi/\partial x)}-\frac{ \mathrm{d} }{ \mathrm{d} t}\frac{ \delta \mathcal{L}}{ \partial( \partial \phi/\partial t)} \\ &=0+ \mathcal{T} \frac{\partial ^2 \psi}{\partial x^2}- \rho \frac{\partial ^2 \psi}{\partial t^2} \end{align} \\1.33$
所以我们得到了波动方程， $\frac{\partial ^2 \psi}{\partial x^2}= \frac{1}{v^2} \frac{\partial ^2 \psi}{\partial t^2}$ ，并且很简单的得到了波速 $v=\sqrt{ \mathcal{T} / \rho}$ 。

最后，我们把欧拉拉格朗日方程用四矢量记号和爱因斯坦求和（见0.4节）的方式写出来。如果拉氏量密度 $\mathcal{L}$ 与函数 $\phi (x)$ 及它的导数[7] $\partial_\mu \phi$ 有关（ $x$ 是时空中的点），作用量 $S$ 可以写为：

$S= \int \mathrm{d}^4 x \mathcal{L}( \phi ,\partial_\mu \phi) \\1.34$

与公式1.27类似的，应用变分原理可以得到[8]：

$\boxed{ \frac{ \delta S}{\delta \phi}=\frac{ \partial \mathcal{L}}{ \partial \phi}- \partial_\mu \left( \frac{ \partial \mathcal{L} }{\partial (\partial_\mu \phi)} \right)=0 }\\1.35$

这是四矢量版本的欧拉拉格朗日方程。

例1.5
作为这部分内容的例子，我们来考虑这样一个情况，拉氏量密度为：
$\mathcal{L}= \frac{1}{2} ( \partial_\mu \phi)^2- \frac{1}{2} m^2 \phi^2 \\1.36$
这里的 $(\partial_\mu \phi)^2=(\partial_\mu \phi)(\partial^\mu \phi)$ 。通过计算简单的微分，我们得到：
$\frac{\partial \mathcal{L}}{\partial \phi}=-m^2 \phi \ \ \ \ 和 \ \ \ \ \frac{\partial \mathcal{L}}{\partial (\partial_\mu\phi)}=\partial^\mu \phi \\ 1.37$
应用最小作用量原理（公式1.35），我们有：
$\frac{ \delta S}{\delta \phi}= -m^2 \phi- \partial_\mu \partial^\mu \phi=0\\ 1.38$
也即：
$(\partial^2+m^2)\phi=0 \\1.38$

1.5 变分原理为什么有效？

在本章中，我们考虑了两个变分原理：费马最小时间原理和哈密顿最小作用量原理。其中一个描述了一道光线所经过的路径，另一个描述了经典粒子所采用的路径。它们非常优雅，但为什么不坚持使用斯涅耳定律和牛顿定律？以及，为什么这两种描述都有效？

这两个问题的答案都是量子力学。我们将会在书的后面更详细地谈论这一问题，但是从 $A$ 到 $B$ 运动的粒子（光子或台球）将会涉及所有可能的（all possible paths）路径，包含真实走过的的经典路径和完全疯狂的路径。你需要对所有的路径都求和，但每条路径都对应一个相位因子，并且对于大多数路径集合，不同的相位因子互相抵消。只有当某条路径的相位取得极值时，它附近的路径不会完全相消。粒子波函数的相位因子[9]为：

$e^{i S / \hbar} \\1.39$

这里的 $S=\int L \mathrm{d} t$ 是作用量，因此取极值的相位等价于一个取极值的作用量（公式1.26）。（我们对能量为 $E$ 的光子反向应用这个结论，光子的相位因子为 $e^{-iEt/ \hbar}$ ，因此取极值的相位等价于取极值的时间，与费马原理完全等价。）我们将在本书的后半部分看到这种方法如何自然地推导出费曼的路径积分方法（第23章）。但就目前而言，请注意，只有当作用量取得极值，所有通过最小化作用量得到的经典路径才可以会被观察到，其他一切都互相抵消。

斯涅尔定律和牛顿定律足以解决经典系统。但两者都无法推广到量子系统。因此，为了建立量子场论（本书的宏伟目标），我们必须从拉格朗日的图像开始。下一步是了解非经典系统（non-classical systems）中发生的事情，在下一章中，我们将把注意力转向一个典型的量子系统：谐振子。

本章总结：

费马最小时间原理描述了光走的路径是时间最短的。
经典粒子的拉格朗日量可以写为： $L=T-V$
经典力学可以用哈密顿最小作用量原理

$\frac{\delta S}{\delta x(t)}=0 \\1.40$

描述，这里的 $S= \int L \mathrm{d}t$ 是作用量。

费马原理和哈密顿原理都展示了光子或有质量的粒子的经典轨迹都对对应着波函数的相位取得极值。

[1]：J.-L. Lagrange (1736–1813) 是一位在意大利出生的法国数学家和物理学家。

[2]：W. R. Hamilton (1805–1865) 是一位爱尔兰数学家和物理学家。

[3]：公式1.19可以很轻松的推广到三维，在三维下如果 $I=\int ( \nabla \phi )^2 \mathrm{d}^3 x$ ，我们有： $\frac{ \delta I }{\delta \phi}=-2 \nabla ^2 \phi$

[4]：如果经典的轨迹处于最大值而不是最小值时，也可能会减少相同的量，但这种情况并不经常遇到。

[5]：如果我们仔细扣字眼的话，这个原理只能告诉我们作用量取得极值。它可以是最大值，马鞍点，也可能是最小值。叫“极值作用量原理”会比叫“最小作用量原理”更好。但是我们也不得不接受这个名字，最小作用量原理。

[6]：Leonhard Euler (1707–1783). In the words of Pierre-Simon Laplace (1749–1827): Read Euler, read Euler, he is the master of us all.

[7]: 回忆0.4节公式0.2提到，四导数算符的指标天生就写在下面。

[8]：注意，这里我们使用了爱因斯坦指标求和，两次重复出现的指标自动求和。公式1.35只是公式1.27和公式1.28的四维推广。

[9]：费马最小时间原理告诉了我们一束光线所走过的光程的初始和结束时的相位差。与经典力学的哈密顿最小作用量原理类似，我们可以假定作用量 $S$ 等于一个常数乘以波函数的相位。我们把这个常数用符号 $\hbar$ 给出。因为我们可以认为相位是 $S / \hbar$ 。

Content Created: 2018年10月2日

Last updated：2018年10月3日

来源：知乎 www.zhihu.com

作者：Charge

【知乎日报】千万用户的选择，做朋友圈里的新鲜事分享大牛。
点击下载