解构与复原:望月新一与他的证明

fukugen

復原

在伊万·费先科(Ivan Fesenko)的“科普”文章里提到,在关于望月新一证明的讨论中,有一个词经常被提到,就是“復原”。在望月新一构建的崭新数学体系中,他将同时附着在“数字”之上的加法结构和乘法结构拆开,将两者各自变形,然后重新“復原”。这种做法,先从根本上消解,之后再““復原”,即使对于久经抽象推理沙场的数学家而言也相当奇怪。而望月新一的体系,正系于这种“復原”的可行性。

如果他的体系是正确的,如果他的“復原”是成功的,这将带来数学中代数几何分支的变革。比如说,ABC猜想的证明。比如说,最终理解加法和乘法之间的关系。但现在,没多少数学家能读懂他的证明。无论证明是对是错,也许数学界,至少是代数几何,恐怕难以复原为以前的面貌。他的体系,他的证明,已经将数学家拆开成不同的阵营,阵营内部不断发酵变化,引出了新的分歧。即使最后尘埃落定,得到的恐怕也只是望月新一式的“復原”。

但这就是数学前进的必经之路。

破题

望月新一的研究领域,是所谓的“远阿贝尔几何学”。如果只能用几十字解释这个领域的话,我只能这样写:

远阿贝尔几何学研究的是,有理数的绝对伽罗华群,以至任意代数簇的平展基本群,它们“远离阿贝尔”的部分,也就是不符合交换律ab=ba的部分,会如何影响相应代数结构的性质。

看不懂?很正常。要解释这个领域研究的是什么,可能需要整整一篇文章(请参看《小朋友的涂鸦(四):一个规划的大纲》),还不一定能解释清楚。而为了写这篇文章,还要找一个远阿贝尔几何的专家,而不是像我这样搞组合数学的人。

是的,对于望月新一的体系,我,这篇大部分人很可能读不懂的文章的作者,只理解一点最基础的皮毛。对于一般人来说,我似乎是内行,但在数学界内部,我属于吃瓜群众。所以,如果真正的内行看到我写错了东西,请多多包涵。

但面对这个体系,很多数学家的境况并不比我好得多。包括菲尔兹奖得主陶哲轩,包括望月新一的恩师法尔廷斯,他们都抱怨望月新一的证明太简略太难懂。现在,据说懂得整个证明的,除了望月新一之外,只有十几个人,大部分在日本,其他在美国和法国。

大部分数学家,和这十几个人,就是目前的两个阵营。

抽象的极致

望月新一的体系,名为“宇宙際Teichmüller理論”(inter-universal Teichmüller theory),简称IUTT,有时候也省略对应“理论”的T,写成IUT。

他并没有特意发明这个略显中二气息的名字,这锅要由代数几何的先驱格罗滕迪克(Grothendieck)来背,是他发明了Grothendieck universe这个数学对象。而这个术语可能还要追溯到更久远的集合论先驱,因为它对应着集合论中“所有集合组成的一堆东西”这个概念。是的,所有集合不构成一个集合,只能说成“一堆东西”,或者用“类”这个术语。幸好,中文的翻译“全类”没有那么中二。用上这个翻译的话,中文可以写成“跨全类Teichmüller理论”。但为了原汁原味起见,我们后面还是用“宇宙”这个术语。因为,另一个universe的数学,总有些不一样。

我们从他此前研究的最最基础的结构,p进整数,谈起。

p进整数是什么?对于数学家来说最快捷易懂的定义,就是:

对于素数p,\( (\mathbb{Z}/p^n\mathbb{Z})_{n \geq 1} \)的投影极限

我第一次看到这个定义时,一下子就读懂了。这对数学家来说的确是好懂的定义,但对一般人就像外星语言。

绝望了?这就是我读望月新一的论文时,从第三页开始的感受,六百多页之中的第三页。

但p进整数毕竟没那么复杂,下面我试着解释一下。首先,我们来看一个p进整数的例子,取p=7,那么下面这几个数都是p进整数:

……00000000000000000042
……30211045064302335342
……12450124501245012450

是的,你没有看错,省略号在前面。每个p进整数,都可以看成一串向左边高位延伸至无穷的数。但它们并不是无穷,它们每个数都不相同,而这种写法是有意义的。

在p进整数上,可以定义加法和乘法。这里我们可以松一口气,因为它们的计算方式跟我们熟悉的一样(需要模p),从低位开始,然后慢慢进位计算,就像是永远做不完的加法和乘法。减法和除法同样由此定义。所以,p进整数跟我们熟悉的整数一样,都有四则运算。每个整数都对应一个p进整数,只消在整数的p进制表达式前面加上无穷个0,而它们的运算结果也与我们熟悉的运算别无二致。

奇怪的事情现在才开始。

1/5=0.2,显然不是整数。但它是一个7进整数:

1/5 = ……5412541254125412

震惊!图片来自pixabay

震惊!图片来自pixabay

实际上,只要一个p进整数x个位不是0,那么它的倒数也是一个p进整数。可以求倒数这一点非常重要,这意味着p进整数,或者它的推广p进数中,拥有完整的加法和乘法结构。

奇怪的事情到这里还没有完。

我们可以定义p进整数的“绝对值”,或者说“大小”。我们来看看在p进整数中,几个自然数的绝对值。我们还是取p=7为例子。

0的绝对值是0,简直必然。

1的绝对值是1,没有问题。

2的绝对值是1……等等,发生了什么事?

什么鬼……图片来自flickr | Denise Mattox

什么鬼……图片来自flickr | Denise Mattox

3、4、5、6,它们的绝对值都是1。

7(也就是七进制的10)的绝对值是1/7,突然变小了。

8(也就是七进制的11)的绝对值是1,又回来了。接下来9、10、11、12、13的绝对值都是1。14(也就是七进制的20)的绝对值又变成了1/7。

就这样,如果不是7的倍数,绝对值就是1;如果是7的倍数,绝对值就是1/7。一直到49(也就是七进制的100),它的绝对值变成了1/49。加上一的50,它的绝对值又是1。

简单来说,对于p进整数,从个位开始有几个0,它的绝对值就是p的几次方分之一。对于p的幂,次数越高,数字越大,“绝对值”反而越小。

根据这个奇怪的“绝对值”,我们可以将所有p进整数看成一个空间,它的结构由这个“绝对值”,也就是两点之间的距离给出。但这是个怪异的空间:每个三角形都是锐角等腰三角形,而如果取一个球体的话,球体中每一个点都是球心。

p进数,图片来自Wikipedia

p进数,图片来自Wikipedia

p进数拓扑结构的图示,来自Wikipedia

p进数拓扑结构的图示,来自Wikipedia

一个自然的疑问是:这都是什么玩意儿???

有这种疑问很正常,因为这属于抽象而反直觉的数学。但对于数学工作者来说,这种绝对值的定义,恰好呼应了p进整数本身的定义。如果明白一开始那个一句话定义,那么现在这个“绝对值”的概念,就会显得顺理成章,甚至非此不可。这就是对数学概念的理解程度所导致的偏差。初看似乎不明就里的数学概念,一旦掌握了正确的思维方法,就会变得浅显易懂。

但这又谈何容易!数学是如此抽象,必须经过多年的学习,慢慢熟习它的思考方式,才能理解它的内容。

p进整数,以及它的推广p进数,不仅在望月新一以往的工作出现,事实上,它早已是数论中常用的工具。当年怀尔斯对费马大定理的证明也用到了p进数。望月新一此前发展的p进Teichmüller理论,则完全基于p进数,但p进数本身在这个理论中的地位,相当于高考数学中的自然数,只是最基础的砖石。

而望月新一的新理论,“宇宙際Teichmüller理論”,又是另一个层次。他觉察到,用p进数构建的理论仍然不足以抓住他想要研究的那个数论结构,于是他另辟蹊径,找到一个已经证明必定能抓住那个结构的数学对象,然后构建起新的数学理论,研究这个对象的性质,从而导出他寻找的性质。这大体就是宇宙际Teichmüller理论的发展动机之一。

要构建这样的理论,需要同时用到远阿贝尔几何与表示论的工具,然而这两者格格不入,难以调和。为了折中,望月新一需要将理论的基底,也就是最基本的运算,拆成加法和乘法两部分,将它们消解为更复杂更抽象的结构,通过这些结构的互动和变形得到想要的性质,最后证明这些结构能够重新“復原”成某种加法和乘法。在互动和变形的过程中,他要在不同的宇宙(universe、全类)间游走,才能得到足够广泛而一般的结论。加法和乘法结合起来会碰到的障碍,对于它们消解而成的结构却不成问题,当然前提是通过恰当的变形,就像不同坐标系之间的变换。这就是为什么望月新一要将他的理论称为“宇宙際Teichmüller理論”。顺带一提,消解后的加法和乘法面目全非,不像通常的加法和乘法那样基于同一套“数字”,而是形同陌路,望月新一的术语alien ring structure就由此而来。这里的alien,并不是什么“外星”的意思,而是取拉丁语alienus的原意“属于他人、非自身、外来、奇怪”之义。很多地方写的什么“外星算术全纯结构”(alien arithmetic holomorphic structure),都曲解了望月新一的本义。

看不懂?很正常。上面对望月新一理论的描述,来自我查阅相关资料后的总结。但要知道,我主要的研究领域是组合数学,虽然跟通常的Teichmüller理论有那么一丁点关系,但对于一般的代数几何,我也没有正式学习过,只是通过闲谈和阅读懂得些皮毛。望月新一的资料,我只能抓住其中只言片语,描绘大体的图景。

这就是现代的数学,它研究的内容如此广泛如此深入,一个分支上的数学家已经难以理解另一个分支的前沿,更何况是代数几何这一最抽象的领域中耕耘的人特别少的分支远阿贝尔几何,它的最前沿的推广呢?更何况这个理论是如此抽象,处理的又是如此根本的数学结果。可以说,拥有足够的知识储备,有充足时间能够理解并审查望月新一理论的数学家,即使不能说屈指可数,也很可能不超过100人,这还是相当乐观的估计。

望月新一本人这样说过,他的理论在数学界的处境,就像数学本身在整个社会中的处境:过于抽象,以至于人们不愿意去钻研和理解。

争议与迭代

一个新的证明或者理论体系,给数学界带来重大影响,这并不是第一次。

大卫·希尔伯特,图片来自Wikipedia

大卫·希尔伯特,图片来自Wikipedia

希尔伯特,就是那个提出20世纪的23个数学问题的著名数学家,他的成名之作,那篇“终结了不变量理论”的论文,在当时就引起了巨大的争议。此前,不变量理论的大多数进展都基于具体的计算,需要给出具体的结果。这样的证明又叫构造性证明。但希尔伯特的证明不属此列,而分属“存在性证明”,能断言某个数学对象的确存在,但对于如何计算却绝口不提。他一开始投稿恰好碰上了当时的“不变量之王”哥尔丹。哥尔丹对这样的证明颇有微词,他的退稿评价是:

这不是数学,这是神学。

但最终希尔伯特幸得克莱因的保荐(“这无疑是这本杂志发表过有关一般代数的最重要的工作”),论文得以发表。正因为无需具体给出构造,存在性证明要比构造性证明要更为简洁有力,也因此逐渐被广泛接受。即使是一开始拒稿的哥尔丹,最后也承认了希尔伯特的工作,“即使是神学也有其价值”。希尔伯特之后也因为公理化的工作以及其他数学成就,跻身当时数学界的顶尖。

另一位为数学界作出巨大贡献的德国数学家康托尔,他的命运却大不相同。在研究傅里叶分析时,康托尔领会到无穷之后仍有无穷的无穷。他从最基础的集合论开始,建立了一个全新体系,描述了超越无穷的无穷,也就是超穷。集合论中的很多基础结果,就出自他的手笔。

格奥尔格·康托尔。图片来自Wikipedia

格奥尔格·康托尔。图片来自Wikipedia

但他的研究甫一发表,就遭到许多顶尖数学家的攻讦。庞加莱说他的想法就像“严重的疾病”,正在感染数学这一学科。当时执德国数学界牛耳的克罗内克,公开反对康托尔关于超穷的理论,甚至到达了人身攻击的地步。他称康托尔为“科学骗子”、“背叛者”、“腐蚀了青年”,近乎偏执地指责着康托尔和他的理论。

但数学毕竟是数学。经过曲折发展之后,集合论成为了现代数学的基础,成了数学系学生的必修课。正是希尔伯特作出了这样的断言:

身处康托尔跟我们一道展开的天堂内,我们屏息于惊叹之中,知道无人能将我们由此驱逐。

但康托尔本人的命运,却远没有那么光明。也许是因为得不到理解,也许是因为这些无休止的攻击,康托尔患上了抑郁症,一直没有痊愈。他的晚年恰逢第一次世界大战,贫困加剧了战争带来的饥谨。心脏病给他的最后一击,也许是种解脱。

一个人的命运,即使有再多的自我奋斗,始终逃不出历史的进程。领头人的个人好恶,足以令一个人万劫不复。即使他的理论被广泛接受,在生前领受过荣耀,也不过如此。

亚历山大·格罗滕迪克

亚历山大·格罗滕迪克,图片来自上沃尔法赫数学研究所(Mathematisches Forschungsinstitut Oberwolfach)

格罗滕迪克的遭遇,处于康托尔和希尔伯特之间。他的数学风格高度抽象,但却能得出实际的结果。引用我之前写的文字

他谈论的数学实在过于抽象,难以理解。但这就是格罗滕迪克做数学的风格:尽可能从数学对象中将不必要的细节抽象出来,抽象得一般的数学家都会以为剩下的只有“虚空”,然而他仍然能从“虚空”中抓住某些东西,从而建立他的理论,完成他的证明。用格罗滕迪克本人的说法,如果把数学问题比作坚果,大部分数学家做的就是用锤子和凿子把坚果凿开,而他的做法则是将坚果浸在水里,慢慢软化它的外壳,又或者让它经受风吹日晒,然后等待合适的时机,坚果自然就会裂开。

对于大部分数学家来说,这个过程太漫长,也许只有拥有深刻洞察力的格罗滕迪克,才能在能接受的时间内,用这种方法解决问题。这也是他的数学难以被理解的原因之一:他几乎不考虑具体的示例,都是从尽可能抽象的角度出发,思考支配某个数学问题背后的宏大数学结构。有时候这也会闹出笑话。有一次讨论数学的时候,有人向格罗滕迪克提议考虑一个特定的质数作为例子。“你的意思是找一个真实的数字?”格罗滕迪克有点疑惑。对方点了点头。他回答:“好吧,我们考虑57这个质数。”57当然不是质数,但格罗滕迪克大概没有注意这一点,他从来不考虑具体的例子,一切从抽象出发。

格罗滕迪克的这种风格,让他年纪轻轻就全套改写了代数几何所用的数学语言,给这个领域带来了全新的抽象思维方式,让代数几何成为数学中可能是最抽象最深奥但也最有力量的分支。

但在他提出所谓的“标准猜想”之后,情况悄然改变。格罗滕迪克提出这一系列猜想,是为了阐明某些非常深层次的算术结构的存在性,一旦这些猜想得到证明,许多数论中的猜想,比如韦尔猜想,也能得到解决。不幸的是,由于标准猜想本身过于抽象,处理的问题过于广泛,所以久攻不下。雪上加霜的是,他的学生德利涅绕过了标准猜想,取道更“经典”也没那么抽象的技巧完成了最后一个韦尔猜想的证明。这就使很多人的注意力从标准猜想上移开,他之后写出的研究纲领也应者寥寥。最后,他慢慢隐退到比利牛斯山脉之下,在前不久成为了历史。

但格罗滕迪克毕竟留下了庞大的数学遗产。他编写的EGA和SGA是代数几何的入门宝典,他的定理和想法,尤其是标准猜想,仍然留在众多代数几何学者的心头。

当然,新理论新证明被彻底摧毁的例子也比比皆是。在2004年,美国数学家路易·德·布朗奇(Louis de Branges)在自己的个人页面上贴出了一篇124页的论文,声称利用自己发展的基于希尔伯特空间的一套体系,证明了数论中最引人注目的黎曼猜想,跟望月新一的情况相当相似。因为德·布朗奇此前曾证明另一个著名猜想——比伯巴赫猜想(Bieberbach conjecture),所以也有人关注他的证明。但直至现在,论文经过多次修改,似乎仍然站不住脚。目前数学界普遍认为他并未能证明黎曼猜想。

不停有人提出新的想法,即使一开始不被接受,历经时间洗练,终将得到应有的评价,而数学也就此进步。虽然提出新想法的人,他们各自有需要承受的命运,不以他们的贡献为转移。这就是数学史。

而望月新一的理论,就是在当下展开的历史。他的理论是对是错,只能拭目以待。

理论的渗流

闻道有先后,术业有专攻。

新理论总有个渗透的过程,即使是相应领域的专家,也不可能一下子全部理解。而现代数学高度专业化的体系,更使不同分支的数学家难以相互理解。望月新一之前耕耘于代数几何中的远阿贝尔几何,但代数几何方向甚多,而远阿贝尔几何又是一个少人问津的领域,能评判望月新一工作的专家,不消说是少之又少。雪上加霜的是,望月新一这次提出的新理论不仅仅是远阿贝尔几何,而是它的延伸,再加上高度的抽象性和庞大的页数,足以令一部分专家望而却步。

但新理论的确有其吸引力。望月新一本人在代数几何这个领域早已名声在外,他在1996年就证明了格罗滕迪克提出的一个有关远阿贝尔几何的猜想,还因此被邀请在1998年的国际数学家大会上作45分钟演讲。既然他之前的工作证明了他有如此能力,那么他的新工作当然也值得认真对待。何况,望月新一宣称他的新理论能够用于证明数论中悬而未决的ABC猜想,这就更让人期待了。

有些数学家被新理论所吸引,花了大量时间研读,自觉理解了箇中真谛,成为了为新理论摇旗呐喊的人。

有些数学家同样被新理论说吸引,花了大量时间研读,但感觉还是解释不清,难以理解。

有些数学家对新理论有兴趣,但没有时间研读,只能交给别的专家。

有些数学家不懂这个分支,只能围观。

望月新一的“宇宙際Teichmüller理論”(IUTT),就这样将数学界分成了两大阵营:觉得自己读懂的,还有觉得自己没懂的。围观群众不在此列。

觉得自己读懂了的数学家,他们在积极地宣传这个理论,想让更多的人理解它。伊万·费先科也是其中一员。近年来,在世界各地召开了数次讨论IUTT的研讨会,费先科有不少牵线搭桥之功。他和其他数学家也撰写了不少介绍IUTT的文章和综述,试图用不同的视角来讲述这个理论。

觉得自己没有读懂的数学家,有的仍在努力研读,有的尝试用自己知道的数学方法来从侧面验证IUTT的正确性;也有的已经放弃,转而对IUTT的正确性产生了怀疑。

每个新理论都会经历这个阶段,这个等待验证的阶段。只有经过这个阶段,等到大部分专家接受它的正确性,新理论才算是正式确立,数学也得以进步。

只是,对于IUTT来说,这个阶段似乎太长了一点。

同样是代数几何中的新突破,另一位数学家彼得·索尔策(Peter Scholze)在2011年前后提出的perfectoid空间,很快就被数学界所承认,证据就是他从2012开始获得的一系列殊荣。要知道,他提出这个理论的时候还只是博士生,但在2012年答辩之后,没过多久就被母校波恩大学重新聘请为教授,以24岁的身份创下了德国史上最年轻教授的记录。熟悉德国教育系统的人,会更感叹他的成就,因为在德国,教授的地位很高,聘请的条件也因此非常苛刻。这更凸显了他的成就。

彼得·索尔策。图片来自Wikipedia

彼得·索尔策。图片来自Wikipedia

那么,索尔策和望月新一,两人的理论为何遭遇迥异?

索尔策的理论处于代数几何研究的主流,能理解的专家人数比较多,而望月新一的理论则不算主流,专家也比较少。有时候人多人少,也能决定理论被接纳的速度。索尔策的理论包含的新意,很快就能被读懂并应用到新的问题上;望月新一的IUTT则是全新的系统,略有格罗滕迪克的遗风,看起来波澜不惊,但结论出人意料,需要吃透整个系统,才能判断最后的证明是对是错,但过于浑然一体,也让别人难以进行旁敲侧击式的验证,偏偏这种验证也正是考验新理论最快的方法。

对于望月新一来说,这些都是非战之罪。虽有忮心,不怨飘瓦。

但望月新一自身也并非毫无责任。对于现代数学家的标准而言,他的个性也稍有乖张之处。即使他曾经在美国生活过,在回到日本之后,他就很不愿意到海外与其他数学家交流。他并非不乐意交流,证据就是在2016年的一次IUTT研讨会上,他曾通过视频通话接入会场,为与会数学家解答一些疑难问题。而他窝在京都长时间自己捣鼓这一套理论,也不是数学界通常的做法。一般来说,数学家至少会跟同一个实验室的同事讨论相关问题,在讨论之中,可以获得更多灵感,也能借此检验理论是否正确,或者投石问路,看看是此路不通还是大有可为。上一个口风像望月新一那么严的,还是证明了费马大定理的怀尔斯。当然,数学家经常开学术会议互相交流,少不免走漏风声。我当然不知道望月新一有没有跟同事讨论,很可能有但是同事的保密工作做得很好,也许没有但这个可能性很低,又或者关注远阿贝尔几何的人实在少。但结果就是,当这个证明出现之时,人们毫无心理准备。

另一个可商榷之处,就是他在公开他的理论时,没有选择数学界一般会使用的预印本网站arXiv,而是直接放到了自己的个人页面上。当然,论文放到什么地方,这是他的自由,但也使数学界不能及时了解他的理论。不过话又说回来,这项工作引起的轰动,也很快让他的论文为数学界所知,所以其实问题也不大。

可以说,他的个性或者说偏好,在客观上的确阻碍了他与同行之间的交流。

结果就是,现在即使接受IUTT的专家越来越多(对于一个相对冷门的领域来说,十几个专家不算少数),但这些专家相当一部分是望月新一在日本的同事,还有过从稍密的同行。当然,也有相对独立的学者认为他们同样搞懂了望月新一的证明,但人毕竟也会犯错,很多旁观的数学家认为,现在认同的人数还不够多。

数学这门学科虽然有无可辩驳的逻辑作为守门人,但它仍然是一种人类活动。新理论无论是对是错,总要有足够的人承认,才得以确立。确立后的理论也不一定正确,确立后被推翻的证明虽不多,但也有。只有当大部分专家都理解了这个理论,再也挑不出毛病,从而站到了“自认为懂”的阵营里,甚至能由此生发出新的结果,理论才算真正确立。没有相应专业知识,或者不肯花时间的人,都只是局外人,没有权利对理论的正误说三道四。

但事情毕竟在进展。据说,目前IUTT的四篇论文中,前两篇构建的体系已经被许多专家认为成立,即使是那些觉得没有读懂整个证明的专家。目前争议的焦点之一,在于第三篇论文的推论3.12,也就是Szpiro猜想的证明关键。Szpiro猜想能推出ABC猜想,也难怪大家特别关注这个推论。据说,在之前的版本,推论3.12的证明只有几行,语焉不详,但我看到的几天前(2017-12-14)的新版本中,望月新一加上了好几页的注解。我只能希望这些注解能消除某些专家的疑惑。

发表与审阅

在验证证明的这个节骨眼上,从日本传来了一段诡异的新闻:据说望月新一关于ABC猜想的论文即将发表,发表的期刊是《数理解析研究所公刊》(Publications of the Research Institute for Mathematical Sciences),简称PRIMS。

欧洲数学协会网站上有关PRIMS杂志信息的截图

欧洲数学协会网站上有关PRIMS杂志信息的截图

这段消息来自日本的《朝日新闻》,算是老牌媒体,而且近水楼台,也难怪消息出来之后,引起了数学界的轰动。

在数学界,评定一个证明是否正确的标准之一,就是“在同行评议的正规学术期刊上发表”。要想做到这一点,就要把论文寄到期刊的编辑部(现在通常用网页系统),接受之后的一连串审核。

首先,编辑部在接到论文之后,会指派一位相关领域的编辑处理这篇论文。个别期刊可以由作者指定编辑。编辑会先进行初审,初步考量这篇论文是否适合在本期刊发表。绝大部分明显有问题的论文会在这一步被筛选排除。这一步不需要花多少时间。

然后,编辑会指定几位较为资深、在论文相关领域中有过贡献的同行,邀请他们进行审稿。这一步主要是审查证明的正确性和内容的原创性。到底选几位,不同的期刊面对不同的文章也有所不同。有单选一位的,也有12人委员会的先例,但大多数情况是两到三位。审稿人精读论文之后,会给出各自的意见,编辑负责将这些意见整合,得出一个结论。结论有这几种可能:拒稿、大修(major revision)、小修(minor revision)、发表。如果结果是拒稿或者发表,审稿人的工作就此完成;否则,编辑会将审稿人的意见和结论发给论文作者,让作者进行修改后,提交新的版本。新的版本会让审稿人重新审读,如此往复,直到最终拒稿、最终发表或者作者自行撤回论文。

这也是论文发表需时最长的阶段。越好的期刊,能请到的审稿人水平越高,审理也越严格。因为要有深入的理解,才能判定正确性,所以审稿人通常会花上很长的时间来审读,确保每个细节都没有问题。我自己当然投过稿,每次审稿意见回来都会惊叹于审稿人的细致,许多细微的笔误都会一一指出;我自己也替一个不算特别好的期刊审过稿,精读那篇论文花了我一个月电车上下班的时间,那还只是一篇十几页的文章。正因为严格,所以来来回回拖上三四年的例子也不算罕有。

这就是论文发表能作为金标准的原因之一:能发出来,证明至少有两三个跟你没什么关系的同行,差不多理解了你的论文,而且相当细致地确认了你的证明是对的。一般来说,无法通过这一阶段的论文并不多,因为大多数数学论文在投稿之前,作者都会先与同事交流,再于预印本网站(如arXiv)发表,也会在一些学术会议上宣讲。如果论文有严重的问题,通常在这些阶段的交流之中就会被指出。作者敢于投稿的,大部分都起码不会有严重的问题。

这场审稿的拉锯战,最大的得益者是之后希望研读的数学家。既然已经有人读过,说明论文是可以理解的,而拉锯过程中作者对论文的修改,更会让其中的理论和证明更易于理解。可以说,审稿人、编辑和作者在这个阶段的来来回回,就是在不断打磨论文本身,使其更晶莹通透,能让人一览无遗。

最后,编辑在得出结论后,如果决定这篇文章可以发表,那么就会将文稿交给出版社的编辑,进入最终的文稿编辑流程。值得一提的是,在整个过程中,无论是编辑还是审稿人,他们所做的大量工作,全都一文不取。

但望月新一这次却有点蹊跷,因为望月新一的工作单位,正是数理解析研究所,而他本人,就是PRIMS这个期刊的主编。一时舆论哗然,很多人觉得,这种行径可能在伦理上说不太过去,有些人更是作起了无端的恶意猜测。

因为新闻实在太大,Nature的Davide Castelvecchi给PRIMS编辑部发了一封电子邮件求证,而PRIMS很快作出了回应:

望月教授有关宇宙际Teichmuller理论的几篇论文仍未被期刊接收发表,因此我们很抱歉,RIMS无法对此评论。

The papers of Prof. Motizuki on inter-universal Teichmuller theory have not yet been accepted in a journal, and so we are sorry but RIMS have no comment on it.

措辞很审慎,也有点奇怪。根据最后一句,期刊的回复似乎站在RIMS,也就是数理解析研究所的立场。这样的话,难以判断望月新一的论文是否的确投给了PRIMS。但如果这些论文不在PRIMS手头上的话,那么他们又如何知道论文仍未被接收发表,也就是说仍未通过审议过程呢?但望月新一本人就是主编,他自己肯定知道自己论文的情况,所以也不能排除论文没有投到PRIMS,而是望月新一本人或者知道内情的同事所作的回复。

这也难怪望月新一不喜欢媒体。在他的主页底部,有一句话,用很大的艺术字体写着:本站点的内容和图片不得用于媒体报道。所以,这篇文章不能有他的照片。看看现在,新闻即使在日本发表,在不当的翻译下,传来传去也惹出了大风波。

但即使望月新一的确将论文投到了PRIMS,一般来说也无需担心利益冲突的问题。原因之一,是数学界早已有一套相当完备的系统,用以避免利益冲突。在选定编辑和审稿人时,一般来说,与任何一名作者在五年内合作发表过文章的,指导过任何一名作者研究的,还有与任何一名作者共处一个实验室甚至一个学校的,为了避嫌都不能参与。有些领域研究的人太少,要是全避嫌了可能也不剩什么人,这时候编辑也会慎之又慎,有时候甚至会为了避嫌,邀请研究领域稍远,但可能对论文内容有所了解的研究人员进行审稿。即使是主编,这套系统也会照常运作,不给情面。

也许你会说,那既然望月新一本人是主编,那么他不是更应该避嫌,不要将论文投到PRIMS,以免瓜田李下?我觉得他也许就是这样做的,因为我们还不知道他论文的去向。但也有一种可能,就是他并不在意论文在什么地方发表。毕竟他已经发布了自己的新理论,也吸引了专家研读。证明是否正确,领域内部自有定夺。即使投稿,也不过是一种寻找审读者确认的方式。在哪个期刊,并不重要。数学界也了解现在的情况,所以只是颇有微词,并没有群起而攻之。

说一点我个人的想法。我个人完全不担心望月新一所谓的利益冲突和学术伦理问题,最大的理由就是他没有动机。他已经功成名就,不需要什么文章。数学这种东西,对就对,错就错,不存在编数据或者实验造假,一切细节都在文章里。要是错了,无论强行发表在什么期刊上,也终有一天会被发现,而一发现就无可抵赖,只能重新修补。而且数学家对于证明的疑心很重,甚至到了偏执的地步。别人可能觉得差不多对了,数学家考虑的却是有什么地方可能出问题。在这种高标准下,疏失犯错固情有可原,故意造假则得不偿失。另外,正常的学术评价体系也不会过多考虑文章的发表,而是会综合考虑同行的评价,多发几篇文章并没有什么用。况且,一个造假发现就会身败名裂,甚至有人会以死谢罪的国家和体系,我觉得不能跟大部分读到这篇文章的人身处的环境相比。很多人的担忧,也许只是从此处自身感受作出的一种投射。

对于数学来说,文章发表并不是研究的终点。尤其是对于像望月新一的新理论那样重要的结果而言,数学家会前仆后继地研究它、理解它、挑剔它,尝试在其上生发出新的结果,或者找出它的错误。广中平佑当年需要两百多页才完成的奇点消解定理,在经过许多数学家的理解和简化之后,现在有了不少的简化证明,其中有些只需要二十页,原来的十分之一,而数学界对奇点消解的理解也远胜以往。数学是活着的,数学有它的生命,而发表并不是它的终点。

当然,我不是说数学家都白璧无瑕。数学界自有它的阴暗角落,就算是“自认为懂”望月新一新理论的阵营内部,也有各种奇怪的事情在发生,而两个阵营之间的争吵也很有难说谦谦君子之处。但证明总在日光之下。

况且,做纯数学的人,如果没有一点热爱数学的心,恐怕也很难久坐数学研究这一钱少活难的冷板凳。也许望月新一并不介意数学界甚至他自己领域之外的人如何看待他。他只要能做出好的数学,就可以了。

想想佩雷尔曼。

证明与理解

从目前的迹象来看,望月新一应该已将论文投向某个学术期刊,而且也应该断断续续收到了一些审稿意见,间接证据就是他的论文不断在更新,当然大多数是他与同事同行讨论的结果,但一些澄清概念的注解也很有可能是为了回应审稿的意见而写下的。

那么,如果期刊收到像望月新一的论文那么难读的投稿,应该怎么审稿?

世上数学家不少,总有几个在相关的研究领域钻研。如果投稿处在期刊的专业范围内,那么编辑肯定能找到能够审核论文的专家。当然,专家是否愿意审稿又是另一回事,但只要接受了审稿,那基本的专业素养就有了保证。既然审稿人是专家,就不会完全读不懂。也许会有一些不太理解的地方,但这时审稿人可以通过编辑向作者反映情况,要求更详细的解释。这样一来二去,慢慢地也就读懂了,可以作出评判。论文的终审稿通常会比初稿容易理解得多,这就要归功于审稿人、编辑和作者的共同努力。

当然,论文有两种难度。有些论文,例如佩雷尔曼对庞加莱猜想的证明,本身不长,但是因为高度抽象,以及作者各种跳步省略,导致文章极其难读。有些论文,例如Almgren某篇关于几何测度论的论文,本身就很长,一共1728页,差不多是望月新一四篇论文合计页数的三倍。这么长的文章,即使不需要检查正确性,慢慢地读下去也很费劲。

望月新一的论文也许两种难度兼具,但原则上并非不可逾越。不要低估数学家的耐心。

那有没有可能作者也没有办法解释,导致专家也不明白呢?

你可能会觉得,作者不也是人么,只要是人,就肯定有办法解释啊。人又不是机器。

对啊,但如果机器也参与了证明呢?

这就是计算机辅助证明,虽然稀少,却也存在。最有名的例子就是1976年美国数学家阿佩尔和哈肯对四色定理的证明。

法国大区的四色染色,图片来自Wikipedia

法国大区的四色染色,图片来自Wikipedia

四色定理,说的是任何地图都能用四种颜色涂抹,使得相邻的区域颜色不同。这个陈述看起来人畜无害,似乎不难解决,而许多知名的数学家也被它的外表迷惑,比如闵可夫斯基就曾在课堂上夸下海口,一边说这个问题没被证明只是因为没有一流数学家去做,一边就在黑板上开始推导,推了一节又一节课,最终只能食言。当然,哥德巴赫猜想和费马大定理看起来也人畜无害,这也不妨碍它们难倒一大片顶尖数学家。但与两者不同的是,四色定理的证明很难说是重大突破。它属于组合数学,但这个领域因为着眼点相当分散,能统领一大片不同课题的体系少之又少。

阿佩尔和哈肯的证明被历史记住,主要因为这是第一个计算机辅助完成的重大证明。他们的证明基于所谓的“放电法”。首先,他们利用计算机,设计了一些“放电规则”,这些规则能用于证明任意的平面地图必然包含1936种构型之一。这1936种构型,又被称为放电规则对应的“不可避免构型集”。然后,他们利用计算机证明了,所有这1936个构型都是可以约化的。也就是说,所有平面地图都能被约化,变成区域数更少的平面地图,而小地图能用四色染色,当且仅当大地图同样如此。如果存在不能用四色染色的平面地图,取这种地图中区域数最少的地图,通过约化,能导出区域数更少但同样无法用四色染色的地图,引发矛盾。阿佩尔和哈肯就是这样,证明了四色定理。

但这篇论文却让想要验证的数学家犯了难。论文由两种截然不同的体裁合成:数学家熟悉的人工证明,还有计算机熟悉的计算过程。人工证明虽然繁复,但还在数学家熟悉的范畴里。但计算机的计算过程应该怎么验证呢?

虽然具体的算法属于人工证明的部分,但机器毕竟不认识算法,它只认识能执行的代码,所以还要验证具体的算法实现代码是否正确。而从代码到具体的运算结果,又是另一回事,虽然原则上可以逐一验证,但长度实在超出了人类能接受的范畴。但不去验证具体的计算,又如何能确定所有结果都准确无误?也许有些编写上的细节没有注意到,或者当时计算的硬件有问题?

所以这个证明的验证,花了很长时间。

验证所有构型都能被约化的部分相对简单。虽然计算量大,但这主要用于寻找具体的约化方法,验证约化成立倒是不费多大功夫。为了检查,可以重新由不同的人在不同的硬件上用不同的语言重新编写这部分的代码,然后进行计算。一次计算可能有问题,但两次细节完全不同的计算同时出错的可能性就低得多。

问题是验证放电规则和不可避免构型集。计算部分由电脑完成,但验证却必须手工进行。如此庞大的证明,一开始有漏洞几乎是必然的。在几年后,德国的一位硕士生检验了整个证明的40%,发现在放电规则中有一个严重错误。其他人也陆续发现了一些小问题。阿佩尔和哈肯花了不少时间处理这些问题,最后出版了一本专著,共计七百多页。随后,许多数学家陆续尝试简化这个证明,提出了许多不同的证明。虽然这些证明都需要计算机的辅助,但毕竟这么多独立证明全都出错的可能性很小,大家也就都接受了四色定理。

另一个受到类似“礼遇”的,是托马斯·黑尔斯(Thomas Hales)对开普勒猜想的证明。他证明的是,在三维空间中堆砌大小相同的小球时,最密集的方式是面心立方和六方最密堆积。

两种最密堆积,图片来自Wikipedia

两种最密堆积,图片来自Wikipedia

黑尔斯的证明可谓暴力穷举的典范。他利用计算机,将所有可能的情况一一分类,总数超过五千,然后利用计算机算法逐一否定这些可能性,这需要解开共计约十万个线性规划问题。如果没有计算机,这恐怕是不可能完成的任务。证据就是,最终证明共计250页,却还要外加3GB的计算机程序和数据。

由于开普勒猜想的重要性,黑尔斯的证明也相当引人注目。他将论文投到了数学界的顶级期刊《数学年鉴》(Annals of Mathematics)。在数学界,只要你说出Annals这个词,人人都知道你指的是《数学年鉴》。编辑部自然也不敢怠慢,毕竟这是个长久悬而未决的猜想,而计算机在证明中的角色无比重要,编辑也希望能完全确认计算正确性。他们组织了一个12人委员会来审查这篇文章,只有12个人意见完全一致,这篇文章才算通过。为了详细验证整个证明的正确性,有些委员还在自己的实验室里召开了研讨班,准备细细检查证明的方方面面。

委员会花了4年,结论是他们“99%确定”证明是正确的。他们虽然完成了大部分证明的检查,但仍未到彻底的地步。以数学家的标准来说,这还是不太令人满意,但证明太长太麻烦,委员们实在干不动了。最后,《数学年鉴》发表了这篇审稿标准史无前例,审稿结果也史无前例的文章。

这些计算机辅助证明,即使计算机只起到了辅助计算的作用,也足以让希望确认证明正误的数学家烦恼不已。这么长的计算,人花一辈子也不可能完全验证,怎么才能确定计算没有出错?

既然人不能验证,那么机器怎么样?

只要将证明完全形式化,写成机器能明白的格式,那么就可以让机器去验证整个证明。好在验证总不会比计算难,既然机器能完成计算,那么也能完成证明。于是,要确认形式化证明的正确性,只需要先让机器去验证,然后人工检查机器验证代码的正确性。这样的代码通常很短,而且可以用于许多证明,可以说用力少而建功多。

问题在于,证明的精华部分是由人类完成的,而人类的语言机器显然读不懂。要想让机器验证证明,就要把这部分完全形式化。这是个艰巨的工作。

对于四色定理和开普勒猜想的证明,因为它们非常重要,所以即使明知很难,数学家还是去做了。2005年,Werner和Gonthier给出了四色定理的一个完全形式化的证明,并用软件Coq完成了验证。从2003年开始,黑尔斯开始了一个合作项目Flyspeck,旨在将他自己的证明完全形式化,然后用机器来检验,从而确立证明的正确性。与21位合作者花了十一年多的时间,他终于完成这个项目,而现在开普勒猜想已被公认获得证明。(关于形式证明,请参见木遥的《形式证明:机器的光荣与人的梦想》

所以说,即使读不懂,还是有办法审稿。当然,需要如此大费周章的论文少之又少,也只有非常重要的论文才会获得这种待遇。但数学家对证明正确性的执着,由此可见一斑。

但对很多数学家来说,知道一个证明站得住脚还不够,他们希望能*理解*整个证明。对于四色定理和开普勒猜想的证明,他们也许会说:“好,我知道那是对的,但它*为什么*对?”

这种对理解的渴求,也是推动数学前进的动力。数学家追求证明,但从来不单追求证明。他们的真正目的,是通过证明去理解为什么这个定理是对的,为什么那个理论要以如此方式建立。机器证明也是数学,但谈不上是好的数学,或者更准确地说,谈不上是美妙的数学。

也许终有一天,人工智能也会懂得做数学,它们也许会拥有能大幅抛离我们的能力。就像姜峯楠(Ted Chiang)的短篇科幻《人类科学之演化》(The Evolution of Human Science,首发于《自然》期刊)那样,也许有一天,人工智能做的数学会达到人类无法理解的地步,仅仅皮毛也足以让人类最顶尖的数学家钻研一生。当然,原著中拥有超人能力的并非人工智能,而是植入芯片的人类,但道理是一样的。

然而,即使人工智能超越了我们,对数学的理解以及它给我们带来的美感也不会消失。我们做数学,为的不仅是追求真理,还为了理解这些真理。

而望月新一的证明,只是历史长河中前仆后继的又一步。

后记

我一直觉得,写这篇文章的不应该是我。我做的是组合数学,对于代数几何所知甚少,写关于望月新一的文章,简直是赶鸭子上架。

但了解更多的人在哪里?

比我更懂的人肯定多得是。任何一个做代数几何的博士生,肯定都比我更适合写这篇文章。但似乎没有听见他们的声音。

我理解他们。这毕竟是一个高度抽象的学科,要向研究方向不同的同事解释尚且很有难度,更何况向一般人解释?

这也许也是望月新一拒绝媒体的理由。媒体肯定不懂他的理论,只知道这可能是一个重大突破,可以搞个大新闻。但这些媒体何尝愿意了解他的理论?写成报道,焦点多半在个人的私生活上,要么就是各种八卦。看的人是很多,但看完之后,给人们又留下了什么教益?

但这个事情毕竟不能不做。正如他的新理论也需要知音来帮助宣讲,数学本身也要靠科普才能传播,人们才会认识到数学的重要性,而不是问出“微积分有什么用,又不能买菜”这种问题。怀有恶意的媒体固然会断章取义,但让更多人更了解数学的美妙也是件好事,值得再三权衡。

这篇文章,由于本人知识所限,难免有许多疏漏,权当抛砖引玉。希望与远阿贝尔几何关系更密切的专业人士,能写出更深入准确的文章,让大家分享数学最前沿的这一大事。

本文删减版曾发布于果壳网,地址在这里

参考文献

Ivan Fesenko, Fukugen, Inference Review, http://inference-review.com/article/fukugen

Mochizuki Shinichi, Inter-universal Teichmuller Theory I: Construction of Hodge Theaters, http://www.kurims.kyoto-u.ac.jp/~motizuki/Inter-universal%20Teichmuller%20Theory%20I.pdf

Mochizuki Shinichi, The Mathematics of Mutually Alien Copies: From Gaussian Integrals to Inter-universal Teichmüller Theory, http://www.kurims.kyoto-u.ac.jp/~motizuki/Alien%20Copies,%20Gaussians,%20and%20Inter-universal%20Teichmuller%20Theory.pdf