总要有人去做一些不同的事

总要有人去做一些不同的事

——写于国重成立十周年

计算机体系结构国家重点实验室(以下简称国重)成立十年了,这是一个里程碑。在脑海中回忆着和国重相关的事,一幕幕场景浮现,甚至包括2003年第一次到计算所参加研究生复试的场景。那时,计算所历经沧桑的大门还在,而自己还是一张科研白纸,不知道如果被计算所录取了,将来会在这里干什么。幸运的是跌跌撞撞地通过计算所的面试,正式成为一名“计算所人”,从此开启了科研人生,也开始认识和体会计算所的使命感。

在和国重相关的众多回忆中,有一句话反复浮现:“总要有人去做一些不同的事”。这是国重主任孙凝晖院士平日里和大家交流时对使命感的一种通俗的解读——当大多数人都去做相同的事、都去追求相同的东西时,国重要鼓励和支持有人去做一些不同的事。我是国重这种发展理念的积极响应者,也是这种理念的最大受益者之一,我的成长就是去做了不同阶段国重所鼓励的、和主流有点不同的事。

(一)

2006年以前,计算所的系统方向一直都是专注于承担龙芯、曙光这样的大项目。但从2006年起,计算所开始重视在计算机体系结构基础研究上布局。于是在2006年,国重的前身——中科院计算机系统结构重点实验室(院重)成立了。那时国内还是SCI论文盛行,时任计算所所长的李国杰院士认为不应该追求SCI论文,而是呼吁要重视在国际顶级会议上发表论文。

明确了方向和目标,大家的努力便开始逐渐起成效了:2006年、2007年先后突破了计算所第一篇SC和SPAA,2008年又突破了HotChips、SIGMETRICS、ICS,2009年顶会论文又上一个台阶(HPCA、SC、ICS、DSN、2篇CGO),2010年继续一路高歌(2篇ISCA、PLDI、HPCA、3篇CGO等)……

那段时间我也是积极响应,把发表顶会论文作为目标,也有所收获,在2008年发表了SIGMETRICS,2010年发表了HPCA,也因此两次获得计算所优秀论文一等奖。这些成绩让我入选了计算所第二届“百星计划”,并于2010年被推荐到普林斯顿大学李凯教授团队做博士后。

(二)

2011年,基于计算所在系统方向的长期积累以及过去5年基础研究上的成果,计算所向科技部申请筹建国重,并于2011年10月13日通过科技部批准筹建,2013年5月22日顺利通过科技部验收。

高兴之余,很快大家就开始担忧2017年的国重评估了。这是国重成立后的第一次评估,大家都毫无经验可言,为此时任国重主任的计算所孙凝晖所长组织多次讨论国重的发展规划。大家开展了细致的调研与分析,却得到一个很不乐观的结论——体系结构国重的论文发表数量在信息领域所有32个国重中处于末游位置。那么,未来几年国重应该如何发展?这是一个至关重要的方向性问题,是战略发展问题。

2014年1月初,国重掀起了一场主题为“国重应该追求什么”的邮件大讨论,十多位科研人员发表了各自观点。这次大讨论让大家对国重和计算所的优势和不足有了更全面的认识,对国重未来的发展之路有了总体思路——做有影响力的系统。我也参与了这次大讨论,并从“计算所的优势”、“做真实的系统”、“研究品味”、“发展模板”四个方面发表了自己的观点(见后附文),得到很多国重老师的认可。

可以说这次大讨论对我也是影响深远。从那时起,我便把做真实的系统摆到了第一位,把论文作为系统的副产品来看待,团队花在系统研制上的时间也是远远超过论文撰写的时间。这个抉择存在很大的风险,我们团队的顶会论文从2015年开始明显减少,这也确实让我个人在越来越看重顶会论文的大环境中失去竞争优势。但是,总要有人去做一些不同的事,去探索不同的模式,我的选择在国重得到了从主任到同事的积极认可和支持。有了国重作为坚强的后盾,我内心便再无顾虑,只管勇敢地往前走。

之后,国重主任孙老师又组织人员开展针对科研自身规律的战略研究,收集包括伯克利、斯坦福等国际一流科研机构的相关数据和素材,认识到做高水平的原型系统,可能产生更大的影响力。比如伯克利在过去几十年研制了大量的原型系统,虽然论文数量不多,但这些系统不仅推动了技术进步甚至颠覆产业,也培养了一代代杰出人才(其中多位获得图灵奖)。孙老师将这种模式总结为“科研重工业模式”,我深以为然,也更坚定了自己选择这种模式的信念。

(三)

2018年1月,科技部公布信息领域国重评估结果,体系结构国重被评为优秀,这是对国重发展理念的肯定,也激励国重成员更勇敢地去做一些不同的事。那接下来五年国重又可以做些什么不同的事呢?大家都开始思考国重下一步的发展。

在一次内部会议上,国重主任孙凝晖院士提出了一个建议——中国的体系结构人才是短板,国重也应该重视一下人才培养和教学教育。一般来说,国家重点实验室的主要任务是开展科研工作,教学教育似乎并不是国重的主线任务,这对于国重是一件有些不同的事。出乎意料的是,孙老师的建议得到了大家的积极响应,国重的老师们开始更重视教学了,更准确地说,是真正去实践“科教融合”了——把科研成果应用到教学场景中。

2018年,陈云霁研究员带领团队在国科大开设了一门新课程《智能计算系统》,这门课目标是通过理论与实践相结合的方式让学生对智能计算完整软硬件技术栈形成融会贯通的理解。这可以说是在全世界范围都是一门全新的课程,一切都需要从零开始。没有现成的教材,他们便自己编写《智能计算系统》教材,并于2020年3月出版,上市三天荣登京东大学教材新书榜TOP1;高校没有教师上这门课,他们组织了多次导教班,全国超过1200多高校老师参加。如今《智能系统课程》已经推广到全国80多所高校,培养11000名学生。

我们团队在芯片人才培养方面也做了些探索工作。2018年,张科、常轶松两位老师把过去几年积累的FPGA云技术应用到国科大的教学中,让学生可以随时随地登录到FPGA云中开展芯片设计实验。这项工作也被国际计算机教育旗舰会议SIGCSE接收为长文,后来了解到这还是过去50年国内的第四篇长文,真是无心插柳柳成荫,这也让我们更深刻地体会到“做一些不同的事”其实更能产生一些意想不到的收获。如今FPGA云平台经过不断地迭代优化,已经发展成为一个芯片敏捷设计云平台SERVE,累计服务了500多位国科大的学生,并开始对外开放提供服务。

“一生一芯”计划是另一个例子。我们从2018年开始酝酿,希望通过基于开源芯片的实践课来加速芯片人才培养,于是提出了让本科生带着自己设计的处理器芯片毕业的想法。这是一个比较激进的想法,之前在全世界范围也没有先例。我们得到了国科大和国重的大力支持,也做了大量的前期准备工作,但说实话即使到2019年8月正式启动时,我心中依然没有把握。很幸运的是参加首期“一生一芯”计划的5位国科大同学通过努力成功实现了这个目标,“一生一芯”计划终于立住了。如今开展到第三期已经有超过700位同学报名,覆盖全国150多所大学。“一生一芯”计划也得到越来越多的支持,甚至被赋予了一个更有意义的解读——让学生们拥有人生的第一颗自己设计的芯片。

国重老师们还有很多优秀的课程,比如胡伟武老师的《计算机体系结构》、徐志伟老师的《计算机导论》、陈世敏老师的《数据库》等等,如今教学也可以说是国重团队的名片之一了。

(四)

开源芯片是我在国重支持下开展另一件“有一些不同的事”。提到开源,很多人都认为就是把源代码公开,这似乎没有什么创新,甚至不认为这应该是科研机构做的事。但我对开源有一些不同的认识和理解——在我看来,开源本身就是一种体制机制上的创新,而优秀的开源项目就是一种记录和传播创新的出色载体,也是孕育创新的沃土。

我的判断是和开源软件支撑了整个互联网一样,开源芯片可能就是下一个重大机遇。这个趋势可能会对芯片产业带来很大的冲击和影响,而且在未来的5~10年就会发生。于是在2016年,我带领团队开始做一些开源芯片相关的工作。随着工作的深入,我对开源模式有可能改变现有芯片研发模式的预感愈加强烈。2018年3月的某一天,我跟国重主任孙老师汇报这些想法。

孙老师很重视,让我在国重例会上给大家再讲一讲,让大家都提提建议。例会上,大家提出了很多宝贵的建议,比如国重常务副主任李晓维老师建议要成立联盟。随后,国重设立了一个支持开源芯片的主任基金项目,让我们团队进一步探索,而我们整个团队都转而全身心地投入到开源芯片的研究中。

后来的故事很多人也都有所了解。2018年11月,计算所在网信办、工信部和中科院的指导下牵头成立了中国开放指令生态(RISC-V)联盟;2020年7月,首期“一生一芯”计划结果发布;2021年6月,开源高性能RISC-V处理器“香山”对外公开。在这里做个预告,2022年,我们将会公布新的重量级进展。

如今我们发现开源芯片原来是一块尚未开垦的新大陆,这里充满了诸多挖掘出新思想、新范式、新方法、新流程的机会,这是一片充满创新机会的沃土。开源芯片在计算所甚至在国内也将会带来一种产学研融合模式的变革。过去计算所主要采用“1+1”模式,即1个研究团队做出成果,然后孵化1个公司去做产业化,有很多成功的案例,比如曙光、龙芯、寒武纪、睿芯、晶上、天玑等等。但开源芯片则带来一种“M*N”的新模式,即联合M个科研机构、N个企业共同攻克1个生态,通过开源模式这个催化剂,形成企业间的“竞争前合作”。对于这个新模式的意义,在此借用北京市陈吉宁市长对开源芯片的一个总结:“做开源芯片这项工作,不是靠某一家能完成,是靠协同来完成。协同,它是有内涵的,不是简单的合作协同,是有深刻内涵的一件事情,是解决生产关系的问题。不同的领域,不同的阶段,要有不同的生产关系来推动适应创新的需求。”

开源芯片,在五六年前还是一件看起来和主流计算机体系结构研究方向有些不同的事,但当时却得到了国重的大力支持,也赋予我一个新的努力方向。值得欣慰的是,现在这个方向已经越来越被认可了。

(五)

在一个组织中,能鼓励有人去做一些不同的事,而且真有人敢去做一些不同的事,这背后需要一种组织文化的支撑,一种能包容和欣赏不同思想、不同风格、不同路线、不同方式的组织文化。我想这正是国重的创新源泉。

总要有人去做一些不同的事,这个世界才会更加缤纷多彩。


附文(2014.1.9)

国重应该追求什么?

——写于国重成立之初

(一)计算所的优势

2006年,有篇檄文相信很多人都看过《 从ACM会议看中国大陆计算机科学与国外的差距》,彼时很多顶级会议大陆都是零!过去8年大陆不断突破,计算所在这个过程起到先锋作用,很多计算机体系结构会议都是率先由计算所突破的,比如SC、SPAA、Sigmetrics、HPCA、ASPLOS等,而且计算所在大陆占较大的优势。可以说,计算所在这一轮转变中占得先机,为后来争取创新群体、973项目以及国重都起到一定的作用,也为计算所在国际上赢得了一定的声誉——曾有海外教授开玩笑说,如果国外做系统结构的人回国没有在计算所做过报告,那他的水平就可能有限。

那段时间计算所获得的优势得益于李国杰老师早在2005年就开始摒弃、批判SCI。那时李老师不仅在外面以院士身份以及CCF理事长宣传大家要重视计算机会议,同时还在所里鼓励并且奖励发表会议论文,我想很多人应该都还对前几年的计算所优秀论文奖有印象。

这几年,不管是学术界、还是工业界,国内的科研水平这几年进步非常神速。各大高校顶级会议论文不断涌现,而且一些企业也开始重视论文发表,比如百度也中了一篇ASPLOS,而且他们的技术是在真实系统中布署了。相比较而言,似乎计算所的论文发表速度变慢了。面对国内同行的快速发展,我们可能都困惑过:“计算所的优势是什么”?

“计算所的优势是什么”,我曾经把这个问题抛向了好多国外的教授。李凯教授和UCSD的周源源教授都认为计算所的优势是——做真实的系统;而施巍松教授则认为,计算所的优势在于——“知道什么是好,什么不好!”这些教授都是和计算所有打过较长时间的交道,他们的回答其实正是计算所的传统优势。

(二)做真实的系统

“做真实的系统”当然是计算所的最大传统优势,远到103、107、757、联想PC系统等,近到曙光系列、龙芯等,都是以系统的形式展现。做系统需要有足够的资源保障,过去有不少先进的项目最后因为经费不到位而草草收场。比如1990年代初,Stanford在John Hennessy带领下开展Intel资助的Flash项目,但最后因为Intel中断经费提供而不得不改为使用模拟器来验证。不过有挑战的系统,即使副产品也会开花结果,Flash项目对模拟器的高要求,最终孵化出了VMWare公司。

回到国重的话题,我觉得国重还是应该秉承计算所的传统优势,以系统作为载体来开展科研工作。而在现有的资源条件下,我们能做什么样的系统?我不知道具体的答案,但每个课题组可能都思考过。我们可以来看看世界上顶尖大学的一些例子:

从这些例子来看,做一个验证想法的原型系统或者开源软件其实并不需要太多的资源,需要更多的可能是时间成本,一般需要2~3年时间。比如Mesos被据了2年,Spark开源后前3年只有6个人参与,论文也被据了近2年,但他们都坚持下来了,成为引领国际大数据处理的项目,产生巨大的影响力。

(三)知道什么是好,什么是不好!

这个回答值得我们思考,这涉及到当下生存与长远发展问题。计算所在过去几年全国“唯SCI”形势之下独辟蹊径,及时采用与国际接轨的标准,才争取到今天国重这样的平台。大家期待未来能在这个平台上更上一个台阶,如果现在跨上这个平台后,却反而不得不向SCI低头,这多少有些无奈。

究竟“什么是好”?其实是我们自己选择的,每个人的选择也许会不一样,这取决于我们设立的未来发展目标。如果我们只是在想国内发展,那么可以选择国内的评价标准;但如果我们希望能走向国际,早日实现国际化,那么遵循国际同行认可的标准会更好。

也许也有观点认为国外也有不少教授热衷于发表大量的SCI文章,比如有朋友曾给我看过一位教授的简历:每年就有10多篇IEEE Transactions,每年还有5~6篇Infocom。但这些我们是想追求的吗?如果全力以此为目标,我相信国重不少小组每年灌上10篇左右Trans也不是不可能。国重是否还需要通过这种方式来证明实力呢?

我们每个人心中都有一个价值标准,或者说是研究品味。既然大家都在国重,如果我们都有相近的研究品味,也许会更好,那也就自然形成了国重文化。就像Stanford的教授学生以创业为荣;Princeton的教授一批受李凯老师影响也开始积极创业,还有一批则专注学术热衷于著书。这些都是文化,对团队的影响是潜移默化的、却又是深远的。

国重的研究品味应该是什么样,我觉得应该参考Berkeley、Stanford等顶尖大学的教授们。即使我们现在还做不到他们那么好,达不到那个水平,但要相信这个方向是正确的。

(四)发展模板

去年所里辩论决赛是“计算所发展有没有模板可依”。这个题目我也参与拟的,我自己的观点是有模板可依的。先依模板、再做改进,是一种高效的方式,尤其选择了好的模板。华为2013年做到了400亿美元,任正非在其新年致词中认为管理是核心,而华为的管理正是以IBM为模板。这是依模板的一个很好的例子。

实验室发展应该也是有模板可依的。每个实验室都是一步步发展成长起来的,这个过程必然是充满了曲折。我们可以用历史的眼光去看这些实验室的成长。我们的国重还是婴儿阶段,管理办法、人才培养方式等都还在探索阶段,也许可以把目标放长远一些,比如10年后达到国际一流。

最后,再向大家推荐看一下Richard Karp讲述的Berkeley CS崛起的辛酸史(http://www.eecs.berkeley.edu/BEARS/CS_Anniversary/karp-talk.html ):

1960年代Berkeley有两个独立的计算机系,两拨人互相不服,折腾了十几年到后来合并到EECS,开始变成EE和CS分治,有两边轮流出EECS的系主任和副系主任,算是稳定下来。而Berkeley CS在1970年左右还是二流的,那时Top 3是MIT、Stanford和CMU,那时Berkeley和Cornell都有差距。经过1970年代的十年发展,Berkeley挤入了Top 4行列。且不谈理论方面的P/NP贡献,在系统领域,让Berkeley站起来的是因为2个项目,学术界的第一个大规模开源软件系统Berkeley Unix项目和第一个实现Ted Codd关系数据库的INGRES系统。紧接着到了1980年代,RISC、RAID等项目进一步巩固了第一梯队的地位,吸引越来越多优秀的人,从而进入良性循环。

为什么Berkeley在1970年代能崛起,我想很关键的一点,他们找到了一批非常出色、志同道合的年轻人,Butler Lampson,Velvel Kahan,Richard Karp,Chuck Thacker,Manuel Blum,…… 他们是冲着当时Berkeley的名气来的,进入计算机系后却发现问题重重,但他们相互鼓励、相互欣赏,一起开拓未来。

来源:知乎 www.zhihu.com

作者:包云岗

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载