围棋的胜利条件是分数(目数)比对方多,这就产生了两种关于胜负的哲学。
第一种是追求胜率。反正赢半目也是赢,赢一百目也是赢,并无区别。这一种哲学的代表人物是李昌镐。五目半时代他赢半目,六目半时代他还赢半目。“围棋十诀”第一条“不得贪胜”,说的就是这种追求。
第二种是追求尽量多赢。藤泽秀行曾说,围棋是争夺一百日元的游戏,不应该拿到五十一日元就收手。秀行棋圣亲身实践此思想,敢于长考三小时怒屠大龙。中国古代有赌棋传统,其中一种赌法是“子彩”,按照胜负子数赢取彩金。子彩激励棋手追求更大胜利,因此清代大国手个个嗜杀,棋风刚猛。
这两种哲学常常在实践中产生冲突。比如一局棋领先的时候,是求稳保住胜利果实,还是始终走最强的手段?棋手的计算力毕竟有限,追求更强的着法失误概率更大。所以大部分棋手是求稳的。当然人类棋手求稳未必真的稳,有时候退着退着就输了。
而AlphaGo把这种追求胜率的哲学推到了极致。人类只能粗略估算的胜率,AlphaGo有能力精准判断。优势局面下,AlphaGo的安全运转稳如老狗,令人类望洋兴叹。看上去目数上的差距好像缩小了,其实是AlphaGo早已算到胜率>95%。若以追求更多胜局为目标,AlphaGo走的就是最善的下法,或者说很接近最善的下法。
那么李世石为什么说AlphaGo没有追求最善的下法呢?因为李世石倾向于“赢得更多”。大家可以看李世石和古力这对绝代双骄的五十多局直接对话,几乎都是这样的棋。还记得2012年三星杯决赛第二局,古力在优势局面下拒绝安全运转,策划了一系列贯穿全局的阴谋,几乎将李世石吃花,可谓酣畅淋漓之至。这就是李世石心目中“最善的下法”。
但我还是更倾向于只追求胜率的哲学。现代围棋的目标毕竟就是追求赢,赢多少都算赢,拿到五十一日元的实际上等于通吃一百日元。那年三星杯,第二局要是算目,古力赢了有一百多目。然而第一、三局李世石赢了两个半目,最后李世石2:1夺冠。公平吗?太公平了,规则就是这样设定的。
既然人不可能算无遗策,AlphaGo也不行,那么在规则框架内追求最高的胜率无疑是最佳的策略。
来源:知乎 www.zhihu.com
作者:不会功夫的潘达
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 10 个回答,查看全部。