7月8日下午,2021世界人工智能大会的展区里举行了一场“特殊”的王者荣耀表演赛:比赛的一方是职业人气选手,另一方则是王者荣耀与腾讯AI Lab在游戏场景下研究的成果,策略协作型AI王者绝悟。
王者绝悟队伍的5位英雄,走位风骚、技能精准,做到了真正意义上的“顺风不浪、逆风不怂”,完美预判了对方的预判。腾讯公司董事会主席、首席执行官马化腾在开幕式中预告这场比赛时,用的形容词是“最高水平的AI竞技”。不过,这并不是从电竞的层面来说,而是从技术的层面来说 —— 王者绝悟,已经达到了全英雄职业电竞水平。
那么,王者绝悟到底是什么,它到底有什么价值,值得腾讯大力支持?
一颗“技术”的种子
2019年,王者绝悟团队在接受采访时表示:和业内所有研究机构一样,他们追求的目标都是“通用人工智能”。
这是一个近乎“科幻”般的追求,因为要实现“通用人工智能”并不是一件易事。毕竟,真正理想化的通用人工智能,不仅需要有堪比人类的智力水平,而且需要具备能够同时协调处理多件任务的成熟技术。
值得惊喜的是,从早期的深蓝,到16年名声大振的AlphaGo,再到2021年世界人工智能大会上的王者绝悟,很明显地发现,在任务处理的技术层面,人们正在朝着理想化的方向行进:从“单体智能”,逐渐过渡到了王者绝悟这种拥有更前沿创新价值以及应用价值的“多智能体”。
“多智能体”的研究并不简单。腾讯互动娱乐天美L1工作室总经理、王者荣耀执行制作人黄蓝枭曾表示,环境的不确定性、获取信息的局限性、个体目标与全局目标一致性的差异、高算力要求等原因,是如今研究“多智能体”技术上面临的挑战。
因此,王者绝悟的出现,就显得尤为关键。
一方面,王者荣耀这种多人竞技策略游戏,解决了“多智能体”研究场景缺失的问题。在游戏场景内,英雄选择、技能应用、路径探索、团队战略…预计有高达 10 的 20000 次方种操作可能性,AI需要在不透明、高度复杂的环境下快速做出决策。这是一个极佳的,模拟现实环境,甚至比现实环境还要复杂的“技术培养皿”。
另一方面,从结果导向上来说,王者绝悟的“多智能体”研究成果,是可以迁移、套用到其他游戏,甚至是现实应用场景中的。因为,所谓的“多智能体”,研究的是参与对象的决策与行动,环境的变量是动态的。只要参与对象够“聪明”,那么就能够根据环境变化,实时作出反应。
以当下火热的自动驾驶为例,引入多智能体的概念之前,传统的自动驾驶系统将所有“其他车辆”和设备视作敌对者,这在很大程度上降低了行驶效率。当所有汽车被纳入到多智能体生态中后,大家被允许协调地擦肩而过,进而才能形成真正有效率的“智能交通”。
甚至,在社会场景下,王者绝悟背后的“多智能体”还能通过模拟社会中人和动物的决策,来达到一个预测的效果,在区域经济、划分城市群等方面起到关键性作用。
所以说,王者绝悟的科研价值与未来潜力,并不是我们眼中看到的“战胜职业人气选手”那么简单。对于整个通用人工智能的发展而言,王者绝悟更像是一颗在培育着“技术”的种子,一张没有刮开的彩票。
技术的发芽
如今,王者绝悟其实已经取得了相当不错的成绩。
在技术的成长上,它经历了监督学习、深度强化学习,以及进一步引用了多轮组合博弈和层次化的强化学习算法等等,在王者荣耀场景内已经成为了一个所向披靡的“战将”。
而在应用层面,王者绝悟对游戏和整个电竞行业的价值是直白且明显的:在数值平衡性测试中,王者荣耀的数值平衡性调整偏差从1.05%,降低到了0.68%,相对缩小35%,保证了英雄不会存在大规模超模的情况,进一步提升游戏品质与玩家体验;
而对整个电竞行业来说,王者绝悟还能够为职业选手提供数据、战略与协作类实时分析与建议,以及不同强度与不同级别的专业陪练,优化电竞训练模式,进而促进电竞专业化的发展。
但是,正如上文所言,“王者绝悟”追求的终极目标,是 “通用人工智能”。这也就决定了,其价值并不仅仅局限在游戏、或者电竞层面,而是对整个通用人工智能进程上的推动作用。
其一,王者绝悟的研究方向,是符合整体通用人工智能前进趋势的。前几年人工智能的研究热点还围绕着“感知智能”。但是,随着神经网络的技术突破,“感知智能”已经日趋成熟,因此越来越多的研究者开始关注“智能决策”,从AlphaGo的单体决策,到如今王者绝悟的群体决策。
换言之,只要是在这个趋势上持续深耕,那么路径上的任何一个技术突破点,都有可能加快通用人工智能的整体研究进程。
毕竟,几十年来,游戏一直是人工智能领域研究的重点,是迈向更广泛应用的基石。像王者荣耀这类多人竞技性的战略游戏,由于具有博弈理论性强和涉及领域复杂的特点,更适合用于人工智能的技术研究。业界有一种说法:“下一个 AI 里程碑,可能会在复杂策略游戏中诞生”。
因此,在通用人工智能技术突破的探索上,王者荣耀这块试验田的价值,以及王者绝悟的研究必要性不言而喻。
其二,王者绝悟所最追求的,并非单一领域的“专才”研究,而是更大范围的“通才”研究。
如今行业里看到的,或者是常常讨论到的应用人工智能,大多是针对于某一个具体领域的研究,比如说机器视觉、语音智能等等。这种专一的人工智能领域,是实现商业化的最快路径。比如,语音识别能够快速应用到智能音箱中,智能导航也能够植入到扫地机器人里,从而标出更高的卖价。
但是,所谓的通用人工智能,指的让机器像人一样思考,像人一样能够结合周围情况,从而进行决策和行动,从事多种工作。这就意味着,通用人工智能注重的不应局限在单一的应用领域。这样的研究,是需要持续的投入、测试,并且很可能需要抛弃阶段性商业收益的。
而回看王者绝悟几年来的举措,便能发现短期收益并非是其追求;长线的技术壁垒突破和更大范围的落地测试、技术提升才是其所向往的目标。
据腾讯AI Lab高级研究员、王者绝悟AI模型负责人邱福浩介绍,如今王者绝悟拥有了可迁移性,可以应用于足球、FPS、RTS游戏,并且都达到了国际领先水平。这就意味着,王者绝悟,或者说底层的技术拥有了更多的实验田,以及更丰富的测试数据与技术沉淀。
另一方面,作为国民数字IP,王者荣耀也在主动承担科技责任,与腾讯AI Lab一同打造了人工智能研究平台“开悟”,开放数据与技术资源,并且联合高校、研究机构,探索“开悟”在多智能体人工智能研究技术教学和科研领域的可能性,让更多相关领域的人士和学者一同参与到推动通用人工智能发展的研究上来。
王者绝悟这种长远性的目光,以及王者荣耀本身的开放态度与举措,无疑在通用人工智能进程上是一大助力。
写在最后
现阶段,逼近人类大脑的“通用人工智能”也许仍是一个构想,即便有科学家预测其能够在二三十年间出现,想必也不会像电影里那样唯美。
在这个过程中,与其将王者绝悟定义为人们解决通用AI挑战的一个里程碑,倒不如说王者绝悟给通用人工智能的发展提供了一个更有价值的行进思路 —— “AI+游戏”。利用王者荣耀这块绝佳的技术实验田,积极联动产学研各方,储备人才与技术资源,深耕底层技术发展,埋下未来有可能会“智能爆炸”,实现自我升级、自我进化的通用人工智能的种子。
数据积累和技术革新,最后会让一个成熟的大脑走出培养皿,走出电子世界,走向菜市场或写字楼,让所有人获益。
在游戏《底特律变人》中描绘了这样一个场景:未来,每个人家庭里都有一个AI助手,她能够帮你处理家务、陪伴孩子、像人类一样无障碍的沟通,甚至能够借助数据分析,聪明到帮助人类调查刑事案件。
这种对通用人工智能的更具体、更现实的想象,也许就是黄蓝枭心里所期待的,那个“令人神往的数字未来”。