弗莱堡大学研发AI系统LEARNA,可自主设计RNA分子

WechatIMG72_meitu_1

猎云网(微信号:)】1月5日报道(编译:停枫)

RNA,或称核糖核酸,存在于所有活细胞中。它作为信使,携带着DNA(脱氧核糖核酸)的指令,指挥着体内各种蛋白质的合成过程。当核糖核酸不能正常工作时,它会严重影响神经系统、心血管和肌肉的调节过程,导致肿瘤、胰岛素抵抗以及运动技能障碍等疾病。

对于人体来说,RNA如此重要,这也是为什么来自弗莱堡大学计算机科学系(University of Freiburg’s Department of Computer Science)的研究人员们专门开发了一个人工智能系统,名为LEARNA。这个AI系统可以学习设计用于研究的RNA分子。本周弗莱堡大学计算机科学系的研究者们将这一研究结果以论文的形式,刊登在预印服务器Arxiv.org之上,该论文的名称是:学习设计RNA(Learning to Design RNA)。

研究人员在论文中如是写道:

“设计RNA分子最近引起了医学、合成生物学、生物技术和生物信息学领域研究者们的兴趣,因为许多功能性RNA分子被证明参与了转录、表观遗传学和翻译的调控过程。在这里,我们为RNA设计问题提出了一种新的算法思路。”

1.jpg

正如这篇论文的作者所解释的一样,RNA的功能取决于它的结构特性。因此,对于研究者来说真正的挑战是识别RNA中导致其折叠成特定结构的模式和序列,有时被称为RNA反向折叠。

弗莱堡大学研究人员们给出的方法依赖的是一种深度强化学习(RL)算法,这是一种人工智能(AI)训练技术,该技术使用奖励来驱动个体朝着目标前进。这种算法训练是一个可以顺序预测整个RNA序列的策略网络,它生成此序列,折叠它,并使用从结果结构到目标结构的距离作为AI代理的信号。

与此同时,第二个LEARNA版本,也可以被称作是Meta-LEARNA,学习了许多RNA设计问题的单一策略,这些问题直接适用于新的RNA设计。也就是说,算法能够学习到一个量身定制的生成模型,通过选择放置核苷酸,即RNA和DNA的化学构建块,的动作来构建RNA序列样本,用于给定的RNA靶结构。

研究人员们在论文中写道:

“据我们所知,这是结构搜索在RL领域的首次应用,也是结构搜索在元学习(metalearning)领域的首次应用。”

在一台具有20个核心处理器的机器上对8000种不同RNA目标结构进行元学习一小时后,Meta-LEARNA成功解决了Eterna100基准测试中高达65%的目标结构。Eterna100,对于不那些熟悉的人来说,是由Eterna的成员创建的100个目标结构的集合,这是一个在线开放实验室,可以让用户创建折叠到特定结构的序列。此外,它只需要90秒即可达到与之相同效果的任何其他方法,并在三分钟内完成最先进性能的筛选。

同时,在另一个基准rfam.taneda上,Meta-LEARNA在10秒内产生了与最先进的方法一样好的结果,并且在1分钟后准确度超过了这些方法。这一结果与谷歌母公司DeepMind今年早些时候开发的蛋白质折叠AlphaFold系统的结果非常相似,预示着RNA生物学研究工作具有良好的发展前景。

研究人员们在论文中写道:“全面的实证结果表明,我们的方法在所有基准上都实现了最新、最先进的性能,同时在达到以前的最先进性能方面也快了几个数量级。”