关注Arnold组工作很久,今年春天尝试申她们实验室实习被拒,也算是一段缘分。
Directed evolution领域掌门人之一,Frances Arnold获今年诺奖可谓是实至名归。对今年诺奖工作的介绍已经见诸报端,而我想提及一下这个方向对于理论领域的价值。
在过去的几十年里,对酶体系催化活性的定向控制始终是悬而未决的理论难题;我们知道酶的性质依赖于基因序列,中心法则本身就可以视作基因组序列空间-氨基酸序列空间-蛋白结构空间-酶活性空间之间的映射。酶功能与活性对序列依赖的函数是非平凡的,我们显然无法通过常规的优化手段求出最优的基因序列。与此同时单个基因的状态数是 ,序列空间的大小随着序列长度而指数增长。对于这样高维的序列空间,如何逆向地为我们需要的目标催化功能寻找合适的酶分子?若干科学家试图从结构模建和第一性原理角度进行预测,但问题的复杂性超出了当下一切计算能力可以承受的限度。
这个领域呼唤一场范式革命!此时自然选择的进化过程为定向进化的开创照进了灵感。在自然界中,酶的功能优化则由进化过程统合起来;中性进化理论告诉我们,多数基因突变与重组是以蛋白原始功能为中心引入的噪声,而只有少数有益的突变由于适应性的增长而被保留下来。而通过发展先进的高通量技术,Arnold组通过实验室进化将这一过程加速了数百万倍:首先通过低保真的聚合酶系统性地引入突变,得到一系列突变体的mutant library,而后导入生源表达系统(如大肠杆菌)中,得到整个突变组的催化活性信息,再进行荧光筛选或噬菌体展示或抗体结合活性筛选,寻找我们想要的突变体。通过不断重复人工选择过程,目标功能信号可以被不断放大;这相当于通过展宽序列空间中的波包,不断探索催化活性区间中的优势区域。
在早期,定向进化用于优化一些已有的天然酶功能,以用于工业合成、绿色能源等领域。而近年Arnold致力于通过定向进化改造天然酶分子,获取在自然界中并不存在、而常规化学方法同样难以实现的功能,其成果令人赞叹不已。以细胞色素c和细胞色素P450为前体,Arnold展开了一系列令人目眩的研究:实现碳硅键和碳硼键的构筑、空间选择的烯烃氧化和小环系的合成。在今年四月,他们基于P450完成了对双环丁烷的合成:这一工作展现出Arnold团队对人工酶体系潜力预测的超强直觉,灵活运用通用定向进化策略,并在遇到瓶颈时持续寻找新的突破口,其成果可谓惊为天人。
Enzymatic construction of highly strained carbocycles
值得一提的是,France Arnold组近年也开始关注深度学习在酶性能预测中的应用;在高通量、标准化的实验室定向进化的支持下,我们可以获取真正意义上的酶活性大数据,这使得理论领域的跟进成为必然。
Learned protein embeddings for machine learning | Bioinformatics | Oxford Academic
目前,定向进化中对催化中心待优化氨基酸位点的选择仍然高度依赖经验,而泛化能力更强大的强化学习与深度生成模型的介入有望将这一“艺术”转变为一门更加可控的科学。我们可以期待在实验技术与理论模型的合作下,定向进化还将带来更为亮眼的进展。
来源:知乎 www.zhihu.com
作者:乔卓然
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有 87 个回答,查看全部。