还记得中国人民的老朋友埃蒙斯么?
在2004年的雅典奥运会射击决赛中,美国选手埃蒙斯一直遥遥领先,打最后一枪之前,他已然领先第二名中国选手整整三环,金牌几乎唾手可得。而等他打完最后一枪,却惊奇地发现这一枪的成绩为0环!
这是怎么回事呢,原来埃蒙斯居然在关键时刻“脱靶”了!他把最后一枪打在了别人的靶子上(还打了个10.6环)。于是中国选手拿走了冠军……
奥运会的顶尖选手会脱靶,生命科学的顶尖技术亦是如此。
基因编辑中脱靶,后果很严重
近年来很火的 “基因编辑”技术一直有着脱靶的隐患,它们也会犯这种“打到别人靶子上”的毛病。尽管以CRISPR/Cas9等为代表的新一代基因编辑以精确著称,然而每一次基因编辑操作本质上都是成千上万的基因编辑工具分子对着成千上万的细胞做了成千上万次编辑,焉能次次不失手呢?
脱靶效应会带来大量突变,这些突变涉及了基因组的编码区和非编码区,甚至有可能会直接影响机体的生理功能,简单来说就是我们本来把它设计成编辑A基因,但它却意外搞坏了B基因。
奥运选手脱靶最多丢块金牌,基因编辑脱靶可就要出人命了。毕竟,现在大家都眼巴巴地盼望着基因编辑技术可以挽救一些目前无法治愈的遗传病,现在倒好,说不定应该修复的致病基因没有搞定,却意外搞坏了某个阻止癌症的基因,那岂不是治病不成反要命?
检测脱靶 为什么这么难?
要解决脱靶问题,首先是要确定基因编辑工具的脱靶率,从而采用更不易脱靶的工具。然而尴尬的是,因为缺少检测手段,科学家甚至根本就不知道基因编辑工具造成的脱靶问题有多严重,更别提比较几种基因编辑工具的脱靶率了。
做一下对照能不能解决这个问题?传统研究中,人们通常会试图将样本(比如说进行基因编辑的小鼠受精卵)分成两份,一份做基因编辑,一份不做,最后再测定两组小鼠的基因序列,除掉目标基因的变化,理论上剩下的基因差异就都有可能是基因编辑脱靶导致的。
然而理想很丰满,现实却很骨感。
首先世界上没有任何两只基因一模一样的小鼠,你永远不知道检测出来的基因差异是源自基因编辑的脱靶还是两组小鼠原本就有的个体差异。
第二,检测基因序列需要大量的样本,而传统上获得大量基因序列样本的方法,就是将这些DNA样本体外扩增。通俗来说就是把这些DNA样本在体外复制成千上万份,使之能满足大量基因测序所需的量。然而即便是目前人类发明的最优质的体外扩增体系也无法100%准确地扩增DNA,在扩增的过程会在DNA样本中掺入大量的突变,最终让DNA样本面目全非,这就是所谓的“扩增噪音”。
同样,你也无法判断你检测出来的DNA序列差异究竟来自脱靶效应的结果还是扩增噪音。
更糟糕的是,就和奥运选手打错靶子一样,基因编辑脱靶同样也是极其小概率的事件。这种信号很容易淹没在个体差异与扩增噪音之中,就宛如你无法在倾盆大雨中辨认出某一滴水滴落的响声一样。
GOTI技术:我来告诉你谁更靠谱
要听出这些水声,就唯有让这大雨停下来。
而中科院神经所的杨辉实验室居然就找到了让雨停下来的方法,那就是高精度检测脱靶的GOTI技术,相关论文发表在近期的《Science》上。
对,世界上没有两只老鼠的基因是一模一样的,但具体某一只老鼠体内的所有细胞的基因却是可以认为相同的。GOTI技术在小鼠受精卵发育到两细胞阶段的时候向其中一个卵裂球注射基因编辑工具,于是这两个来自同一个受精卵的,理论上DNA原本完全一样的卵裂球就能绝佳地彼此对照,从而排除了个体差异的问题。
但仅仅如此还不够,单个卵裂球当中DNA含量极少,远远不足以拿去做测序分析。但杨辉的团队用一个很巧妙的方法解决了这个问题,他们在注入基因编辑工具的同时也用一些特殊方法让这个卵裂球及其后代细胞发出荧光。然后直接将这个早期胚胎植入母鼠子宫内,让其发育成一个小鼠胎儿。
等这个小鼠胎儿长到足够大小,就直接把整个胎儿消化成一大堆单细胞,然后利用荧光的差异将注射过基因编辑工具与对照的卵裂球的后代区分开来,于是就得到了两堆差不多相当于小鼠胎儿总细胞量一半的细胞,这每一堆细胞中都包含着数以亿计的DNA分子,只要将其全部提取出来就足以做测序分析,从而绕开了体外扩增的步骤,扩增噪音的麻烦也解决了。
大雨散去,仅存的水滴便展露了出来,基因编辑工具的脱靶效应就此变得澄明了。
杨辉的团队检测了许多现有的基因编辑工具,结果可谓几家欢喜几家愁,最经典的CRISPR/Cas9系统经受住了最新检测技术的考验,即便在GOTI这么严格的检测中,也未能发现它有明显的脱靶问题。而同时,一种曾经被认为非常精准的单碱基编辑技术BE3却让人大跌眼镜,脱靶率奇高。
GOTI技术的原理及实验流程:(A) 实验流程. (B) 脱靶位点数目比较。Cre-, Cas9-, BE3- and ABE7.10组分别有14+/-12 (SEM, n=2),12+/-4 (SEM, n=11),283+/-32 (SEM, n=6)和10 +/- 5 (SEM, n= 4)个SNVs。(C) 突变类型的分布比较. 每个格子中的数字表示该种突变类型占全部突变的比例 (D) 脱靶SNVs富集在基因组中的转录区域。(E) Genes 包含脱靶位点的基因在细胞胚胎中有更高的表达量。
在暴雨中蹒跚前行了六年,我们终于得以准确判断CRISPR/Cas9的脱靶率,继而校验其安全性。可以期待在未来,这个领域必定能有序,健康地发展下去。
作者:唐骋(中国科学院神经科学研究所)
出品:科学大院
科学大院是由博览运营的中科院官方科普微信公众号,欢迎订阅(ID: kexuedayuan),想用啥编辑技术,先用GOTI测一测~
来源:知乎 www.zhihu.com
作者:中国科普博览
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载