人类基因组计划研究表明,人类基因组中只有不到2%的蛋白质编码序列,而剩余98%为非编码核酸序列。这些非编码序列可能有功能,也可能仅仅是副产物,曾被称为“垃圾DNA”或者“暗物质”。
随着认识的深入,人们发现,非编码序列经过广泛转录后生成的大量非编码RNA在个体生命中起着重要的生理调控功能。非编码RNA有着怎样的结构?如何发挥功能?认识这些,对于理解生命健康过程至关重要。
5月6日,《自然》杂志刊发了中国科学院生物物理所研究员薛愿超团队的最新成果。他们建立了能够捕获RNA原位高级结构和作用靶标的RIC-seq新技术,利用该技术首次在细胞内全景式的捕获RNA的高级结构以及各种类型非编码RNA的作用靶标,为RNA领域发展提供了全新的实验工具。
“高级”的RNA有“魔力”
非编码RNA在细胞中数量众多、无处不在。如今诸多研究表明,它不再是无用的“垃圾”,反而处处“刷存在感”。
已有相关研究表明,非编码RNA参与了胚胎发育、细胞增殖、分化、凋亡、感染以及免疫应答等几乎所有生理或病理过程的调控,并且与恶性肿瘤、心血管系统疾病、神经系统疾病、代谢疾病等相关的突变约90%定位在非编码区。认识非编码RNA的功能机制对于理解生命健康过程至关重要。
论文通讯作者薛愿超告诉《中国科学报》,虽然非编码RNA也携带遗传密码,但与编码蛋白质的mRNA不同的是,它们往往不具有蛋白质编码潜能。非编码RNA的调控功能主要是通过形成高级结构,并在RNA结合蛋白的介导下与其他mRNA或者非编码RNA相互作用而实现。因此,解析细胞内RNA的原位高级结构及相互作用靶标是探究非编码RNA功能机制的关键。
所谓高级结构,是指三级及以上的结构。“过去,可能很多人认为RNA仅仅是由A/U/C/G四种碱基所组成的线性序列,它的外观是像意大利面一样的条状分子。”薛愿超说。
事实上,RNA在细胞内通过A-U、C-G或G-U配对先形成二级结构,进而在RNA结合蛋白的协助下折叠成复杂的三级结构。而特定的RNA分子在形成复杂的三级结构后便具有了神奇的“魔力”,比如可以像蛋白质一样具有酶的催化活性。上世纪80年代初,美国科学家托马斯·切赫和西德尼·奥尔特曼正是因为发现具有催化活性的RNA分子而获得1989的诺贝尔化学奖。
然而,在整个转录组范围内研究RNA的三级结构或者说高级结构是RNA领域的世界性难题,难就难在利用现有的酶学和化学方法不能准确解析远距离的、非互补配对的RNA-RNA相互作用。
此外,非编码RNA发挥功能需要跟其他的RNA分子互作,这些互作被称为“靶标”。而只有准确地鉴定靶标才能推导非编码RNA跟其他RNA分子作用的规律,以及作用后如何影响靶标RNA的稳定性、翻译和定位等。
薛愿超表示,过去,我国在RNA结构及相互作用的技术研发原创性方面有所欠缺,现有技术也存在一定的局限性,比如得到的单链和双链信息不完整、在体外做近端连接假阳性率高等。
2015年,从美国加州大学圣地亚哥分校博士后出站,薛愿超入职中国科学院生物物理研究所并建立实验室。那时,他开始思考,是否能开发新技术来系统性研究非编码RNA的高级结构和作用靶标。
新技术实现“一网打尽”
2015年9月,薛愿超的第一位博士生、该研究的第一作者蔡兆奎进入课题组,年轻的“师徒”开始携手构建理想中的新技术。
考虑到RNA结构在细胞内和细胞外存在一定的差别,他们在对RIC-seq技术进行原理性设计时,重点突出了“原位”的概念。
“原位是指在保持细胞完整性的前提下,对所有空间上邻近的RNA进行近端连接、筛选和测序。”薛愿超说。
任何新技术诞生后都需要做大量验证以确定其准确度、可重复性和假阳性率,研究人员首先评估了RIC-seq技术的相关指标,通过比较和实验验证表明,与现有非编码RNA二级结构和三级结构相比,RIC-seq技术均表现得更好。此外,它还可“一网打尽”看清细胞内各种RNA-RNA空间相互作用,包括以前看不到的RNA三级空间邻近相互作用。
基于此,研究人员还构建了RNA三维作用图谱,通过解析发现了非编码RNA在细胞内的拓扑结构域和反式作用规律。
研究人员并未就此止步。
“我们还想能否用RIC-seq技术来看看启动子RNA和增强子RNA之间是否存在互作。”薛愿超说。
众所周知,基因什么时候表达,在什么组织里表达,均由增强子和启动子控制。在一个细胞里,大概有5万个启动子,而增强子至少有10万个,它们之间的对应调控关系是现代生物学研究的热点和难点。
同时,由于启动子和增强子区都可转录产生RNA,且增强子和启动子在空间上邻近配对后才能激活转录。这使得新开发的RIC-seq技术能够派上用场。
令他们意外的是,研究表明,启动子RNA和增强子RNA之间确实存在相互作用。“而且90%左右都可以利用实验进行验证。有意思的是,我们进一步证明了增强子和启动子RNA之间的相互作用对于染色质构象的形成和基因的激活很重要。”蔡兆奎说。
这也是在国际上率先证明了启动子和增强子非编码RNA之间的互作可用于推导其调控网络。RIC-seq技术被认为是RNA结构和靶标研究方面的一个飞跃,“如果说RNA二级结构研究方面我们处于跟跑状态,那么这次在RNA高级结构和靶标研究方面,我们在国际上应该说算是处在领跑位置。”薛愿超说。
诊疗病毒新“利器”
艾滋病病毒、埃博拉病毒、禽流感病毒......这些均属于RNA病毒,它们带来的疾病正在全球肆虐,威胁人类健康。
薛愿超指出,利用RIC-seq技术,我们能够在病毒侵入人体细胞的过程中解析病毒RNA的结构和靶标,这将有助于理解RNA病毒的致病机制。同时,根据解析的结构,还可设计出更为有效的小干扰RNA来切割病毒,达到治疗的效果。
此外,利用RIC-seq技术还可系统分析重大疾病相关突变对RNA高级结构和作用靶标的影响,这将有望揭示非编码区突变的致病机理,并为临床诊断和治疗奠定基础。
这一研究历时5年,蔡兆奎也在这个过程中完成了博士学业,逐步向一名科研工作者迈进。
蔡兆奎坦承,研究进展并不太顺利,用了2年时间对每个实验步骤进行反复优化,直到2018年3月才确定了最终的实验方案,并产生了高质量的测序数据。而此时,距离他博士毕业只剩下半年时间了。“我对这一课题比较感兴趣,决定延期两年,想坚持把课题完成再毕业。”
结果令人欣慰,今年6月,蔡兆奎也将迎来毕业答辩的时刻。在薛愿超看来,如果没有团队成员不放弃和不抛弃的精神,相信也很难有今天的成功。
不过,新技术应用仍面临诸多挑战。
薛愿超表示,把RIC-seq技术得到的RNA空间位置信息转变为可视化的RNA高级结构,这是当前最大的挑战。
“解决这一问题,需要与计算模拟和算法开发的专业团队合作,当然,我们自己也在做各种尝试,希望近几年会有成果出来。”薛愿超说。
下一步,他们希望从RNA结构和相互作用的角度入手,探究非编码区的疾病相关突变的致病机理,以及对RNA拓扑结构域的功能机制等RIC-seq技术引申出的科学问题进行探索。
相关论文信息:DOI:10.1038/s41586-020-2249-1
增强子-启动子RNA链接图
薛愿超团队
(图片来源:薛愿超)
请 登录 发表评论