为“垃圾DNA”正名_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 生物 • 医学

为“垃圾DNA”正名

admin  发表于 2017年12月07日

人类基因组数十亿个DNA碱基中,只有不到3%是编码蛋白质的基因,而其他大部分所谓的“垃圾DNA”毫无意义? ENCODE计划最新公布的成果表明,“垃圾DNA”其实是隐藏的宝藏。

 

采访 斯蒂芬·S·霍尔(Stephen S. Hall) 翻译 赵旭丹

 

从此,“垃圾DNA”(junk DNA)这个词就开始了与人类遗传学漫长的纠缠。2000年,当参与人类基因组计划的科学家首次描绘出人类基因组序列的草图时,初步结果似乎也证实,绝大多数序列——大约占人类基因组全部32亿个碱基中的97%——都似乎没有明确的功能。人类基因组这本“生命之书”的厚度似乎掺杂了太多水分。

几乎同时,十几个来自世界各国的实验室正着手开始一个规模庞大的项目,目的是为人类基因组中“谦虚低调的非基因”部分添加注解,这一项目因为内容单调乏味而在很大程度上少有人关注。这个名为“DNA元件百科全书”(Encyclopedia of DNA Elements,ENCODE)的项目,要求科学家“翻遍”整个基因组的所有序列,寻找任何与生物学意义有关的东西。2007年,ENCODE研究小组在其发表的初步报告中说,正如我们所有人堆放在阁楼里的东西一样,这些所谓的“垃圾DNA”中深藏着丰富的宝藏。

今年9月,在《自然》等杂志上发表的一系列文章中,ENCODE研究小组宣布,在人类基因组的全部DNA序列中,散布着数量巨大的神秘开关、信号和“路标”。随着研究的展开和深入,ENCODE计划刷新了生物学家研究、讨论和理解人类遗传与疾病的“词汇表”。

今年39岁的尤安·伯尼,在英国剑桥的欧洲生物信息学研究所工作,他领导着400余名ENCODE项目的科学家,为人类基因组序列添加注解。近期,《科学美国人》就ENCODE计划的最新重要发现,对尤安·伯尼进行了采访。

 

《科学美国人》:ENCODE计划所揭示的图景,让人们看到了大量的重要遗传元件——它们以前曾被忽视,并冠以“垃圾DNA”的名字。我们过去对基因组组织方式的理解是否太简单化?

伯尼:人们一直都知道,DNA中不仅有编码蛋白质的基因,还有调控元件,只是不知道调控元件究竟有多少,在全部基因组序列中占多大比例。

我可以先提供一个总体性数据,人类基因组序列中只有1.2%是编码蛋白质的外显子,而人们曾经一度假定,“参与调控的DNA序列数量也许大致与此相当,或者稍多一些”。但即使我们用非常保守的眼光审视ENCODE的数据,也会发现整个基因组中有大约8%~9%的序列都涉及类似调控的功能。

 

《科学美国人》:这么说来,基因组中的调控基因比编码蛋白质的基因多得多?

伯尼:是的,远不止9%。根据我们已经测定过的部分,最激进的观点甚至认为,这个比例可以达到50%。最后的结果一定是高于9%的,比如说20%,这完全有可能。

 

《科学美国人》:我们现在是否应该取消“垃圾DNA”这个说法?

伯尼:对,确实应该把这个词从词典中彻底删掉。它本来就是一个临时性词汇,只是用来描述20世纪70年代所发现的一些有趣现象。我现在可以断言,它已经不再适合描述如今的发现了。

 

《科学美国人》:这些“垃圾DNA”中有什么令你感到惊讶的东西呢?

伯尼:长期以来,ENCODE计划内外都有人争论,我们的实验结果是否真的描述了自然界中实际发生的事情。随之而来的还有一个更具哲学性的问题:这些实验结果到底重不重要?换句话说,尽管这些生化过程是实实在在发生的,但从进化的角度来看,我们的身体好像并不在乎这些事。

这一争论从2003年就开始了。但随后,无论是我们自己的工作,还是ENCODE项目之外的工作都表明,支配调控元件的进化规则与支配编码蛋白质的基因的进化规则并不一样。简单来说,调控元件的变化要快得多。所以,如果你发现了一个编码人类蛋白质的基因,那么大多数时候,你也可以在小鼠中发现几乎相同的基因,但这一规则却不适用于调控元件。

 

《科学美国人》:换句话说,人类的基因调控更复杂,而且这些调控元件的进化也快得多?

伯尼:当然了。我们对于基因和进化的认识完全改变了。我清晰地感觉到了此前对于自己无知的无知,而如今我终于认识到了自己的无知。当你发现这样的真相时,多少会有些沮丧。但这就是进步。理解一个东西的第一步,就是知道自己要理解什么,这正是我们现在的成果。

 

《科学美国人》:早期研究认为,整个基因组中只有3%到15%的部分是有功能的——比如编码蛋白质、调控基因或者其他作用。我是否可以认为,ENCODE的数据告诉我们,整个基因组中超过80%的部分都是有功能的?

伯尼:根据ENCODE的数据,我们可以得出结论认为,基因组中有功能部分的比例介于9%到80%之间,这是个很大的范围。事实到底如何?退一步看,我们的细胞中DNA是缠绕在各种蛋白质上的——多数是组蛋白(histones),它们的功能通常是使DNA结构保持稳定有序。此外还有被称为转录因子(transcription factors)的蛋白质,它们可以与DNA特异性地结合。在整个基因组中,一个转录因子大约只能与1 000个位点结合,所有可以结合的位点最多可能有50 000个。所以,我们说到9%的功能序列时,实际上指的是这些转录因子与DNA之间的相互作用。

另一方面,从DNA到RNA的转录过程似乎一直都在发生——事实上,整个基因组中大约80%的序列都会发生转录。而且,对于大量的转录过程到底是无关紧要,还是说这些转录产生的RNA发挥着我们目前还不知道的功能,到目前为止依然还有激烈的争论。

我个人认为,所有被转录的东西都值得进一步研究,这也是我们未来要完成的工作之一。

 

《科学美国人》:有一种相当流行的观点认为,通过“全基因组关联分析”(genome-wide association studies,GWAS)来确定与人类疾病相关的基因变异的研究收效甚微。事实上,ENCODE的结果表明,GWAS此前发现的与疾病相关的DNA区域中,大约 75%都不在编码蛋白质的基因附近。对于疾病研究而言,把精力集中在编码蛋白质的DNA突变上会不会是个错误的选择?

伯尼:GWAS是很有意思的研究,但它并不是医学研究的“神奇子弹”。GWAS的现状让每个人都为之头疼,但当我们把GWAS研究所揭示的遗传关联与ENCODE的数据放在一起进行比对时,我们发现,尽管这些基因位点并不临近编码蛋白质的基因,但它们确实与我们发现的新元件中的某一个非常接近。这是很有意思的现象。事实上,这样的发现是个大好消息,以至于当我第一次看到时,简直不敢相信这是真的。随后,我们又花了很多时间,再次确认了这所有的一切。

 

《科学美国人》:这些发现如何能帮助我们理解疾病?

伯尼:这就像是打开了一扇门。回想一下研究特定疾病的所有方法吧,比如说克罗恩病(Crohn’s disease):要不要检查一下肠道免疫细胞?或者看一下通向肠道的神经元?或者检查一下胃部,看它有什么情况?

所有这些都是可能因素。如今, ENCODE的结果突然让你能够在审视这些可能因素时说,“我确信,你应该先检查免疫系统中的这个部分——辅助性T细胞(helper T cells)”。对很多种疾病,我们都能做出这样的判断。这实在太令人激动了。

 

《科学美国人》:既然我们打算废弃“垃圾DNA”这个词,那么是否有另一个更好的比喻,来描述逐渐展现出来的遗传图景呢?

伯尼:现在的状况就像是一片丛林——我们必须努力开辟出一条道路,穿过这片茂密的丛林。我们正在努力寻找一条属于自己的路,到达一个确定的位置,却偏偏不知道自己所处的位置。你能理解吧,这时候感到迷茫是再正常不过的了。

 

《科学美国人》:过去20年来,公众一直被告知,这些规模庞大的基因组计划——从人类基因组计划开始,以及随后的许多其他计划——将会解答我们对“生命之书”的所有问题。ENCODE是这些计划中最新的一员吗?

伯尼:我想,对于每一项研究,我们都会说,“这些工作是在打基础。后来者可以在此基础之上继续前进”。没有人会说,“看,这就是人类基因组,已经研究得差不多了,我们只须做一些解读工作就行了”。相反,每个人都在说,“我们还要研究50年、100年,而人类基因组是我们研究的基础所在”。我确实觉得,ENCODE计划也是这一系列基础中新的一层,将来必然会有人站在它上面,看到更远的地方。最大的不同在于,我们已经知道自己所未知的东西。我也认为,人们会理解:尽管发现自己的无知会令人感到沮丧和挫败,但它本身是件好事。

对于人类基因组而言,10年前,我们还不清楚自己不知道什么。而现在,毫无疑问,ENCODE提出的问题远远超过它所给出的答案,这让我们清楚地知道,我们还有许多问题无法回答。与此同时,对于克罗恩病以及其他许多疾病,我们已经取得了很多快捷有效的进展和唾手可得的成果——至少对于研究人员来说是如此。面对这些进展和成果,你现在可以兴奋地向人们呼喊:“啊,天哪,快看看,我们竟然发现了这些!”

这只是前进道路上的一步。这是重要的一步,但距离终点还远得很。

 

《科学美国人》:你有时候说自己是ENCODE计划的“首席牧猫人”。整个ENCODE计划,究竟有多少人参与,你是怎么协调这么庞大的群体的?

伯尼:这是一种非常不同的科研方式。我只是整个ENCODE计划中400多名科研人员中的一员,我的职责是确保研究工作分配到位,并且得到解决。我需要汇集很多很多人的智慧。

所以我必然更像是一个“牧猫人”,或者说指挥者,而不是一个专注于ENCODE计划所有研究成果的研究人员。说到这里,我们就又回到了前面的比喻:这个领域就像是一片丛林。

 

《科学美国人》:那你的贡献是十分巨大的。这些科研人员可不是普通的“猫”,他们都非常有主见而又固执吧?

伯尼:他们确实是这样的。科学家可不会像小狗狗一样——狗生来就是喜欢扎堆的,“猫”可不是。我想,“猫”这个比喻应该是恰当的。所以,有些时候不得不通过引导,让研究人员向同一个方向前进。

 

《科学美国人》:你能不能预测一下,什么时候所有这些复杂的信息将会归结成一条相对简单的法则,来描述人类的遗传和疾病?还是说我们不得不接受人类基因组本来就极其复杂的事实?

伯尼:人类是复杂的生物。我们预期,人类基因组应该也是复杂的。但是我觉得,我们应该乐于接受这一点,甚至应当以此为傲。

 

本文作者 斯蒂芬·S·霍尔是一名科学作家,为《大西洋月刊》、《纽约时报》、《纽约客》以及其他许多杂志撰写科学文章。


全部评论

你的评论