筛查基因 诊断疾病(1)_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 生物 • 医学

筛查基因 诊断疾病(1)

《科学世界》  发表于 2018年05月17日

从人类破解“生命蓝图”至今,已经过去了十余年。这幅“蓝图”的内容由线状分子DNA书写。上面的信息以碱基为“字母”表达出来。它们共有4种:A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)。这4种碱基的排列顺序(碱基序列)构成了遗传信息。

DNA是什么形状的呢?它是由两条长链分子缠绕成的螺旋状结构(双螺旋结构)。在两条链之间,碱基成对相接(碱基对),连续排列。这些碱基对之间有各自的配对,如“AT”、“GC”,组合是固定的。

我们的身体由60万亿个细胞构成,这些细胞都是从精子和卵子受精形成的一个细胞(受精卵)分裂而来的,DNA就存在于每个细胞之中。在细胞分裂时,DNA会被复制,所以每个细胞中的DNA都是一样的。

 

30亿个碱基排列顺序已经被破解

存在于一个细胞DNA中的所有碱基序列被称为基因组。人的基因组由约30亿个碱基对构成。这30亿个字符究竟包含了多大的信息量?

打个比方,就按您现在所阅读文章的字体大小来计算。30亿个这样大小的文字全部刊登在《科学世界》上的话,大约需要15000多期才能刊登完,也就是说要连续出版大约1250年。另外,如果将30亿个这样大小的文字排成一条直线的话,那么大约是从北京到纽约的距离(约1万公里)。

拥有如此庞大信息量的人类基因组的草图于2000年发表,2003年解读完成。目前在这30亿个碱基序列中,99%的序列的测序正确率都达到了99.99%

在最初的人类基因组测序工作中,至少结合了20个人的DNA,以得到一个标准的参照序列。虽说,人类的基因组都大致相同,但是严格讲,每个人又都不同,这也决定了每个人的各种特征(如身高、性格)和疾病的形成特点都有差异。

 

基因组的“内容”是什么呢?

基因组究竟记载着什么样的信息?其中最重要的就是蛋白质的“设计信息”。由数千到数万的碱基序列构成的一个基本单位,显示的是构成蛋白质的信息。一说到蛋白质,我们可能常常会想到营养物质。这里的蛋白质是指对生物体来说有多种作用的“蛋白质分子”。

蛋白质的种类繁多,包括构成细胞和组织形态的物质,在体内引发各种反应(酶反应)的物质,使肌肉运动的物质,承载脑部传递信息的物质等约10余万种,可以说蛋白质几乎与所有生命活动息息相关。

碱基序列中指导蛋白质合成的基本单位就是我们常常听到的“基因”。不过基因只是长长的DNA中微不足道的片段而已。据说所有基因连接起来的长度也不过DNA总长度的1.5%

人体拥有2万2.5万个基因。蛋白质的种类之所以比基因的数量多,是因为有些情况下,一个基因的信息可以产生多个蛋白质。目前,有些不编码蛋白质的碱基序列也被叫做基因,但是基因原本的定义是指编码蛋白质的设计信息。

基因与基于该基因产生的蛋白质有相对应的名称。如编码肌肉重要组成部分的“肌凝蛋白”的基因被称为“肌凝蛋白基因”。当一个新发现的基因的具体功能还未明晰时,则用罗马字母或数字排列来为它们命名。

我们知道,每个人的基因的碱基序列各不相同。碱基序列有了变化的话,蛋白质的设计信息也会变化,由该基因产生的蛋白质的数量或机能也可能变化,进而这些影响就会体现在我们的体态或体质上。

120413_基因治疗-1 图1.jpg



(本文发表于《科学世界》2012年第4期)



全部评论

你的评论