人类大脑计划蓄势待发_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 生物 • 医学

人类大脑计划蓄势待发

admin  发表于 2017年12月07日

一个“虚拟的数字大脑”将会在超级计算机上运行,整合迄今为止神经科学所产生的所有数据,模拟整个人类大脑。这将给神经科学和医学带来重大变革,也会为建造更强大的计算机提供新思路。

 

撰文 亨利·马克拉姆(Henry Markram) 翻译 赵旭丹

 

整合所有已知信息来模拟整个人类大脑,意味着要打造一个不可思议的全新科学装置。这样的装置尚不存在,但我们已经开始动手打造了。你可以把它想象成有史以来最强大的飞行模拟器——只不过它模拟的不是空中飞行,而是大脑中的旅行。这个“虚拟的数字大脑”将会在超级计算机上运行,并将整合迄今为止神经科学所产生的所有数据。

 “数字大脑”将会成为整个科学界的资源:研究人员通过预约,就可以利用这一装置开展实验,就像今天的天文学研究人员预约最庞大的天文望远镜一样。科学家可以利用“数字大脑”来研究人脑在健康和疾病状态下的工作状况。通过使用“数字大脑”,人们不仅能开发新的诊断方法,还可以开发新的疗法,来对付自闭症、精神分裂症、抑郁症和阿尔茨海默病。这个把数以万亿计的神经回路汇集起来的方案,还会启发人们设计类似大脑的计算机和智能机器人。简而言之,它将重塑神经科学、医学以及信息技术。

 

硅晶片上的大脑

到2020年,科学家将能运行第一个模拟人类大脑的装置,因为那时候的超级计算机将有足够的运算能力,来支持模拟大脑所需的超大计算量。打造这一装置不需要事先解开关于大脑的所有谜题。事实上,这一装置将构建一个框架,加载我们已知的关于大脑的全部信息,同时也让我们能预测未知的东西。这些预测会告诉我们未来的实验方向,以免浪费精力。所有新产生的知识都将和已有知识整合,框架中的“空洞”会被越来越逼真的细节填满。最后,我们将得到一个大脑工作的整体模型,精确模拟从分子水平直到整个大脑各个层次上的活动。

打造这一装置正是人类大脑计划(Human Brain Project,HBP)的目标。这一计划由全世界约130所大学参与,将和其他5个项目一起争夺一项“大奖”:在未来10年里,欧盟将会为两个胜出者分别提供高达10亿欧元的经费。胜出者将在2013年2月揭晓。

人类大脑计划蓄势待发.jpg

我们需要建造这个模拟装置,理由至少有两个。首先,仅仅在欧洲,就有1.8亿人患有大脑疾病,即大约每三个人中就有一个——这个数字还将随着人口老龄化而继续增长。与此同时,制药公司却没有为研发神经系统疾病的新疗法而投资。从整体上研究大脑,将会让我们从生物学的角度重新认识这些疾病,而不是像现在这样,只将它们视为一系列症状。人类大脑计划将拓展我们对大脑的认识,使我们更进一步,开发新一代的疗法,有针对性地处理大脑内部的异常情况。

其次,计算能力很快将遭遇瓶颈。虽然计算机的运算能力一直在飞速提升,但无法完成许多动物大脑都能轻松完成的工作。例如,尽管计算机科学家在视觉识别方面已经取得了巨大进展,但是,计算机还是很难像大脑那样,利用特定场景的背景信息或琐碎细节来预测未来事件。

此外,更强大的计算机需要更多的能量,总有一天,为它们提供能量将会变得难以实现。如今,超级计算机的性能达到了每秒千万亿(1015)次浮点运算。而下一代超级计算机将会在2020年左右出现,运行速度将会是目前的1 000倍,达到每秒百亿亿(1018)次浮点运算。第一台每秒百亿亿次浮点运算级的超级计算机,需要消耗的电能大概会达到20兆瓦,这大致相当于冬天里一个小镇的能量需求。要想建造越来越强大的超级计算机,来完成一些人类能做到的简单有用的工作,同时又保持低能耗,我们需要一个全新的策略。

人类大脑进行各种智力活动时,功率只有20瓦左右,大约相当于一个低功率的灯泡,是每秒百亿亿次浮点运算级的超级计算机能耗的一百万分之一。借鉴人类大脑的工作机制也许有利于达成我们的目标。为此,我们需要了解大脑从基因到行为各层次的组织模式。我们已经获得了很多知识,但还需要将它们整合起来——模拟人类大脑的装置正是一个用来整合这些知识的平台。

有人批评说,建立人类大脑模型的目标是不可能实现的。他们的主要理由是,不可能完全模拟人类大脑100万亿个突触之间的连接关系,因为根本没办法检测它们。确实,我们没法检测人类大脑中所有突触连接形成的网络,但也正因为如此,我们根本不会去做这类检测——至少不会去检测全部的连接。我们会用其他方法,“复制”大脑细胞之间不可胜数的连接。

我们的方法关键在于确定基本蓝图,即在生物进化和每一个胚胎的发育过程中,负责指导大脑细胞之间形成连接的那一整套规则。理论上,这些规则就是我们着手构建大脑整体模型所需的全部信息。怀疑者们是对的:这一整套规则带来的复杂度令人望而却步——所以我们才需要超级计算机的帮助。然而,阐明这些规则本身却容易得多。从逻辑上来说,如果我们能顺利弄清这些规则,就能像生物体一直在做的那样,以这些规则为蓝图来构建一个“硅晶片上的大脑”。

我们所说的这些规则,既控制着那些决定脑细胞类型的基因,也指导着这些脑细胞的分布和连接。这些规则确实存在,我们为人类大脑计划做一些基础性工作时,已经发现了一些这样的规则。大约20年前,我们就通过测定单个神经元的特性来开始这项工作了。我们收集了大量关于不同神经元几何特性的数据,构建三维数字模型来模拟数百个神经元。我们还利用膜片钳技术进行了精心的研究,将微玻管电极的尖端插入细胞膜,测量离子通道两端的电压,成功记录到神经元的电特性。

2005年时,模拟单个神经元就需要一台强大的计算机,花费一个博士生3年的研究时间。但显然,更远大的目标也会很快变得触手可及,而且还可以为更大的神经网络构建模型,即使我们对这些网络还没有达到完全了解的程度。在瑞士联邦理工学院洛桑分校的大脑思维研究所,我们启动了人类大脑计划的前身——蓝色大脑计划(Blue Brain Project)。我们将建立“整体模型”,把关于某一大脑回路的所有已知数据和假说整合起来,消除其中的矛盾,标记出欠缺的知识。

 

虚拟模型革新医学

作为测试,我们构建了一个整体模型,来模拟被称为皮层柱(cortical column)的大脑结构。这个皮层柱相当于笔记本电脑中的一个处理器。打个简单的比方,如果把一个小型苹果去心器插入大脑皮层,然后拔出一块直径0.5毫米、高1.5毫米的圆柱形组织来,这就是一个皮层柱。在这一小块组织中,数万个细胞相互连接,形成了密集的网络。作为信息处理单元,这个圆柱体十分高效。一旦生物体进化出皮层柱结构,就会一直沿用这种方式,不断形成皮层柱结构,直到挤满颅腔,大脑皮层不得不皱褶起来,以便获取更多的空间——最后就形成了大脑表面复杂的沟回。

皮层柱结构垂直穿越了新皮层(大脑皮层的最外层)的6层细胞,其中的神经连接与大脑其他区域有所不同。这些连接的组织形式就像电话呼叫,每一个连接都会分配一个数字地址,并通过“交换机”来选择路线。一个皮层柱中大约有几百种神经元,利用IBM蓝色基因超级计算机,我们整合了关于不同神经元在皮层柱各层如何分布的所有信息,最后得到了一份“配方”,可以告诉我们在新生大鼠中,皮层柱是如何构建的。我们还利用计算机,让虚拟神经元按各种方式连接——但仅限于真实神经元相互连接的那些方式。我们花了3年时间来编写软件,构建第一个关于皮层柱的整体模型。有了这个模型,我们提出的“综合生物学”概念就有了依据(也就是根据全部已知的与大脑有关的生物学知识,来模拟整个大脑),我们也有了一套切实可行而又颇具创新性的新方法来做相关研究。

那时,我们的模型还是静态的——它相当于昏迷大脑中的一个皮层柱。我们想知道,这个模型是否会像真实的皮层柱一样活动,即使只能像从一块大脑组织切片中剥离下来的皮层柱那样也行。所以,我们给了它一点小小的外部刺激。2008年,我们用一个模拟的电脉冲刺激虚拟皮层柱,结果发现,神经元开始相互“交流”。作为大脑语言的“神经脉冲”,亦即动作电位(action potential),开始在皮层柱中传播,就像在集成电路中一样。神经脉冲在层间传递,而且不断往返,这与大脑组织切片中的情况完全一致。得到这样的结果,并不是因为我们对计算机模型进行了设定,而完全是我们在模型中构建的神经回路自发产生的。即使在刺激停止后,模型中的回路依然保持活跃状态,甚至它们自己产生了一些暂时性的动态变化,这是它们呈递信息的自有方式。

从那时起,我们把全球更多实验室产生的信息,逐渐整合到这个皮层柱整体模型中。我们也不断优化程序,这样每个星期升级皮层柱模型时,都能加入更多的信息、更多的规则,达到更高的精度。下一步,我们会把单个脑区的数据整合起来;然后,是整个大脑——从啮齿类动物的大脑开始。

我们的工作将会在很大程度上依赖神经信息学(neuroinformatics)。全球科学家得到了大量的大脑研究数据,这些数据需要以统一的方式汇集起来,然后在其中发现规则,用以描述大脑的组织方式。我们需要用数学方程来表述那些规则下的生物学过程,开发相应的程序,以便在超级计算机上解开这些方程。我们也需要开发软件,来构建一个与生物体相一致的大脑。我们将这一软件称为“大脑构建者”。

神经信息学对大脑工作机制的预测——预测会随着新数据的出现而不断优化,可以加快我们对大脑的认识,而不需要对大脑的方方面面都检测一次。根据已经发现的规则,我们可以做出一些预测,然后在实践中检验预测是否正确。我们当前的一个目标是,通过对特定神经元中编码某些蛋白的基因的了解,来预测这些神经元的结构和行为。我们把基因和神经元之间的这种联系称为“信息桥”,这是“综合生物学”给我们提供的一条捷径。

多年来,科学家其实一直使用另一种信息桥,这就是基因突变与疾病的联系,尤其是突变如何改变细胞产生的蛋白质,从而影响神经元的几何特性、电特性,神经元之间的突触连接,直至局部神经回路中那些尚未扩散到整个脑区的电活动。

理论上,我们可以编写程序,将特定突变引入模型,然后观察突变如何在上述生物学事件的每个环节对模型产生影响。如果最后产生的症状或者症状群与我们在现实生活中所见到的一致,那这条虚拟的事件链就是一个可能的致病机制,我们甚至可以沿着这一事件链寻找潜在的治疗靶点。

而且,模型可以不断升级。我们把所有能找到的数据整合进来,然后编写程序,构建模型,使之遵守特定的生物学规则,最后运行模型,把“输出”结果(即最终的蛋白质、神经元和神经回路的行为)与相关的实验数据进行比对。如果它们不一致,我们就回到最初,检查数据的精确性,优化生物学规则;如果它们一致,我们就引入更多的数据,添加更多的细节,把模型扩展到更大的大脑区域。随着程序的改进,数据的整合会变得更快、更自动化,模型的活动则会更接近真实的大脑。这样,在我们对细胞和突触的认知尚未完整的情况下,为整个大脑建立模型就不再是一个遥不可及的梦想了。

为了达成这个目标,我们需要数据,大量的数据。伦理关怀限制了神经科学家在人类大脑上所能进行的实验,但幸运的是,所有哺乳动物的大脑都遵循相同的规则,同时也有一些物种特异性的变化。我们所了解的关于哺乳动物大脑的遗传学信息,绝大多数来自小鼠,而猴子则向我们提供了关于认知的重要信息。因此,我们可以从建立啮齿类动物大脑的整体模型开始,把这样的模型当作初始模板,在此基础上建立人类大脑的模型,然后一步一步地整合更多的细节。这样,小鼠、大鼠和人类的大脑模型就可以同步发展。

神经科学家在研究中得到的数据,有助于我们找出控制大脑结构的那些规则,并能验证我们的推断(也就是一些生物学事件的因果关系)与生物学事实是否相符。在认知水平上,我们知道,婴儿对1、2、3这样的数字有一些认识,但对更大的数字就不行了。当我们最终构建出新生儿大脑模型后,这样的模型必须能告诉我们:哪些事婴儿能做到,哪些做不到。

我们需要的数据有很多已经存在,但要弄清楚这些数据背后的含义却并不容易。人类大脑计划面临的一个主要挑战就是,如何汇总并组织这些数据。比如在医学领域,相关数据具有重要价值的原因是,我们不仅可以通过一些功能障碍,了解某些组织的正常功能,而且我们构建的任何模型,都必须像健康大脑一样运行,然后又要像真实大脑那样生病。因此,患者的大脑扫描结果将是一个丰富的信息来源。

如今,每个患者的大脑扫描结果都会存入数字档案。全世界的医院存储着数百万份大脑扫描结果,尽管它们已经用于科研,但这些研究都是零零散散的,所以很大程度上,这些扫描结果还是未开发的资源。如果我们能将这些扫描结果聚合到互联网“云端”,同时收集患者病历、生化指标和遗传信息,医生就能对庞大的患者群体进行整体分析,找到某些疾病的发病模式。这一方法的优势在于,能用数学方式精确描述出所有疾病之间的相同与不同之处。一项名为阿尔茨海默病神经影像计划(Alzheimer’s Disease Neuroimaging Initiative)的跨高校合作项目,正在收集大量阿尔茨海默病患者和健康对照者的神经影像、脑脊液和血液记录,试图借此发现阿尔茨海默病的发病模式和机理。

 

改变未来?

最后,不得不提到计算机的问题。最新一代“蓝色基因”超级计算机的性能达到了每秒千万亿次浮点运算,这个庞然大物包含近30万个处理器,安装在72个机柜中。每秒千万亿次的运算速度,足够在细胞水平上模拟大鼠大脑中的2亿个神经元,但对于包含近千亿个神经元的人类大脑来说,却是远远不够的。为了模拟整个人类大脑,我们需要性能达到每秒百亿亿次浮点运算级的超级计算机,而即便如此,要想在分子水平上模拟人类大脑依然遥不可及。

全世界的科学家都在竞相建造这样的超级计算机。一旦建成,它们就会像上一代超级计算机一样,很可能用于模拟物理学过程,例如运行一些核物理学程序。生物学模拟有特殊要求,通过与大型计算机制造商以及其他行业伙伴的协作,我们的高性能计算专家会配置出一台用于模拟大脑的计算机。他们也会开发程序,以便让我们能够在可实现的范围内,构建一个从最低层次到最高层次的整体模型,这样,在我们的模拟程序中,就可以在分子、细胞、整个大脑等多个层次间自由切换。

一旦我们构建出模拟大脑的模型,研究人员就可以像使用生物样本一样,利用“程序样本”进行模拟实验,不过,这两者之间也有一些重要区别。比如,科学家现在通常是使用经过基因敲除的小鼠来寻找疾病的根源,他们必须花费时间繁殖小鼠,这需要高昂的成本,而且即使不考虑针对动物实验的伦理学质疑,这样的实验也并非总是可行——有时候,敲除某个基因会导致胚胎死亡。

而如果使用虚拟大脑模型,科学家就可以敲除虚拟的基因,从而以独特的方式看到这种基因敲除对不同年龄段的人类大脑所产生的影响。他们还可以在同一模型上任意改变条件,重复实验,把问题彻底弄清楚,而这在动物实验中是不可能的。这样的实验不仅会加快药物研发人员发现潜在药物靶点的进程,还会改变临床实验的开展方式。选择目标人群将变得更容易,而无效的或者副作用不可接受的药物将更快被筛除,最终结果必然是使整个研发流程变得更快捷、更高效。

我们从虚拟大脑模型中学到的知识,反过来也会为计算机设计带来启示。一个具有可塑性的大脑拥有巨大的存储能力,还能大规模、高速度地同时处理多个任务,所消耗的能量却只相当于一个灯泡。在虚拟大脑模型上进行的实验将会告诉我们,性能强大的大脑是如何进化出来的。

类似大脑的计算机芯片将用于建造所谓的神经形态计算机(neuromorphic computer)。人类大脑计划也将基于欧盟BrainScaleS和SpiNNaker项目所开发的技术,在硅晶片上印刷类似大脑回路的电路。

我们构建的第一代大脑整体模型在基本特性上会与人类大脑有一点区别:它们不会像儿童大脑那样发育。从出生起,大脑皮层会经历增殖、迁移和神经元修剪,以及一个高度依赖个人经历的、我们称之为可塑性的过程。我们的模型则会跳过多年的发育阶段,从某个预先设定的年龄开始获取经历。我们还需要建立一个机制,让这种模型能对环境信号作出响应。

虚拟大脑最终将迎来检验它的试金石:我们将把它与代表生命体的虚拟程序连接起来,放置到仿真的虚拟环境中。那时,这个虚拟大脑将会获取来自环境的信息,并据此作出响应。只有达到这样的效果,我们才能教它学习各种技能,判断它是否真的具有智能。我们已经知道,人类大脑具有冗余度,换句话说,有些神经回路的功能可以由其他回路来代替。所以,我们可以利用虚拟大脑,弄清楚人脑的哪些功能对于智力活动是不可或缺的。

人类大脑计划也带来了重要的伦理学议题。尽管可以完整模拟人类大脑的机器还远未实现,但是,人们仍有理由质问:这类机器所构建的虚拟大脑,是否会拥有比人类大脑多得多的皮层柱,或者这个虚拟大脑会不会不仅拥有超强的计算能力——超过IBM那台会下棋的“深蓝”超级计算机100万倍,同时又拥有人类那样的智力?

目前,在大脑研究领域,试图从整体上研究大脑的并非只有我们。2010年5月,美国西雅图艾伦脑科学研究所启动了它的艾伦人类大脑图谱计划(Allen Human Brain Atlas),目标是找出人类大脑中所有活跃的基因。

对于追求这种目标的团队来说,经费往往是最大的限制因素。对我们而言,只有取得足够的支持,才能达到目标。超级计算机价格昂贵,而人类大脑计划的最终耗资很可能赶上,甚至超过人类基因组计划。到2013年2月,我们就会知道能否继续开展这项研究。而在此之前,我们依然会怀着满腔热情继续前行,因为我们坚信,这将使我们获得对人类自身前所未有的认知:为什么我们能欣赏卡瓦拉齐奥(Caravaggio)名作中的明暗对比,为什么我们能思考量子物理学中的悖论。

 


全部评论

你的评论