大脑,是由轴突相连结的神经细胞网络,而细胞本身,又是由生化反应相连结的分子网络。社会也是一个网络,它由友情、家庭和职业关系彼此连结。在更大的尺度上,食物链和生态系统可以看作由物种所构成的网络。科技领域的网络更是随处可见:因特网、电力网和运输系统都是实例。就连在文章中我们用以向你传递思想的语言,也是一种藉由语法相互串连在一起的文字网络。
尽管网络是如此重要和普遍,但科学家对它的结构和属性却知之不多。在复杂的基因网络中,故障节点是如何相互作用而引发癌症的?在特定的社会和通信系统中,疾病和电脑病毒如何快速传播而导致流行?某些网络即便大部分节点失效,还能维持运行,原因何在?
最近的研究开始找到这些问题的答案。过去的几年中,不同领域的研究者发现,很多网络都是由少数一些具有众多连结的节点所支配的,包括万维网、细胞代谢系统,以及好莱坞的演员网络在内。包含这种重要节点(或称集散节点)的网络,我们通常称之为“无尺度”(scale free)网络。在无尺度网络中,有些集散节点甚至具有数不清的连结,而且不存在代表性的节点。这种网络还具有可预期的行为特性:例如对意外故障具有惊人的承受力,但面对协同式攻击时则很脆弱。
这些发现极大地改变了我们对复杂外部世界的认识。集散节点的存在,让我们认识到了以前的网络理论尚未涉及的问题:各种复杂系统具有相同的严格结构,都受制于某些基本的法则,这些法则似乎可同等地适用于细胞、计算机、语言和社会。更进一步,认识这些法则,会帮助我们解决一系列重要问题,包括开发更好的药物、防止黑客侵入互联网、阻止致命流行病的传播,等等。
无尺度网络
在过去40多年里,科学家惯于将所有复杂网络看作是随机网络。这一思想源于两位匈牙利数学家的研究,他们是卓越的Erdos以及他的密切合作者Renyi。1959年,为了描述通信和生命科学中的网络,Erdos和Renyi提出,通过在网络节点间随机地布置连结,就可以有效地模拟出这类系统。这种方法及相关定理的简明扼要,导致了图论的复兴,数学界也因此出现了研究随机网络的新领域。
随机网络理论有一项重要预测:尽管连结是随机安置的,但由此形成的网络却是高度民主的,也就是说,绝大部分节点的连结数目会大致相同。实际上,随机网络中节点的分布方式将遵循钟形的泊松分布。连接数目比平均数高许多或低许多的节点,都十分罕见。有时随机网络也称作指数网络,因为一个节点连接k个其他节点的概率,会随着k值的增大而呈指数递减。
因此当1998年,我们与美国圣母大学的郑夏雄及Albert合作,开展一个描绘万维网的项目时,我们满以为会发现一个随机网络。原因如下:人们会根据自己的兴趣,来决定将网络文件连结到哪些网站,而个人兴趣是多种多样的,可选择的网页数量也极其庞大,因而最终的连结模式将呈现出相当随机的结果。
然而,实测结果却推翻了这个预测。在这个项目中,我们设计了一个软件,可从一个网页跳转到另一个,尽可能地收集网上的所有连结。虽然这个虚拟机器人仅仅探索了整个万维网的极小一部分,但它组合出来的图景,却揭示了令人惊异的事实:基本上,万维网是由少数高连结性的页面串连起来的,80%以上页面的连结数不到4个,然而只占节点总数不到万分之一的极少数节点,却有1000个以上的连结(一项后续的网络调查显示,有一份文件已经被超过200万的其他网页所连结!)。
我们在计算恰好拥有k个连结的万维网页面的数目时,发现网页的连结分布遵循所谓的“幂次定律”:任何节点与其他k个节点相连结的概率,与1/k成正比。对于流入的连结而言,n值接近于2,这也就是说,流入连接数只有某站点一半的站点,在网中的数量却有该站点的4倍之多。幂次定律和表征随机网络的钟形分布大相径庭。具体来说,幂次定律不像钟形曲线那样具有一个峰值,而是由连续递减的函数来描述。如果用双对数坐标系来描述幂次定律,得到的是一条直线。与随机网络中连结的民主分布不同,幂次定律所描述的,是由少数集散节点(如Yahoo和Google)所主控的系统。
随机网络中绝对不可能出现集散节点。当我们开始描绘万维网时,原本预期节点会像人类的身高一样遵循钟形分布,但结果却发现有些节点不能如此解释。我们就像突然发现了很多身高百尺的巨人一样,大吃了一惊。因此,我们想出了“无尺度”这样的用语。
无尺度网络在哪里?
就连好莱坞演员网络也是无尺度的。这个网络因“六度凯文贝肯”的游戏而变得众所皆知。游戏玩家通过共同出演的电影,尽量让特定的演员与凯文贝肯产生关联。定量分析显示,这个网络也是由某些集散节点所支配的。具体来说,就是大部分演员只与为数不多的其他几个人相连结,而少数演员所拥有的连结数却高达数千个,其中包括Rod Steiger和Donald Pleasence。顺便说一下,在演员连结数的排行榜上,凯文贝肯自己只排在第876位。
重新回到严肃的话题,无尺度网络也出现在生物学领域。我们与美国西北大学的细胞生物学家Oltvai一道,发现古菌域、细菌域和真核生物三大生物领域的43种不同生物里,都存在无尺度的细胞代谢网络结构。在这些网络里,细胞通过分解复杂分子来燃烧食物并释放能量。每个特定的分子就是一个节点,而节点之间的连结则是生化反应。我们发现,大部分的分子只参加一种或两种反应,但是有少数分子(集散节点)会参与大部分的反应,比如水和三磷酸腺苷。
我们还发现,细胞中蛋白质的交互网络也是无尺度的。在这种网络中,如果两种蛋白质能相互反应,就认为是彼此“连结”的。我们在研究酵母这种最简单的真核细胞时,在它的数千个蛋白质之间找到了一种无尺度的网络拓扑结构:大部分蛋白质只与其他一、两种蛋白质发生相互作用,但有几种蛋白质分子却能与大量的其他蛋白质相结合。我们在另一种与酵母迥然不同的简单细菌——幽门螺杆菌中,也发现了类似的蛋白质交互作用网络。
事实上,科学家研究的网络越多,发现的无尺度结构也越多。这些发现引发了一个重要的问题:为什么像细胞和因特网这样本质上不同的系统,却具有相同的结构并遵从相同的规律?这些不同的网络不仅都是无尺度的,而且还有着一个有趣的共同点:由于某些未知的原因,幂次定律中k项中的n值,通常介于2—3之间。
集散节点的马太效应
一个更为基本的问题也许是,为什么随机网络理论不能解释集散节点的存在?我们进一步考察了Erdos和Renyi的研究,发现这里面存在两个原因。
在建立模型的时候,Erdos和Renyi曾假设,他们在安置连结之前能够得到所有节点的清单。而事实上,万维网的页面数量绝对不是恒定的。1990年整个万维网只有一个网页,而到今天它的网页数已经超过了30亿。大部分网络也都具有类似的发展过程。1890年好莱坞只有屈指可数的几位演员,但随着越来越多的人加入这个行业,新人与老演员建立联系,如今这个网络已经超过了50万人。大约30年前,整个因特网只有几个路由器,随着新的路由器与网络原有的路由器相连结,如今路由器的数量已经高达百万。由于现实中的网络具有不断成长的本性,所以老节点获得连结的机会就比较高。
此外,并非所有的节点都是平等的。在选择将网页连结到何处时,人们可以从数十亿个网站中进行选择。然而我们大部分人只熟悉整个万维网的一小部分,这一小部分中往往包含那些拥有较多连结的站点,因为这样的站点更容易为人所知。只要连结到这些站点,就等于造就或加强了对它们的偏好。这种“优先连结”的过程,也发生在其他网络。在好莱坞,连结关系较多的影星更容易受到新秀们的重视。而在因特网上,那些连结较多的路由器通常还拥有更大的带宽,因而新用户就更倾向于连结到这些路由器上。在美国的生物技术产业内,像Genzyme这样的知名公司更容易吸引到同盟者,而这又进一步加强了它在未来合作中的吸引力。类似地,被引用较多的科学文献,会吸引更多的研究者去阅读和引用。美国著名的社会学家K.Merton将这种现象称之为“马太效应”。这个词来源于新约圣经的内容:“凡有的,还要加给他,叫他有余。”
成长性和优先连结这两种机制,有助于解释集散节点的存在:当新节点出现时,它们更倾向于连结到已经有较多连结的节点,随着时间的推进,这些节点就拥有比其他节点更多的连结数目这种“富者愈富”的过程,有利于早期节点,它们更有可能成为集散节点。
无尺度网络的“软肋”
总的来说,大尺度网络对意外故障具有惊人的强韧性,这一特性本质上源于这些网络的非同质拓扑结构。但是,对集散节点的依赖,也带来了一个严重问题:面对蓄意攻击时,网络可能不堪一击。
通过一系列的模拟,我们发现,只要去除少数几个主要集散节点,就可导致因特网溃散成孤立无援的小群路由器。类似地,对酵母的实验也显示,去除那些高连结性的蛋白质,比去除其他节点更容易导致酵母菌死亡。这些集散节点是决定性的,一旦发生使它们无法运作的突变,极有可能会导致整个细胞死亡。
对集散节点的依赖,视系统的不同,既有利也有弊。对因特网和细胞而言,能够应付随机出现的意外故障,当然是个大优点。此外,细胞对集散节点的依赖,也给药物研究者提供了新的方法:有可能找到这样的药物,能针对性地攻击细胞或者细菌的集散节点,以便杀死它们而又不会影响健康的组织。不利的情况也有:少数消息灵通的黑客只要攻击一些集散节点,就足以搞垮整个通信基础网络,这正是人们关心的焦点。
无尺度网络的这一致命缺陷,引发了这样一个问题:到底有多少集散节点是必不可少的?最近的研究表明,总的来说,只要有5—10%的集散节点同时失效,就足以搞垮系统。我们对因特网的实验显示,一次有组织的协同攻击,只要去除掉若干个集散节点(先去除最大的,再去除次大的,依次类推),就足以造成重大破坏。因此,为了避免因恶意攻击带来网络的大规模破坏,最有效的办法就是保护好集散节点。不过,要想知道特定的网络系统到底有多容易被破坏掉,还有待进一步的研究。例如,如果Genzyme和Genentech这样的集散节点一旦失去作用,是不是美国的生物产业会因此而崩溃呢?
“无尺度”流行病
对无尺度网络的认识,也可用于理解电脑病毒、疾病和时尚的传播。过去数十年间,无论是流行病学家还是市场营销专家,都在大力研究扩散理论。研究结果指出,一种传染病要在人群中传播开来,必须要跨越某一临界值。任何病毒、疾病或时尚的感染力一旦低于这个临界值,将不可避免地自行消亡;而一旦超过临界值,就会呈指数增长,最终传遍整个系统。
然而,西班牙巴塞罗那加泰罗尼亚理工大学的Pastor-Satorras和意大利特里雅斯特国际理论物理研究中心的Vespigniani,最近却得出了一个令人不安的结论。他们发现,在无尺度网络里,不存在上面所说的临界值。这就意味着,所有病毒都可在网络中传播和长期存在,即便是那些传染力很低的病毒也是如此。达一结论解释了“爱虫”现象,(爱虫是有史以来最具破坏力的电脑病毒,2000年导致了英国议会电子邮件系统的瘫痪),这个病毒原本理当绝迹的,但过了一年之后,却仍然是最普遍的病毒之一。
因为集散节点会连结到很多其他节点,所以任何一个遭受病毒人侵的节点,都将连带感染至少一个集散节点。而一旦有集散节点被感染,它就会把病毒传播给众多的其他节点,当中也包括其他的集散节点,这就导致了病毒在整个网络里的传播。
社会网络在许多情况下也是无尺度的。生物病毒在社会网络里传播的现象,提醒科学家要再好好研究一下那些探讨网络拓扑结构和流行病之间互动关系的文献。特别是对于无尺度网络而言,公共卫生中传统的随机接种疫苗的方式可能很容易失效,因为它极有可能遗漏了某些集散节点。事实上,为了保证集散节点不被遗漏,几乎人人都得接种疫苗。例如,90%的人口都必须接种麻疹疫苗,才能够有效防疫。
如果医生放弃随机接种疫苗的方法,而把目标转向集散节点,也即那些最易感染的个人,情况会如何呢?对无尺度网络的研究指出,只要其中包含集散节点,即使接种疫苗的人口只占一小部分,这种方法仍有可能会奏效。
然而,要找出社会网络中的集散节点,比其他系统要难得多。尽管如此,以色列巴伊兰大学的Cohen和Havlin,以及美国克拉克森大学的ben-Avraham已经提出了一个聪明的解决办法:任意选择一群人,请他们随机指定一位相识者,然后对这一小部分被指定的人接种疫苗。这一程序很可能会把集散节点圈入其中,理由是,集散节点与许多人都有连结,而连结性高的人更容易被指定。不过这一方法也存在一些道德上的困境。
请 登录 发表评论