在集装箱里建造数据中心
撰文 M·米切尔·沃尔德罗普(M. Mitchell Waldrop)
翻译 郭凯声
汽车或火车满载着钢制集装箱隆隆驶过的情景,你应该不陌生吧?不过,你看到的下一台集装箱里装运的也许不是木材、衣服或食品等常见货物,而是许多台精密配置的计算机服务器。这些总重可达10吨的设备已经准备妥当,一旦被安放在预定地点(比如某个停车场),就能立即投入使用,为某公司总部的上万名员工或互联网上的上万名用户提供服务。美国SUN公司已经着手推出这种移动式数据中心,把移动计算的概念提升到了一个全新的阶段。
当然,SUN公司“黑盒子计划”(Project Blackbox)的所谓“移动式”,只是一个工业概念,指的是整套服务器系统可以塞进一个标准的20英尺集装箱中方便运输,并非我们平常所说的“手提式”或“便携式”。一旦安放到位,它就是一套功能完备的系统,可以像笔记本电脑一样独立运行——所需的只是一根电源线和一个网络连接,外加一些冷却用水和外部制冷器。集装箱内最多可容纳250台服务器,提供高达7 TB(1 TB相当于1,000 GB)的热插拔内存(active memory)和2 PB(1 PB相当于100万GB)以上的硬盘存储空间。SUN公司的首席技术官格雷格·帕帕佐普洛斯(Greg Papadopoulos)指出,黑盒子提供的运算处理能力可与一座传统电脑机房媲美,而建造时间仅为后者的十分之一,成本更是只有后者的百分之一 ——这才是最重要的一点。
如此诱人的前景意味着,集装箱式数据中心不仅将取代企业数据中心,还可能改变我们每一个人使用电脑的方式。“黑盒子计划是SUN公司的一场豪赌,”帕帕佐普洛斯解释说,“我们赌的是,未来数十亿计的客户端设备——不论是台式电脑、笔记本电脑还是iPod,都会把绝大部分时间用在与网络的互动上。”这些设备无须像今天的大多数计算机那样,安装并运行不计其数的通用应用程序。相反,它们只须接入网络,使用在线程序软件,就可以实现文字编辑、表格处理等各类操作。
这一变革已经起步。现在,越来越多的人利用互联网来完成多种任务,例如发送邮件、撰写博客、网络交友、查询地图等。他们不需要把实现这些功能的软件安装在自己的电脑上,只是在需要时连入网络即可享受服务。这些通过网络实现功能的算法被人们冠以不同的名称,比如网格计算(grid computing)、效用计算(utility computing)或云计算(cloud computing)等。在帕帕佐普洛斯看来,这些进步与一个世纪以前电力的普及有异曲同工之妙:既然插上插座即可从电网中获取电力,那么还有几个人会在地下室里装台发电机来为自家供电呢?
黑盒子的优势
如果云计算是未来的发展方向,那么互联网的规模就必须大大扩展,传输速度也必须提高,黑盒子在这方面或许可以发挥关键作用。诚如帕帕佐普洛斯所言,现在的互联网上已有不少“计算电站”了,它们都是大型的数据中心,由成百上千台电脑构成,密密麻麻地堆挤在从地面一直延伸到屋顶的巨大机架上。
问题在于,这些“电站”的“发电能力”越来越赶不上需求的增长。每个新的数据中心都需要按照特定需求,一台电脑一台电脑地量身设计并专门安装,整个过程可能耗时数年,耗资数千万美元。一旦建成并投入运转,数据中心的日常开支也相当惊人—— 一方面是因为电脑机房挤占了租金昂贵的写字楼办公面积,另一方面则是因为数据中心需要大功率空调24小时运转,以冷却不计其数的微处理器,防止这些耗电大户“发烧中暑”。正如SUN公司首席执行官乔纳森·施瓦茨(Jonathan Schwartz)在黑盒子计划启动仪式上所说:“我遇到的几乎每一位首席资讯官和每一家企业都声称,数据中心在电力和占地方面的消耗令他们头痛不已。”
SUN公司的目标,就是提供一条解决这个问题的出路。那些通过建立巨型服务器站点来支持不断飙升的网络数据流量的大公司(例如Qwest、Level 3、Akamai、Google等),只须把预制的集装箱连接起来,便可大幅提高通信容量,不但节约大量时间,还能省下数百万美元。这些公司还可以把黑盒子部署在许多其他地方,以不断扩张网络节点。
与此同时,那些必须扩充内部计算能力的企业也有了新的选择。以美国纽约市的一家公司为例,如果他们有意扩充公司设在商业区的数据中心,就可以在屋顶或车库中安装新的服务器集装箱,甚至可以安置在新泽西州的廉租库房之中。石油公司可以把黑盒子安装在近海石油钻井平台上,用来执行现场操作和地震监测等任务。人道救援组织可以在灾区设置应急数据中心,以协调救灾行动。美国五角大楼也可以布署移动式数据中心,用于支持作战行动。
当然,这些黑盒子在现实环境中才刚刚开始接受考验。在某些地方,政府的规划和建筑条例也许会使服务器集装箱的安置变得相当棘手。几乎没有哪个停车场和屋顶可以提供现成的600安培工业电缆导管、超高带宽的网络接口、每分钟注水60加仑(约220升)的水管,以及大型冷却设备(用于冷却循环水)。此外,安全围栏、监控摄像头或保安人员也是必不可少的。
尽管仍存在问题,但业界的反应却相当积极。《信息世界》(InfoWorld)杂志曾将黑盒子评为“12大可行奇妙技术构想”之一。美国加利福尼亚大学伯克利分校的著名计算机科学家、SUN公司技术顾问团成员戴维·帕特森(David Patterson)说,黑盒子可以让企业“把自己的数据中心安置在更廉价、更环保的电源附近,比如水电大坝或风力电站周围”。他还指出,黑盒子的普及“可以大幅降低效用计算的成本——这意味着未来我们出行时只要携带一部手机即可,要做的所有事情几乎都可以通过网络在线服务完成”。
十年酝酿
两年前,帕帕佐普洛斯和电脑发明专家丹尼·希利斯(Danny Hillis)曾有过一次交谈,黑盒子计划的构想正是源于这次讨论所激发的灵感。不过希利斯指出,有关的想法早在十多年前就已出炉——当时他还在美国马萨诸塞州坎布里奇市的超级电脑制造商Thinking Machines公司担任首席科学家,而帕帕佐普洛斯则是他刚从美国麻省理工学院招来的工程师。
希利斯回忆说:“当时我们喜欢聚在一起天马行空地猜测,有朝一日电脑变得既小巧又便宜时,世界会是什么样子。我们很喜欢这样一个想法:将来大家的桌面上只需要一台非常简单的机器,而大部分工作则在塞满了电脑的专用大楼内完成。”
1994年,Thinking Machines公司宣布破产,但有关讨论仍在继续。10年之后,因SUN公司对Thinking Machines的技术兼并而加入SUN公司的帕帕佐普洛斯专程拜访了希利斯,此时的希利斯已经在美国加利福尼亚州格伦代尔市创办了自己的技术顾问公司Applied Minds。当两人正在为如何制造最小、最省电的计算机而冥思苦想之际,希利斯却异想天开地把问题翻转了过来:最大的电脑又该是什么样子呢?
帕帕佐普洛斯认为,最大的电脑可以有多大,实际上应该由能够四处移动的最大的箱子来决定。这个想法很快激发了他们的灵感:何不把电脑系统造在集装箱里,把集装箱变成电脑呢?
这一构想并非他们首创。他们在Thinking Machines的另一位前同事布鲁斯特·卡尔(Brewster Kahle)已经尝试向发展中国家提供建造在集装箱内的电脑系统了。美国军方也试验过,把装在卡车中的移动式数据中心用于军事行动。但是,那些设计都是特制的一次性产品。对于可以大批量生产的移动式数据中心,还没有人认真考虑过设计建造所需的技术要求。
实现之路
对集装箱电脑的构想大感兴趣的帕帕佐普洛斯立刻委托希利斯及其公司同事,为SUN公司设计并建造一台样机。不过,这项任务并不像看上去这么简单。希利斯可不能把一堆服务器一古脑儿塞进集装箱就算了事,那样做无异于把服务器扔进烤箱。一个标准服务器机架上所装的服务器,总耗电量高达25千瓦,这些电力最终几乎都会转变为热量。因此,传统的数据中心必须在机架之间留出足够的空间,通过空气流动来冷却服务器——这就是数据中心占地如此之大的主要原因之一。然而,在密封的集装箱中,热量将无处散发。“这是我们遇到的头号技术难题,”帕帕佐普洛斯说。
经过反复摸索,他们提出了一个简单得令人叫绝的解决方案。标准集装箱宽和高均为8英尺(约2.4米),长为20英尺(约6.1米)。每个服务器机架最多可像比萨饼盒那样,层层叠放38台服务器,这些机架就像立式大书架一样,只不过都没有背板。四个这样的“书架”沿着集装箱一侧的箱壁摆放,彼此之间留有间隔(参见左页插图)。每两个书架之间都安装一台高大的水冷式热交换器。另外一组四个机架及配套的水冷装置则沿集装箱的另外一侧箱壁摆放。
按照这种布局,第一个服务器机架产生的热气将从背面排出,径直进入相邻的热交换器。热交换器抽取热量冷却气体,再将气体送入下一个机架的正面。这个机架排出的热气又会进入下一台热交换器,如此传递下去。气体会沿着集装箱的一侧箱壁走到尽头,再沿着另一侧的箱壁返回起点。一旦集装箱门关闭,空气就会这样不断地循环下去。
当然,问题的关键是热交换器必须把热水排到集装箱外,或者使用外部冷却装置把变热的水冷却后再循环利用。不论采用哪种方式,热交换器都必须能够迅速吸收大量热量,因此流经热交换器的冷却用水流量必须达到每分钟60加仑,需要使用相当粗的水管来供水。
另一个需要考虑的实际问题是带宽。如果有一万名公司员工或互联网用户在使用黑盒子中数TG的内存,只为黑盒子铺设一条电话线作为网络连线显然不够。SUN公司建议使用专用光缆作为数据传输线。如果把黑盒子安置在办公大楼的车库之中,这一要求还不算麻烦,但是要把黑盒子放到郊区的库房或者电力成本低廉的偏远发电厂附近,企业就不得不向当地通信公司租用光缆了。当然,黑盒子的“主人”还必须为系统编写程序——不过,大多数公司会自己动手,以便更好地调整设置,满足各自具体的需要。
希利斯的团队制造的样机一直顺利运行到2006年春季,SUN公司终于决定开发面向市场的集装箱式数据中心。帕帕佐普洛斯邀请他在Thinking Machines公司的另一位前同事、SUN公司先进技术副总裁戴维·道格拉斯(David Douglas)来领导产品的开发团队。
“希利斯的样机已经解决了80%的问题,”道格拉斯说,“我现在要做的事情,就是弄清楚如何实现这种东西的工业化生产——如何大批量地把空集装箱改造成数据中心,如何降低制造成本并提高系统可靠性。”
道格拉斯说,解决问题的途径就是一次又一次地对系统进行细微的改进。找到为冷却系统排布管线的最佳方式;安装积水监测器以迅速检测漏水部位;为有时必须呆在集装箱内的操作人员设置意外逃生路径;设法适当安排服务器之间数据连线的走向,方便维修人员必要时取出某一单元进行维修;在每个计算机机架下安装减震垫,使它们在遇到不可避免的野蛮装卸时仍可安然无恙。诸如此类,不可胜数。
把黑盒子进行到底
2006年10月,SUN公司终于大功告成,正式对外公布了黑盒子计划。(为了应景,那个原本亮白色的集装箱也被匆匆改漆成黑色。)帕帕佐普洛斯宣称,一些潜在客户当场就对黑盒子“一见倾心”,不过他们的理由却与他最初的设想不完全相同。
帕帕佐普洛斯说:“我们最初大感兴奋的原因是,这些系统终于可以成为真正省电、真正廉价的数据中心了。但是我接触过的‘早期受众’对黑盒子系统的预制特性和方便快捷更感兴趣。他们说:‘能不能在30天、60天、90天内供货,我们需要它马上就能工作。’”
SUN公司不愿透露有多少客户真的下了订单。帕帕佐普洛斯说:“我们有一条非常稳固的经销渠道。”有人指出,服务器集装箱的运算速度无法进一步提高,因为它们无法排出更多的热量,“这些家伙的系统已经热得快要熔化了”。对于这样的质疑,帕帕佐普洛斯回应说:“我们早就料到有人会对我们的构想不以为然,毕竟这也算是数据中心领域的一项非同凡响的新主张。不过我们没有料到的是,仅仅经过了一次演示,就有人跑来对我们说:‘我要10台,明天就要!’”
请 登录 发表评论