备份你的人生
撰文 戈登·贝尔(Gordon Bell)
吉姆·格默尔(Jim Gemmel)
翻译 郭凯声
人的记忆力难以捉摸:忽而不记得好友的电话号码,忽而忘记了业务联系人姓甚名谁,忽而记不清一本爱书的名字……丢三落四的情况每天都在提醒我们,记忆力是有限的。人们想出种种方法来对付健忘,比如,把事情记在备忘录上,或者把电子地址簿存入掌上电脑,可不少重要信息仍然在不经意间溜走了。近年来,我们在微软研究部的开发团队着手用数字手段,按时间顺序逐一记录个人生活的方方面面。过去6年间,我们尽力记下戈登·贝尔(本文作者之一)同其他人往来的一言一行、同机器交互的一举一动,记录他看过的图像、听到的声音、浏览的网站——把他经历过的一切都收录在一部便于翻查、安全可靠的个人数字档案中。
数字记忆能帮助我们回忆过去的事件、谈话以及活动,但它的功能远不止于此。便携式传感器可以测量各种人体状况指标和环境参数,例如血氧浓度、大气二氧化碳含量等。电脑通过检视测量数据找出规律,比如确定什么样的环境状况会导致儿童的哮喘病恶化。传感器还可以记下每一次心跳(普通人一辈子的心跳次数大约为30亿次),电脑再结合其他生理指标,判断你的心脏功能是否正常。这些信息为医生准备了一份巨细靡遗、随时更新的个人健康状况手册。当医生问你“什么时候开始有这种感觉”时,你再也不用绞尽脑汁、苦苦回忆了。
我们的这项研究课题名为“MyLifeBits”(我的人生比特,或称我人生的每一刻),它为打造终生数字档案提供了一些必要的工具。我们发现,在图像和声音的配合下,数字记忆能让往事浮现在人们的脑海中,加深人们对事件的感受,这与互联网在促进科学研究方面所起的作用异曲同工(通过互联网可以统合全世界的科研资料,并实现共享)。你读过的每一个字,无论出自电子邮件,还是电子文档,抑或是浏览网页时看到的,只要敲几下键盘,就能把它找回来。电脑能分析数字记忆,帮助人们合理安排时间。如果你为重要事项安排的时间不足,电脑就会提醒你。电脑还可以每隔一定时间就记下你当时的位置,制作一幅记录行程的活动地图。数字记忆最重要的作用,恐怕就是让所有人都能通过多媒体手段,向子孙后代讲述自己的生活经历。迄今为止,这还是富人和名人的特权。
半个世纪的努力
二战末期,利用数字手段编写个人编年史的构想就已经诞生,但直到几十年后的今天,才看到了实现的曙光。
二战接近尾声时,IT时代的开创者之一、时任美国政府战时研究部门负责人的范内瓦·布什(Vannevar Bush)首次详细阐释了借助机器来增强记忆力的构想。他提出了一种名为Memex(memory extender,即记忆增强器的缩写)的装置。Memex以缩微胶片为基础,能存储一个人拥有的所有书籍、资料及信件。人们把Memex设计成办公桌的内置设备,配有键盘、麦克风和若干显示屏。人们可以用照相机把照片和文章拍成缩微胶片,或者直接通过触摸屏创建新的文档。Memex的用户也可以把照相机固定在自己的前额上,以便在离开办公桌时继续拍摄。布什的设想颇具先见之明,其中最突出的是,他主张Memex的设计应该模仿人脑的联想功能。他曾经生动地描述过这一功能:“它(指Memex)就像人的脑细胞一样,一旦捕捉到某些信息,马上就能沿着复杂的路径网络找到相关的事物。”
在接下来的半个世纪里,计算机科学界许多坚韧的先驱者,包括特德·纳尔逊(Ted Nelson,“超文本”概念的创造人)和道格拉斯·恩格尔贝特(Douglas Engelbart,鼠标、视窗等多种人机交互工具和概念的发明人,1972年图灵奖得主),进一步发展了布什的某些构想。万维网的发明人借用了“路径网络”的概念来打造互相连接的网站系统,但由于技术所限,Memex仍停留在梦想中。不过近年来,存储装置、传感设备和处理器技术的进展堪称神速,已经为新一代数字记录和检索系统的问世铺平了道路。也许,新一代系统最终将远远超出布什的设想。
数字存储器件容量的增长速度令人瞠目:今天一块售价600美元的硬盘可以存储1TB(万亿字节,合1,024GB)的内容,足以容纳60年内你读过的所有东西(包括电子邮件、网页、报纸、书籍等)、购买的所有歌曲,以及每天8小时的录音和每天10张照片(参看第36页的图表)。如果按目前的速度发展下去,不出10年,你就能把前面提到的所有资料全部塞进手机闪存,手机还能通过无线网络连接电脑。到那时,4TB的硬盘价格大概也不过100美元;20年后,只须花600美元,就能买到容量高达250TB的硬盘——足以保存数万小时的视频,外加几千万张照片。硬盘容量如此惊人,就算要存放100多年里的所有经历,也绰绰有余。
与此同时,厂商们纷纷推出新一代传感器。由于售价低廉,这类探测元件可望很快普及。有的传感器可以记录有关用户健康状况和运动的大量资料;有的则可以测量周围环境的温度、湿度、气压和光照情况,甚至还能察觉附近有人靠近;有的可以随身携带,有的则安装在室内,或者内置在家用设备中(一种冰箱内置的探测器可以测算冰箱门开关的次数,由此探知你的饮食习惯)。微型麦克风和摄像头已经跌到白菜价,可以随意安装。手机摄像头风行一时,已经成为手机的标准配置,接下来,人们会为手机装上录音设备。
过去10年来,计算能力大幅度提高,能高效检索、分析并显示海量信息的新一代电脑处理器纷纷登场。现在一台普通的笔记本电脑也能支持相当复杂的数据库——功能超过20世纪80年代大银行的数据库,规模更是后者的近百倍。普通价位的手机也能上网冲浪、播放视频,有些甚至还能听懂某些特定的语音命令。
硬件的发展使数字记录变得伸手可及,越来越多的人开始动手打造自己的数字编年史。低成本、高质量的数字摄像机(包括手机摄像头)的问世,引爆了拍摄热潮。现在,可以刊登照片的博客大行其道,甚至比个人网站更普遍。年轻一代尤其热衷写博客,喜欢使用移动装置。仅仅使用非常不成熟的工具,撰写数字个人编年史的热潮便如此势不可当,凸现出人们的需求是何等的强烈。等到数字记录能够更加得心应手、更加全面地处理各种各样的数字影音资料时,人们的兴趣肯定还会进一步飙升。
吃螃蟹的勇士
贝尔用了6年的时间,建起150GB大小的数字档案。而后,就得利用数字设备记录接下来的人生,并设法让搜索资料变得更方便。
1998年,我们开始体验数字记忆。那一年,贝尔决定实现“无纸化”,把堆积如山的文稿、书刊、卡片、信件、便函、招贴和照片等扔进垃圾箱。为了把这一大堆资料转为数字档案,贝尔整天忙于扫描文件,把他的个人生活以及他在计算机行业摸爬滚打几十年积累下来的全部文档和各类用品,都存进电脑(连咖啡杯和T恤上的广告图标都没放过)。他还在数字档案中灌入他的家庭电影、演讲录像和录音资料等。贝尔终于“无纸一身轻”了,不过,他也付出了高昂的代价:他的私人助理为此忙活了好几年。(把新近资料归档就不必扫描了,因为现在绝大部分文档、图片和视频本来就是以数字格式创建的。)
完成扫描大业以后,贝尔的雄心却动摇起来——仅靠当时的软件,这些资料根本无用武之地。于是,MyLifeBits应运而生。2001年,当这个项目启动时,为PC开发的搜索工具效率还相当低下,我们决定打造全新的数据库,让它不仅能进行全文搜索,而且仅凭一类名为“元数据”(metadate)的线索——比如,照片的拍摄日期、地点和主题,或是人们为文档添加的书面或口头评论等,也能迅速找出资料。在回忆往事的过程中,元数据往往能起到关键作用。例如,当你努力回想某份电子邮件时,你或许还记得大致的发送时间。大部分元数据是自动归入数据库的,数据库能把元数据同数字记忆联系起来,即使面对最庞杂的档案,也能高效完成搜索。
MyLifeBits还为贝尔准备了一套新工具,可以把他同其他人、他与机器的交流情况全部记录下来。这套系统会录下他的电话通话内容、收听的电台或收看的电视节目。当他在电脑上工作时,每浏览一个网页,系统就自动生成网页备份,并加以保存,每收发一次信息,系统也会保存备份。系统还会记录他打开的所有文档、播放过的所有歌曲,以及所有的搜索操作,甚至会随时监视在桌面上运行的视窗,记录他进行了多少次鼠标和键盘操作等等。当贝尔出门在外,MyLifeBits会通过一台随身携带的GPS(全球定位系统)装置追踪他的位置,并通过无线网络把信息上传到档案中。参照每张照片拍摄的时间,系统还能自动确定照片拍摄的地点。
为了给自己一天的活动留下视觉记录,贝尔成天把微软研究部特制的照相机SenseCam挂在脖子上。SenseCam能够根据传感器探知的信息,在可能需要拍照的时刻自动完成任务,例如,当SenseCam的被动式红外探头察觉到有人靠近时,它便会自动拍下这个人的照片(人的体温一般在37摄氏度左右,会发出波长约为10微米的红外线,SenseCam据此来判断是否有人靠近)。如果照相机发觉周围光线的亮度有显著变化——通常表明主人可能走进或走出了房间,或者进入了新环境,SenseCam也会拍一张照片。英国剑桥艾登布鲁克医院研究人员最近的一项研究表明,记忆受损的患者每晚重温一遍SenseCam拍摄的照片,就能把记忆保持两个月以上。(如果让患者每晚复习一遍手写的日记,记忆力几乎毫无进展。)英国利兹大学的神经心理学家马丁·康韦 (Martin Conway) 推测,SenseCam有可能成为“21世纪第一种真正卓有成效的记忆增强手段”。
经过6年的努力,贝尔的数字档案囊括了30多万份资料,存储在他自己的双硬盘笔记本电脑和助理的台式电脑上,占用l50GB的硬盘空间,另有本机和远程备份。其中,视频文档占据了超过60GB的空间,图片屈居第二,用去25GB,音频文档(大部分是歌曲)占了l8GB,剩下的空间则被10万张网页、10万份电子邮件、1.5万份文本文档、2,000份PowerPoint文档以及其他资料瓜分。贝尔发现,这套系统特别有助于联系老朋友,以及查找其他需要联络的人。他也曾用它来搜索网站,寻找论文所需的引用材料,为医生提供25年前冠状动脉搭桥手术的病历,还找到一位已逝朋友的照片,以便在报纸上刊登讣告。
在市场上的产品中,MyLifeBits的某些功能(例如全文搜索)已经得到了应用。但总的说来,我们还应该提高这套系统的可操作性,改善数据管理。例如,改进后的语音-文本转换软件应该能让用户高效搜索电话交谈,或其他录音资料中的单词或短语。自动面孔识别功能也能解决为照片添加分类标志的棘手问题。此外,如果这套系统能自动识别数百种文件类型的属性(有可能通过分析文件格式和内容来进行识别),信息检索将会轻松得多。我们的研究尽管还存在种种有待改进之处,但它已经计划好彻底改变PC的用途——PC将不再是单纯的文字处理器或计算器,而是一台万能的事务处理器,能够以逼真的多媒体形式,记录用户生活中的每一件事。许多专家曾预言个人电脑将会寿终正寝,但很明显,PC的“P”(personal,个人)色彩绝不会消失。如果真有什么变化,也只会朝着更加个人化的方向发展。真正要变脸的是“C”(computer,电脑),它将演变成复杂的“计算生态系统”,不但包括计算机,还包括海量网络硬盘服务,新颖的上网途径(如通过手机和家庭娱乐中心上网),以及无处不在的传感器等。MyLifeBits最终极有可能在连接着各种Web服务的家庭服务器中安家落户。
让梦想成真
如果人人都拥有数字记忆,那么,如何保存档案、如何保护隐私、如何检索管理……未来还有一系列问题等着我们解决。
为了描述数字记忆可能会带给人们的影响,我们虚构了一个家庭。想象在不远的将来,这个家庭的各位成员将如何充分利用这项技术(参看第32页~第33页)。家庭数字档案的各个部分分别存放在多种个人数码装置中,比如手机、笔记本电脑、家用电脑等等,但所有信息也可以通过互联网安全地传送到一台由某公司(暂且就叫LifeBits公司吧)管理的主机服务器上。这家公司负责存储数据,定期备份(以便误删数据时能够恢复),并将备份保存在不同的地方,以确保即使遭遇自然或人为的损害,档案仍能安然无恙。
由于这个家庭的绝大部分信息都能通过可靠的互联网路径传送,因此每位家庭成员可以在任何地方、任何时候上网提取信息。有些资料特别敏感,可能会让人吃官司,因此可以把它们保存在国外某个数据存储账户中(或许会出现“瑞士数据银行”)。孩子们可以加密他们的资料,保护隐私,但LifeBits公司也给予家长在紧急状况下查看这些资料的权力。以后的聘用合同可能会规定,数字档案中与工作有关的内容都属于公司老板所有。当你离职时,或许需要对你的档案里施行“部分脑叶切除术”,删去被视作公司财产的所有资料。
上面描述的种种前景并非全是不切实际的设想。有些公司,比如美国加利福尼亚州文杜拉的VivoMetrics公司和堪萨斯州匹兹堡市的BodyMedia公司,已着手把佩戴式传感器平台推向市场。这套系统能收集人体健康资料,并监测心跳、呼吸和耗用热量值等数据。与此同时,美国加利福尼亚州海沃德市的Dust Networks公司开发出一种无线转接器,可以承担多个传感器之间信号中转的任务。美国麻省理工学院媒体实验室以德布·罗伊(Deb Roy)为首的一批研究人员提出了一个有趣的课题——Human Speechome,正在跟踪研究一名幼童。为了考察人类如何学会语言,这个孩子从出生到3岁之间,醒着时的所有举动都将记录在案(研究对象正是罗伊的宝贝儿子,现年1周岁)。日本东京大学的相泽清晴(Kiyoharu Aizawa)教授和他的同事则在研究新型的佩戴式摄像机,它可以监测佩戴者脑中阿尔法波的变化情况,据此确定并抓拍值得注意的精彩瞬间。
微软研究部目前支持了14所大学在数字记忆领域开展的多项研究。由美国匹兹堡大学的班邦·帕尔曼托(Bambang Parmanto)领导的“数码健康”(MyHealthBits)项目正是其中之一。它主要着眼于如何记录海量的健康数据,并管理由此产生的众多资料。美国华盛顿大学最近的研究表明,对遭受糖尿病和睡眠失调折磨的患者而言,密切观察健康状况大有裨益。
这些初步的进展振奋人心,但通向数字记忆时代的道路不可能一帆风顺。现在,许多国家和美国某些州对谈话录音和拍摄照片都有限制措施。也有许多人担心与自己有关的录音录像资料在法庭上对自己不利。数字记忆与我们大脑的记忆不同,打官司时可能会授人口实,落下把柄。水门事件中,当时的美国总统尼克松曾叮嘱他的助手,在法庭上用“我不记得了”之类的遁辞来搪塞大陪审团,但尼克松的谈话录音一经披露,事态就一发不可收拾,最终迫使他下台。有些人认为数字记忆是思想的延伸,在法庭上呈递这种资料,可能会搬起石头砸自己的脚。但新技术可以帮助我们尽量降低这类潜在的风险。比如说,我们可以设法隐去其他人的图像或声音,避免违法。
保护数字档案的隐私将至关重要。如果隐私不能得到有效保护,那么妄图冒名顶替或传播流言蜚语的不法之徒就会乘机兴风作浪,而独裁政权也可能借此强化对公众的控制,这样的前景让人不寒而栗。不管数字档案发展到什么地步,保护信息安全始终是重中之重。(人们毕生的私人资料都存在一个档案中,稍有闪失就会造成严重后果。)退一步讲,即使我们把电脑系统打造得如同诺克斯堡(Fort Knox,美国军事基地之一,号称全美最坚固、最安全的军营)一般固若金汤,用户在共享资料时也必须非常小心——只要点错一个键,你的病历资料可能就传遍全世界了。为了避免这类错误,数字档案的用户界面必须有所改进,还需要开发能够自动报警的智能软件,在共享数据可能有风险时提醒用户。
如何确保用户的数字档案在几十年以后,仍能顺利开启,这是另一项技术挑战。我们已经见识过因文件格式被淘汰而无法查看文件的情况。管理数字档案的人必须随时将文件转换为最新格式,在某些情况下,则可能需要运行老式电脑的模拟程序来搜索需要的数据。或许一个小规模的行业会应运而生,保证客户的信息不会因为格式演变而丢失。
但我们还面临着更大的挑战:必须设计合适的软件,使计算机能够利用这一海量的知识库来完成实际任务。我们的终极目标是打造出一台私人助理式的机器,它能预见到用户的需要。至少,计算机组织信息的能力必须得到提高。如果你只有几排书架,那么简单的搜索方法或许也能完成工作,但对美国国会图书馆这样的藏书量而言,肯定就爱莫能助了。大多数人都不想自己管理数字档案——我们要让电脑来当图书管理员!
因此,我们的研究团队希望能把人工智能(AI)用到数字档案中。许多专家对人工智能的作用持怀疑态度,但我们坚信,如果能充分利用数字档案中存储的海量信息,这样的软件完全能得出实用的成果。人工智能系统如果拥有大量信息作为后盾,它的表现肯定比那些只能依靠少量信息提出建议的系统好得多。我们已经着手开发能够根据内容来组织文件的软件,不过,还有大量的工作要做。
在某种意义上说,数字记忆的崛起是大势所趋。某些人可能对我们的设想心存疑虑,但未来几年内,他们电脑里存储的信息同样会飞速增长,到那时,他们也会希望有新的软件来善用这些资料。或许有些人担心无处不在的微型摄像头和麦克风,但我们认为,数字记忆给我们带来的享受,远远胜过了提心吊胆。数字记忆将会在多个领域发挥巨大作用。作为蕴藏着无数信息的宝库,它将帮助我们揭开人类的思维与感觉之谜。医生将获得不间断监测患者健康状况的手段,进而改善治疗心脏病、癌症以及其他种种疾病的方法。科学家将得以窥见先辈们的思路,了解他们的远见卓识来自何处。而未来的历史学家则可以极为详尽地解读过去发生的事件,不漏过一点细节。总而言之,数字记忆的前途不可限量,全看你如何发挥想象力了。
请 登录 发表评论