隐私,数字时代最棘手的课题之一,深入了解这一问题,才能做出正确选择。
撰文:杰伦·拉尼尔(Jaron Lanier) 翻译:王筱纶 审校:凌鸿
隐私——一个模糊不清的话题
想要得到复杂、难懂话题的清晰脉络,关注事实通常是有效的第一步。但涉及隐私时,我们往往难以洞悉真相。无论是国家主导还是商业行为,那些侵犯了我们隐私的人都不希望我们去侵犯他们的隐私。例如,美国国家安全局(National Security Agency,NSA)就长期秘密地进行着大规模的电子监视行动,即使是爱德华·J·斯诺登(Edward J. Snowden)最近泄漏了一些信息,我们也只能粗略地了解大致情况。
当今世界,没有一个人能够完全知晓,谁掌控了谁的信息。对于某些机构,例如美国国家安全局,即使它们知道的信息比任何人都多得多,也不可能详细地了解商业和政府机构对个人数据采用了什么算法处理,以及会产生多大的影响。
因此,目前隐私仍然是一个模糊不清的话题,只能通过某些缺乏科学验证的方法来分析。我们必须比想象中更多地依赖理论、哲学、反思和案例。然而,这并不意味着我们要放弃思考。
什么是隐私?
隐私的哲学其实是一种文化象征。我从小在美国新墨西哥州长大,有一年夏天与几个当地的普韦布洛印第安人(Pueblo people)住在一起。他们抱怨说,人类学家与传教士相比,对当地文化的伤害更严重,因为人类学家将他们的秘密公之于众。然而,向我透露这一想法的老夫妇的儿子居然也成为了一个人类学家。以前来美国留学的中国学生不甚理解隐私的含义,常常不敲门就闯进别人的房间。不过这种现象已经发生改变,如同中国也在改变。
最近有种说法是,与长辈相比,年轻人和技术发烧友对个人隐私不那么在意。事实上,年长的人是在一个不存在便携式计算机的世界长大,当他们面对摄像头时,更容易产生一种隐私被侵犯的感觉。目前,人们对Facebook之类的公司的评价有褒有贬,因为它们给年轻人搭建了网络社交平台,让人们似乎可以更坦然地面对美国国家安全局和情报机构的各种行为。在美国的普通公众中,“保护个人隐私”的意愿最强烈的人,可能是枪械持有者,他们很担心自己的名字出现在政府的某个表格中,最终导致枪械被没收。
尽管人们对隐私的态度各不相同,但谈到隐私问题,往往会引起如何权衡利弊的讨论。比如,如果为了在恐怖事件发生之前抓获恐怖分子,国家要对每个人的个人信息进行监控、分析,那么个人的隐私权和安全都无法得到保证。或者说,所谓的利弊权衡,至少是从这个角度出发的。
在某种意义上,如此看待隐私似乎有失偏颇。如果从利弊权衡的角度来看隐私,那隐私保护最终会被看成在文化上得到认可的“恋物癖”——隐私就是成年人需要的一层保护罩。为了某些利益,人们愿意泄露多少隐私呢?这句话隐含的意思是,对他人隐私的任何觊觎之心都是不合适的,就如同人的视网膜上不应该出现盲点一样。这好比你问一个病人,他愿意喝多苦的药,来治疗一种严重疾病。言下之意是,病人不该对药的味道有所挑剔(再苦也得喝)。一种相似的看法认为,只要人们“愿意分享更多信息”,他们就可以在网络上享受更多的便利或创造更大的价值。
由于隐私的概念模糊不清,我们很容易忽略人们对隐私的主观看法,但这可能是错误的。如果在不同的人群或文化中,与隐私相关的价值观不一样,情况会怎样?毕竟,文化差异是必然存在的。与此相对的一种假设是,我们的文化、思想和信息习惯已经达到了最完美的状态,因此只有一个关于隐私的立场,无论这个立场是什么,都是正确的。但是,生物学家永远不会认为人类的进化已经到达终点了。也许,我们不应该把所有人都约束在一个信息道德规范中,而应该让人们自由选择不同程度的隐私保护。
隐私即权力
在信息时代,直观来说,隐私的含义是一些人可以获取,但另外一些人无法获取的信息。换句话说,谁掌握了隐私,谁就掌握了控制权。
长期以来,信息是获取财富和权力的一个重要工具,而在信息时代,它已经成为了最重要的工具。信息的掌控权,与金钱、政治影响力及其他任何权力越来越难以分开。规模最大的金融活动,需要最大规模的信息计算,那些高频交易就是证明。大规模的信息计算不仅使企业偶尔受益,同时也将金融领域扩大到了惊人的范围,产生了宏观经济效应。
谷歌(Google)和Facebook这类公司只须通过销售信息计算能力就能获利,因为这种能力能提高商家投放广告的营销效果,而不再需要依赖各式各样的花言巧语来说服客户。原因在于,我们现在可以简单地、直接地改变人们所看到的信息。与之相类似的情况是,现代选举依靠大规模的信息计算来找寻容易说服的选民,从而怂恿他们改变心目中的人选。隐私是调节个人和政府权力的关键,也是平衡商业和政治利益的核心。
这种状况意味着,除非个人能够保护好自己的隐私,否则他们将失去权力。隐私已经成为一件重要的个人事务,但大多数人都不知道该如何处理隐私问题。知道如何保护隐私的人,在信息时代能更好地保护自己的安全(比如防止身份盗用)。因此,社会中存在着一种不公平的现象,无论在就业市场还是个人生活中,精通技术的人才都处于更有利的地位。
有些激进分子认为,我们应该将信息完全公开,消除秘密。但是,这些宣称分享是快乐的年轻技术人员,却常常热衷于阻止间谍软件侵扰各个网站,或使用加密技术进行电子通信。在这一方面,年轻的技术人员和最大的科技公司是相似的。Facebook及其竞争对手为用户提供了一个开放、透明的环境,却对自己的基于用户的预测模型秘而不宣。
未来可能的威胁
格外善良的技术精英,可能会让我们深受其害。经营着大型云计算公司,为人们提供社交网络和网页搜索服务的年轻人,以及这些年轻人在情报界工作的同行,他们做这些事的出发点大多都是很好的。但是,当这些优秀的年轻人渐渐老去,他们将企业传给下一代有权却无能的继承人时,情况会如何?我们都能想象出答案是什么样子,这种现象在人类历史上经常发生,因此并不难猜测。这么去看那些在信息时代努力奋斗的技术精英似乎有点不近人情,但是,如果我们希望全面地预见技术的发展,必须尽可能去思考事物的阴暗面。
如果一名拥有庞大计算能力的观察者获得了某个人的详细信息,他将可以预测和操纵这个人的思想和行为。即使今天的设备不能胜任这一任务,今后的设备也一定能成功。因此,我们假设,未来会出现一种极其方便的电子设备,贴在脖子后面,能够直接“侵入”大脑,在自我意识产生之前,就会知道这个人准备去附近的哪个咖啡厅(在我们这个时代,人们总是习惯于朝好的方面去想,这已经成为技术发展的常规挑战)。
很多用于制造这种设备的零件已经存在。比如,美国加利福尼亚大学伯克利分校的神经科学家杰克·格兰特(Jack Gallant)的实验室,已经可以利用大数据分析,通过将人们在某一时刻的大脑成像与以前的成像结果相比较,推测出一个人在看什么、想什么,甚至将要说什么。这类仅基于统计方法的“读心术”已经能够实现。
现在,让我们想象这样一个场景:在你不知道的情况下,你戴着一个前文所说的电子设备,这时你想去一家咖啡厅。我们进一步想象,一些机构,比如未来的Facebook或者美国国家安全局,能够“黑入”你身上的电子设备,并且有兴趣操控你离开A咖啡厅,而选择去B咖啡厅。于是,正当你考虑要不要去A咖啡厅时,脑海里突然出现了你老板对你的各种碎碎念,让你变得心烦意乱和沮丧,以至于去A咖啡厅这种想法还没有诞生就被掐灭了。与此同时,当你想起B咖啡厅时,突然记起一位红人在一个交友网站上发过的一条微博,你的心情阴转晴,B咖啡厅变成了更好的选择。这时,你成为了这个“新巴甫洛夫实验”中的被操控对象,这一切变化都发生在潜意识里。
我提到这种很久以前就出现在科幻小说中的思想实验,主要是想说明,通过计算和统计可以有效地模拟精神控制。未来几年,那些与人体的联系越发紧密的便携式设备,通过云计算驱动的推荐引擎,实现上述精神控制能力并非不可能。
认识不足的灾难
在科幻小说中,要讲述一个有警示含义的故事,最传统,同时也最有趣的方式,就是塑造一个无所不能的邪恶反派。但对我来讲,与其考虑未来可能出现的负面影响,不如去关注一个已经呈现出早期形态、可能成为现实的情景。这种情景不是一个具有超能力的坏人策划的邪恶场景,而更像是一个由于认识不足而引起的并不明确的灾难。
在这个情景中,一个实体或企业为了追求利润,投入巨大的资源,研究算法,控制普通公众。这种行为在初期确实是有利可图的,但最终都会以荒谬闹剧收场。而且,这一现象已经真实发生了!最近的例子就是美国的健康保险公司,这些公司会通过统计计算,避免高风险客户投保。从近期看,这一策略能获取丰厚的利润,但终有一天,“不合适”投保的人数会多到无法持续的地步。这种“成功之道”,是社会无法承受的。利用算法侵犯公民隐私来获取财富和权力,都会以相似的灾难性失败而告终。
看看现代金融业的现状。依靠大量的统计计算制定的财务计划,在初期往往十分成功。有了足够的数据和计算,我们可以推断证券的走向、个人的行为,甚至全球在短期内的任何缓和的变化。然而,基于大数据的规划终将失败,原因很简单:单纯的数据统计所反映的信息,只是现实的冰山一角。
直到21世纪之初,“大数据金融”才开始侵犯个人隐私(例如,通过建立数学模型,分析个人行为,然后有针对性地推销一些不合理的抵押贷款和信贷优惠业务)。在那之前,金融业对用户的判断相对比较抽象。证券被模型化,自动管理用户投资,却无法对现实世界中发生的事情进行分析。
美国康涅狄格州格林威治对冲基金的长期资本管理就是早期的一个例子。它在初期发展迅猛,到1998年陷入困境,急需大量纳税人救市(高频交易如今通过更多的数据和更快的计算重新开始实施这一方案)。但如今,世界很多高度自动化的金融行为都依赖于获取大量个人隐私,与间谍或网络黑客无异。导致2008年金融危机的抵押贷款担保证券,最终也通过侵犯用户隐私来实现自动化交易。这又是一个以牺牲公众利益为代价的大规模救市行为,毋庸置疑,相似的救市行为在未来也必然会再次发生。
这不是一个关于无所不能的技术精英掌控世界的故事。相反地,它是关于每一个人的故事,包括最成功的云服务提供商在内,都无法理解这到底是怎么回事。首先通过侵犯他人的隐私,运用数据分析获取财富,随后以失败告终——这种模式已经导致了多次金融危机。未来,当有一个人能够使用最有效的计算机运行最多的个人数据,实现前所未有的精准预测和行为操纵时,后果将会更加严重。
大数据的真实作用
如果有人声称可以提供一种服务,用以收集和分析大量人群的信息,那这人就是那种愚蠢的吹牛大王。正如我经常听到的一种高谈阔论一样:“不久的某一天,巨型计算机将能够精准地预测和定位目标消费者,做生意将变得像打开开关那么简单。到那时,我们的巨型计算机的吸金能力,就如同磁铁吸引铁屑一样强大。”
举例来说,硅谷初具雏形时,我就在那里了,希望获得一个优秀企业家的青睐。我声称,通过分析女性在网站上点击的链接,来追踪她们的月经周期,企业就可以运用这一信息,在女性的特殊时期来销售时装和化妆品,因为在这一时期女性更容易接受推销。这一销售模式在某些情况下可能是有效的,但是,这仅仅是统计结果,没有任何科学理论的支撑,因此无法得知在什么情况下才会有效。
相似地,当商家销售一个能够收集公民、政府机构,甚至是某个机构的私人承包商信息的系统时,可能会描述一幅美好的画面:通过观察和分析整个世界的信息,我们可以在罪犯或恐怖分子袭击之前抓住他们。描述这类功能的术语(例如“全面信息感知”,Total Information Awareness),揭示了人们对上帝那样的无所不知的高位者有多么向往。
科幻小说已对这一可能性想象了几十年,比如电影《少数派报告》(Minority Report)中的预防犯罪组织。这是一部在很多年前就帮助我思考的电影,它根据菲利普·K·迪克(Philip K. Dick)1956年的短篇小说改编而成,预防犯罪组织能够在罪犯犯罪之前就抓捕他们。但我们必须清楚,在现实中,这并不是进行数据收集和分析的大型系统能做到的。
这类系统的制作者希望,有一天,元数据(metadata,又称中介数据、中继数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件纪录等功能)将能支持高级版本的自动完成(autocomplete)算法,推测我们想要往智能手机上键入什么内容。统计算法还会填补数据的缺失部分。借助这类算法,研究与犯罪组织相关的元数据应该能够指引我们找到全新的、以前未知的核心成员。
但至少到目前为止,似乎没有证据表明,元数据挖掘阻止过哪怕一起恐怖行动。我们所知的情况是,特定的人工智能技术只是有助于犯罪调查,帮助警方找到疑犯。事实上,大型云计算项目的负责人,不论来自私人机构还是政府机构,他们在描述自己所做的事情时,都异口同声地说要脚踏实地,尤其是要对信息仔细查阅。确实,一旦发现恐怖计划的相关线索,依靠手里的大型数据,肯定能更快找到可能的案发地点,但数据库并不能在第一时间找到线索。
这段时间,人们经常听到一种说法:基于历史事件的事后分析旨在说明,大数据能够在大事件发生前发现关键人物。举例来说,通过算法分析与保罗·里维尔(Paul Revere,他是著名的社会活动家,一个交际枢纽,他认识波士顿每一个人,可以从波士顿社会的各个阶层收集各种信息,他最出名的事迹是在莱克辛顿和康科德之战前,策马狂奔传递警报,因此被称为“午夜骑士”)同时代的人,结论显示里维尔在社交网络中处于中心地位。这个案例所用的数据,是美国独立战争之前,里维尔与各组织成员间的关系。韩国首尔大学的社会学家韩申甲(Shin-Kap Han)在研究中,利用一个小型数据库(美国独立战争前各革命组织成员间的关系)分析发现,里维尔是各个组织间唯一的连接点。最近,美国杜克大学的社会学家基兰·希利(Kieran Healy)运用一个与韩申甲稍有不同的数据库,通过计算分析也得出了类似的结果。
毫无疑问,里维尔确实处于群体的中心,连接着其他成员。这一结果为利用元数据进行证券交易起到了宣传作用。不过,要想确认这类研究在事件发生前就可以实现精准预测,我们必须考虑几个因素。
里维尔显然是处于一个特殊的位置,起到了关键作用。然而,如果缺乏历史背景,我们并不知道他的关键作用是什么。可以买到最棒的啤酒的人,身上可能也有类似的“中心性”。只有获得了其他背景信息,置于特定情境下时,元数据分析才会有意义。尽管从当前来看,统计和图象分析似乎可以代替我们的理解能力,但长期来看并非如此。
危险的是,大数据统计会引起一种错觉,使人们认为自动生成证券的机器是可以存在的,就像华尔街一直梦寐以求的财富担保机器。关于我们私人生活的海量信息正在被存储、分析和运用,尽管我们还未证明这些信息的使用确实有效果。
软件即法律
我们经常听到这样的说法:“由于互联网和网络通信工具的出现,个人隐私将不复存在。”但真相并不一定如此。信息技术是用来处理信息的,而不是用来泄露信息的。
网络架构一旦建立起来,许多用户和无数基于网络架构而互联的电脑接入进来,我们就很难再作改变。网络架构是固定的。然而在数字网络中,个人隐私的性质尚未完全确定。我们仍然可以自由选择我们想要的内容。当我们在“隐私和安全”或“隐私和便利”之间选择关键的平衡点时,这种权衡看起来是不可避免的。似乎,我们已经忘记了电脑最本质的特性:它们是可编程的。
因为人们通过软件进行交流和完成任务,所以软件允许什么我们就能做什么,软件不允许的事情我们就不能做。这对政府而言尤其明显。例如,作为美国平价医疗法案(Affordable Care Act,又称奥巴马医改方案,Obamacare)的一部分,理论上一些州的烟民将比不吸烟者支付更高的医疗保险。由于这一想法仅仅是“理论上”,适用于美国新法律方案的健康医疗金融软件还未曾作出调整,因此无法对烟民收取罚金。在软件得到更新,可以实现这一功能之前,这一法律只能在不完全的情况下实施。无论任何人想要对法律内容进行变革,软件才是决定我们能实施到什么地步的关键。
上述关于烟民罚金的例子,仅仅是对这些广泛存在的问题的一个提示。实施平价医疗法案或任何其他社会性的项目时,相比于美国政客的政治意图,软件的设计更能决定个人的社会历程。
如何规划未来
侵犯隐私会造成间接伤害,如何降低伤害获取大数据的价值,有两种主要观点。一种旨在阐明和执行新法规,另一种旨在形成全民普及的信息透明,保证所有人都能查阅所有数据,从而没有人能获取不正当的好处。在大多数情况下,两个方向上的努力都会事与愿违。
隐私法规的问题是,它们不太可能被遵守。大数据统计已经成为一种“瘾”,而隐私法规就如同毒品或酗酒的禁令。虽然美国国家安全局制定了关于保密的规章制度,但周期性的信息泄漏仍然存在,法规的徒劳令人十分沮丧。比如美国国家安全局的员工会利用他们的工作便利窥探恋情。然而,也许制定一些新的法规和监管制度会有一定成效。
那么另一种观点呢——使信息公开更普遍化?该方法的问题是,重点不仅仅是获取数据的权限。更重要的是,人们用来分析这些数据的计算能力有多强。总有一些人,拥有最高端的电脑,而你不太可能是其中之一。理论上的信息开放性只能加剧问题,因为它激励人们去追求最大型的电脑。
我们不妨从最合乎逻辑的角度来考虑信息开放的观点。假设美国国家安全局明天公布了所有内部服务器的帐户和密码,任何人都可以获取和使用。谷歌和它的竞争对手将立即积聚、索引和分析美国国家安全局存储的海量数据,而且肯定做得比你好得多。然后,某些顾客想利用谷歌的分析结果,探索通过操纵普通公众使自己获利的方式,谷歌将会很乐意销售数据,赚取利润,而你并没能从中获益。请记住,原始的大数据不能带来权力。让你获得权力的是大数据与高性能电脑的结合,而你并不拥有这种大型电脑。
我们有没有第三种选择呢?普遍公认的看法是,从商业的角度出发,信息应该是免费的。人们不应该为信息付费。举例来说,正是免费信息让硅谷的网络公司迅猛发展。
重新审视这一传统观念是很有意义的。允许信息具有商业价值也许能让我们的处境变得清晰起来,同时也能带来一些个性化、多样性的元素,并微妙地回归到隐私的问题上来。
如果每个人的个人信息被使用时,都需要使用者付费,就能消除人们创建大型数据库,使用大数据分析的动机,因为这注定是要失败的。一个数据计划只能通过增加数据的价值来获取利润,而不是使用个人所拥有的信息。
这是一种微妙的概念,我也一直与帕罗奥托研究中心(Palo Alto Resarch Center)和圣菲研究所(Santa Fe Institute)的经济学家W·布莱恩·亚瑟(W. Brian Arthur)以及斯坦福大学的研究生埃里克·黄(Eric Huang)合作,探索这一概念的细节。黄对保险业最受认可的公认模型进行了扩展,研究了个人信息如果要收费,会发生什么现象。尽管结果十分复杂,但总体结论是,当保险公司需要为个人信息付费时,他们很难择优挑选,因此保险公司会涵盖那些原本会被排除的人。
必须强调的是,我们不是在谈论在大型公司和普通民众间的利益再分配问题;相反地,这是一个双赢的结果,由于经济的稳定和增长,大家都会更好。再说,在隐私法规有没有被遵守这一点(也就是上面提到的第一点)上,很难想象会有足够多的政府监督人员去检测,看各个机构有没有遵守隐私法规,除非监督人员与当今市场上的私人会计师一样多,也许能做到这一点。
如果个人信息被赋予商业价值,那么商业公平的原则也许能解决隐私困境。在当今世界,如果没有卓越的技术能力,我们很难在隐私保护上做得恰到好处。普通公众无论是加不加入社交网络,都会发现管理个人隐私十分困难。然而,在一个信息有偿使用的世界中,人们可以调高或降低个人信息的价格,从而发现隐私的安全区。我们需要做的只是调整一个简单的数字:价格。
有人想用在你对面的摄像头拍一张你的照片?理论上,他们可以这样做,但如果想看照片,或用它做其他事情,可能需要支付高额的费用。由于对个人信息设置过高的价格,人们可能失去一些便利或好处。但即使当大计算机无处不在地与传感器连接时,因为文化差异的存在,这一现象也会发生。
还可以从政治角度来看待这一问题:当信息免费时,政府通过监测公民信息得到了无穷无尽的财富,因为民众无权通过限制政府的权限,从中获得应有的利益。然而,当信息需要有偿使用时,民众可以通过简单地设置税率,决定政府可以在多大程度上监视自己的隐私。
这个简短的阐述只是提出了有偿信息的思想,即使我再写很多页,许多细节问题也仍然无法描述,但我们可以通过其他方式来解决这些问题。然而,在大数据时代,无论是彻底的信息开放还是建立新的法规,都不存在成熟的方法来解决隐私困境。
如果有机会来测试上述所有想法,将会产生极大的价值。网络工程师也应该在任何软件中设置潜在的功能,以保证网络软件在未来能够支持个人信息付费、隐私监管增强或信息广泛公开的想法,不管这些潜在功能以后用不用得上。只要我们有可能使用,就不应该排除任何一种思路。
构建大数据系统以及与系统连接的设备,正面临着一个棘手的问题,随着技术的进步,这一问题会变得越发普遍。我们有很好的理由去做我们正在做的事情。大数据可以使我们的世界更健康、更有效和更加可持续。我们不应该就此停止。但与此同时,我们必须知道,我们现在所知道的,还无法把大数据用在恰当的地方。
我们必须学会把每一份工作都看作是第一次尝试,尽我们最大的努力打好基础,做好重新考虑甚至彻底重做的打算。
本文译者:王筱纶是复旦大学管理学院管理科学与工程专业博士研究生。
本文审校:凌鸿教授是复旦大学管理学院信息管理与信息系统系主任,也是复旦大学智慧城市研究中心主任。
请 登录 发表评论