人们通常喜欢和与自己相似的人共处,利用这一点,数据科学家可以轻松地通过分析个体在网络世界和真实世界的社交网络,推断一个人的观点和个性特征。研究人员把这种喜欢和与自己想法相同的人交朋友的倾向,称为同质性(homophily)。想想那句老话“物以类聚,人以群分”吧,斯坦福大学从事管理与工程方面研究的约翰·乌甘德(Johan Ugander)说,他的课题就与此有关。
不过,令人惊讶的是,乌甘德和他的研究生克里斯汀·M·阿尔腾伯格(Kristen M. Altenburger)发现,有些人会被那些在某些方面与自己完全不同的人深深吸引。研究人员将由这种现象导出的变异性称为单系性(monophily)。研究人员一开始认为,异质性(heterogeneity)会增加从一个人的朋友的社交网络来推断他的个性特征的难度。但乌甘德和阿尔腾伯格的研究表明,单系性可以产生一个效应,即在某些方面,一个人与自己朋友可能不同,但与朋友的朋友却会不谋而合。利用这一点,科学家可以更容易地推断出个体隐藏的一些个性特征——对数据分析人士来说,则多了一种追踪个人信息的方法。
在研究中,乌甘德和阿尔腾伯格分析了三种不同的社会网络,分别是在线社交网络、政治博客和一个已经被充分研究过的恐怖分子的交流平台,相关结果在线发表于《自然·人类行为学》(Nature Human Behaviour)杂志上。最近,《科学美国人》采访了乌甘德,与他就这项研究和研究涉及到的个人隐私问题进行了交流。
《科学美国人》:你开展异质性方面的研究,灵感是来自“异性相吸”这个说法吗?
乌甘德:在线的社交网络中,很少会出现性别同质性的现象,即同性别的人形成一个稳定的群,这个令人疑惑的事实,引发了我们的研究兴趣。网上有很多按年龄层次划分的群。几乎不存在性别同质性这一事实,对信息扩散和数据保密都会有影响。但事实证明,你还是可以从社交网络的异质性(在研究论文中,我们用了大部分篇幅来解释这个违反直觉的研究起点)着手,根据这个人朋友的朋友的性别,来推断他/她的性别。
《科学美国人》:在Facebook上跟政治观点不同的人交朋友,算不算异质性的一个例子?
乌甘德:在政治观点方面,人们倾向于和观点相同的人聚在一起。但我们确实看到,在博客上,有相当一部分人会和观点不同的人交朋友。在美国,有一些人是脚踩两只船的:他们开通了民主党的博客,但又喜欢到保守党的博客上去转悠,或与此相反。
《科学美国人》:考虑到隐私保护方面的问题,现在科学家对社交网络的研究方式有什么变化吗?
乌甘德:在这方面,我认为自己是一个对隐私保护非常警觉的人,会审视所有可能推断出个人信息的研究方式。最近开展的一场公众对话,就讨论了保护社交网络信息中个人隐私的重要性。(乌甘德的研究使用的是Facebook Data Science 2010~2014年的数据。)
不过,利用人们在社交网络上留下的数据,来更好地理解他人,这本身也是有益的研究。许多社会学方面的研究,都只是专注于有直接交流的人际关系,不考虑那些没有直接联系的人际关系。但我更感兴趣的是那些间接的关系,当我们没有人口统计学方面的数据可查时,就可以利用庞杂的网络社交关系,来推断一个人的态度和性格特征。
《科学美国人》:你会担心自己的研究被心怀恶意的人利用吗?
乌甘德:当然,当一个人打造了一款工具,他就有责任要考虑这个工具将会被如何使用。我们研究用到的算法主要是基于2009年以来的科学文献。之前我们以为,如果个体在社交网络中有志趣相仿的朋友,可以用这个方法预测他的态度和喜好。但我们的新研究表明,即使不满足同质性这个条件,这个方法依然有效。
请 登录 发表评论