自从照相技术发明以来,虚假照片就一直层出不穷。比如曾轰动一时的“花仙子”和“尼斯湖水怪”的假照片。而有了Photoshop软件之后,图片处理更是进入了数字时代。现在,利用一种算法,人工神经网络可以对数百万张真人照片进行分析、整合,由此得到的虚拟照片可以达到以假乱真的效果,可以说,人工智能的发展,将照片伪造技术又提升到了一个全新的高度。
人工神经网络是基于生物学中神经网络的基本原理,由大量计算机互联组成的信息处理系统。为帮助软件更好地识别图片中的人,Google、Facebook等公司在多年前就已经开始使用这种人工神经网络。现在,研究人员又开发出了一种名为“生成对抗网络”(generative adversarial networks,GANs)的新型人工神经网络,它由一个能生成图像的生成器网络和一个负责评价图像真伪的鉴别器网络组成。
“要让神经网络学会识图,需要经过数百万张图片的训练。GANs则是一种较新的算法,它可以自动生成图像,”美国艾伦人工智能研究所的首席执行官奥伦·埃齐奥尼(Oren Etzioni)说。
利用GANs算法,人工智能还能迅速生成足以乱真的虚拟照片。通过机器学习,生成器网络可对大量图片进行分析,学会制作栩栩如生的虚拟照片。然后,它会把这些虚拟照片发送给鉴别器网络,鉴别器网络受过专门的训练,知道如何甄别图片人物的真假。根据与真人的相似程度,鉴别器会对生成的图片进行评估。随着时间的推移,生成器的造假能力和鉴别器的反甄别能力都会变得越来越强大——这也是“对抗”的意义所在。
GANs给人工智能带来了突破,因为在进行初步学习后,它可以在没有人类监督的情况下继续学习。2014年,现就职于Google Brain(Google公司的人工智能项目部)的伊恩·古德费洛(Ian Goodfellow)曾作为第一作者,发表了一篇介绍这项研究的论文。从那以后,全球范围内的数十位科学家开始将GANs应用于各个领域,比如机器人控制和机器翻译。
开发这种无监督学习系统极具挑战性。有时候,GANs会表现不佳,长时间学习却没有进步;如果生成器不能生成越来越逼真的图像,鉴别器也会受到影响,无法变得更“犀利”。
芯片制造商Nvidia研发出了一种训练方法,可以使对抗网络摆脱上述困境。这种训练方法的关键之处在于,通过渐进的方式训练生成器和鉴别器:从低分辨率开始,逐步添加新的层次,在训练进程中渐进地增加细节。从Nvidia的研究人员计划提交给今年春季的国际人工智能大会的论文来看,这种渐进式的机器学习策略还有一个好处——能使训练时间减少一半。Nvidia团队展示了它们的最新成果:利用一个包含200 000多张明星面部照片的数据库对GANs进行训练,最后得到足以乱真的高分辨率人脸图像,而实际上这些人并不存在。
人工智能并不知道自己创造出的人脸图片是否逼真,它们没有这个天赋。“我们之所以选择人脸作为最初的尝试,是因为我们人类很容易就可以判断出人工智能产生的图片是否逼真。我们天生就有负责识别人脸的脑区,并且为了认出和读懂别人的脸,一辈子都在接受这方面的训练,” 这项研究的参与者、Nvidia团队的亚可·莱赫蒂宁(Jaakko Lehtinen)说。让GANs模仿人的识脸天赋,就是这个项目的挑战所在。
Facebook认为,对抗网络可以帮助社交平台通过用户早前的行为,更好地预测用户的喜好,并最终研发出具有常识的人工智能。Facebook公司的人工智能首席科学家扬·勒康(Yann LeCun)和工程师索普威思·金塔拉(Soumith Chintala)认为,理想的人工智能系统不仅是能识别文字和图像,还应该具有能与人类媲美的推理、预测、规划和行动能力。在勒康和金塔拉的研究中,他们先向生成器输入4帧视频图像,然后让人工智能生成后面2帧,以测试其预测能力。结果,人工智能合成出了后续的图像——一个人在行走,或在做头部运动。
对希望降低制作成本的电影制片人和视频游戏制作者来说,用人工智能来生成高度仿真的图像和视频,或许是一个不错的选择。不过,目前就职于OpenAI 公司的亚利克·拉德福(Alec Radford)表示,“虽然GANs生成的图像一眼看上去足以乱真,但要真正达到像真实照片一样的水准,还有很长的路要走。” 拉德福曾于2016年国际人工智能大会上发表过一篇论文,Facebook团队的研究正是以那篇论文为基础的。“用人工智能制作高水准的视频,就是更遥远的事了,” 拉德福补充道。
未来,那些制作假内容,让它们在网络上传播的恶作剧者,会不会利用人工智能制作虚假图片或视频并非法传播?这一点,我们尚需观望。如果有一天,越来越多的人开始对网络上传播内容的真假产生怀疑,那这项技术或许会给我们的未来带来更大的不确定性。
请 登录 发表评论