你能想象到你在论坛看到的高赞跟帖或者回答,其实并不是真人写的吗?
这可不是一本正经的胡说八道,而是切实发生在我们身边的事情。在国内,已经有人自己训练出来的NLP模型在知乎随机回答问题,并且做到了被点赞的答案的top3。
是不是很恐怖?其实知乎并不是AI被用于回帖的第一阵地。最早有人用AI回帖,其实发生在美国的reddit论坛,事件源于OpenAI开发的最强语言模型GPT-3,通俗地说,这个AI最擅长的就是生成文字,甚至包括生成一篇像模像样的小说。
2020年9月,reddit增加了一名新注册用户thegentlemetre,这名用户每几分钟就会在 站的随机几个版块发表一条评论,例如讨论Radiohead或者甲壳虫乐队,直到这名用户在“你最主要的健身方式”问题下给出了一个莫名其妙的答案:
后续,这名用户相继给出了很多奇怪的回答,至此,不少人怀疑thegentlemetre到底是不是真人,有人还通过整理回答内容发现,这名用户几乎每个回答都是6段话,很符合GPT-3的生成模式。
至此,真相大白,thegentlemetre就是一个AI。
想象一下,如果知道在虚拟空间和你聊天的那个人可能甚至不是真实存在的真人,是不是已经觉得脊背发凉了?
但是AI的本事不仅如此,OpenAI今年又给人送上了一份惊喜大礼:他们在1月初连发了DALL·E和CLIP这两个连接文本与图像的神经 络。在这两个神经 络的帮助下,可以通过自然语言操纵视觉概念,比如输入“一把牛油果造型的扶手椅”,他们就可以通过图像合成,生成一系列的目标图像。
本质上讲,DALL·E是基于GPT-3开发的的AI,而GPT-3则是一个自然语言处理模型,机器通过NLP理解了我们的自然语言,在1750亿参数量基础上的GPT-3,现如今已经可以做到更多事情了。
但GPT-3的可怕之处在于其强大的可扩展性,甚至可以用在无代码开发领域,无代码就是就是不用敲代码也可以直接生成程序,GPT-3就是一个强大的无代码开发平台,只要对它输入你想要什么样的 页或者app,它就能帮你直接生成。外行人甚至无法分辨生成的 页是不是程序员写的。
顺带一提,DALL·E只是使用了120亿个参数的GPT-3的小版本,它生成的图像,你觉得是人类设计师设计出来的吗?
DeepFake的发展源于生成对抗 络(GAN)的出现和发展。该算法可以看做是一个基于数据库自动生成模拟数据库中数据的样本,之后通过识别器评估生成数据的真伪,通过生成器和识别器之间的互相博弈与不断学习,进而产生大量高精度的数据。
因为太过以假乱真,于是有人担心会有人用到歪门邪道上,事实这些担心并不是空穴来风,要知道Deepfake第一次亮相就是将《神奇女侠》盖尔·加朵的脸,嫁接到了一部成人电影女主角身上,此外由Deepfake制作的假视频已引发多起刑事案件,甚至卷入政治纷争。
不光是Deepfake,NVIDIA在2018年年底推出过GauGAN用以生成本来并不存在的人脸图像,而在前年年底,NVIDIA则公开了StyleGAN的2.0改进版,解决了生成图像伪阴影的同时得到细节更好的高质量图像。现在我们可以用NVIDIA开源的代码生成各种汽车、人脸等等图像,也足够以假乱真。
种种的种种,都在预示着AI正在朝着越来越像人类的方向演进,上文中提到的灌水机器人是在回答时露出了马脚,那像Deepfake这种做“假视频、假照片”的凶手,人类又该如何识破其真身呢?
首先要明白,Deepfake的主要技术分为自动编码器和生成对抗 络两大块,自动编码器就是通过神经 络把一个人的照片特征抓取出来,然后用数字代表,同时将没有的表情用数字模拟的方式展现出来。通过训练,就可以找出一个最好的用数学方式来呈现照片特征的编码器。但自动编码器做出的照片是否自然真实还需要去判别把关,这就需要生成对抗 络技术,包括两个机器学习模型,分别为生成 络和辨别 络。生成 络做出假影片,在模型训练后产生伪造影片;而辨别 络则不断地检视假影片,直至它再辨别不了结果是假的。数据越多,效果越理想,假影片越真实。
想要辨别假影片的真伪,一个重要的思路就是“用魔法打败魔法”。Google前年就与科技孵化器JigSaw合作整合了“Face Forenesics Benchmark”项目用来帮助研究人员设计更好的检测方法;而Facebook则与Microsoft、MIT、Amazon等公司合作共同打击DeepFake,该项目被称为“DFDC”,旨在创建能用于“打假”模型训练的开源工具;12月,Facebook的人工智能研究部门宣布已经开发出一套反识别系统以辨别实时影像的真伪。
除此之外,也有通过眨眼率、语音和嘴唇运动的同步状况、情绪来判断的方法,但本质上讲,随着Deepfake技术的进步,加强对样本的学习之后,这几招就失灵了。
(7609676)
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!