AI作画的人机战争走向何方?

文|脑极体

AI对于人类职业的影响及其引发的舆论波澜,迅猛到让人难以想象。还记得2017年,AI还是个标准的新生事物,我们的核心工作之一就是向读者们解释,同声传译、漫画作家、主持人等人类工作短期内仍是无法被AI取代的。而到了今年,一场因AI作画而引发的人类画家危机大讨论却在国内外 交媒体上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……这些从文本生成图像的AI作画工具大量出现,越来越受欢迎,市面上由AI生成的画作越来越多,不断刷新着大众对AI能力边界的认知,大量围绕AI作画的争议、AI取代人类画手的忧虑,喷涌而出。

在AIGC的激变时刻,关于AI作画的法律、伦理等问题也变得愈发重要,这场人机战争究竟走向何方?我们尝试用一文说清整个事件的起承转合。

起:引发众怒的科技与狠活

AI生成的艺术画作已经存在了很长时间,2017年,AI绘画就成为佳士得、苏富比等高端拍卖场所的座上宾,拍出过数百万美元的高价,除了引发行业内人士的一些分析和唏嘘之外,大众舆论场并没有掀起什么波澜。

然而,对AI作画的声讨,却在近几个月来,在 交媒体中发展到了一个高峰。

站Danbooru发布的声明显示,像NovelAI这样的生成器是在数千个 站的数十亿张图片上进行训练的,包括Pixiv、Twitter、DeviantArt和Tumblr等艺术家 站,以及Reddit、Pinterest等 站,所以从Danbooru平台上删除作品并不会阻止AI继续使用画家在其他 站的作品。也就是说,只要是 络上开放的,就有可能成为学习数据,除了询问模型的开发者之外,没有其他方法可以阻止自己的作品被AI学习,除非画家把自己的画全 都删完,否则也很难一一查清楚是否被用来学习了。

担心AI取代人类画师,将AI作画视为对人类能力的贬低,成为一种正在传染的情绪。

如前所说,AI生成绘画并不是什么新鲜事物,为什么偏偏近期突然在大众群体中掀起了水花,引发众怒?人当然不是只靠最后一根稻草压垮的。

承接:AI作画的内卷之路

有必要先来简单了解一下,AI作画是如何在几年间从拍卖行、收藏家们关注的小众艺术,成长为大众创作的主流标配。

计算机视觉一直是深度学习的主要任务方向之一,包括目标识别、目标跟踪、图像分割、图形处理等,有着大量成熟且广泛的应用。具体到图像生成领域,2015年左右,AI艺术创作主要是通过基于卷积神经 络的迁移学习,来进行图像风格转换,先对图像内容进行语义分割,再将内容和场景通过线条弯曲、风格迁移等手法,转换成指定艺术风格,类似美颜软件的“滤镜”功能。显然,这种生成方法的艺术价值并不高,能一键p图的人也并不因此就自认是大艺术家,而且经常出现很鬼畜的作品,谷歌深度学习绘画系统DeepDream加工过的图片就十分诡异。

AI生成真正开始展现出艺术价值和媲美人类的水平,是从2016年生成对抗 络GAN(Generative Adversarial Nets)的走红开始的,GAN模型的原理就是让生成器 络和判别器 络相互对抗,从而创作出真实度和准确度都更高的全新图像。这一时期,各种XXGAN的图像生成器出现,诞生了大量“以假乱真”的艺术作品。2018年10月佳士得以43.25 万美元的价格拍卖了由AI创作的《爱德蒙·贝拉米肖像》,成为人类历史上首次AI艺术品拍卖。

但是,GAN也不能摆脱传统AI深度模型的问题:无法理解“逻辑”和“常识”,比如AI能够根据文本关键词把元素堆叠在一起,但因为无法理解隐藏在自然语言背后的逻辑关系,所以经常会画出非常“克苏鲁”的反常识作品。而改变,来自预训练大模型的兴起。

通过大规模数据和暴力计算而训练出来的大模型,展现出了强大的鲁棒性,不仅在机器视觉领域表现优异,而且还不断迭代出了跨模态生成的能力,推动AI生成从语言走向视觉。这一波 “文本转图像”绘画工具能够产生以假乱真的画作,背后的“脑力”普遍来自大模型基础技术的支撑。在AI绘画工具上展开技术竞赛的谷歌、OpenAI、百度等都是大模型技术的佼佼者和AIGC的推动者。

读懂了AI作画的技术传承之路,也就不难理解,为什么AI创作的争议会在此时此刻被发酵。

首先, 巨头云集,技术进展超乎想象。AI作画汇聚了大量科技巨头“亮肌肉”,包括谷歌、OpenAI、Meta、微软、百度、腾讯等AI能力者,使得技术突飞猛进,工具数量以前所未有的速度爆发性增长,AI作画(图像生成)能力也因内卷而达到令人震惊的水平。2021年1月,OpenAI推出了DALL-E一年后,又推出了最新的DALL·E 2,分辨率提高4倍,可以从自然语言的描述中创建逼真的图像。谷歌内部就卷出了多个AI绘图工具,包括Imagen、Parti等,微软推出的AI绘图平台则起名为NUWA女娲,足见野心不小。

大模型优秀的生成效果,使得AI作画具备了一定的实用性和商用潜力,包括结合文本生成插画、创意工作的初样展示、自动完成勾线等重复机械劳动等,AIGC在走向产业的同时自然面临传统从业者的怀疑。

其次,大模型的积极开源,让AI作画门槛一降再降。

这一轮主流的AI绘图工具都选择了开源,繁荣大模型的开发生态,降低技术的使用门槛,任何人都可以使用这些工具进行创作,有的甚至是免费的。比如英国初创公司Stability AI打造的StableDIffusion就完全开放,OpenAI在9月28日开放了Dall-E 2 并提供免费试用,NovelAI在10月3 开放,都吸引了大量用户前去使用。

相比此前AIGC只作为小众艺术品和收藏投资对象,基于大模型的AIGC让更多人参与到训练、开发和使用中来。尽管各个开源 区都明确公布了知识产权相关规定,包括不得用于成人内容、仇恨或暴力图像,避免使用受版权保护的材料。但随着用户的增多和门槛的下降,一旦有人不了解并遵守开源 区的知识产权规范和协议,违规情况就难免发生。

技术、文化、伦理与法律等各种因素交织在一起,构成了开篇中AI作画的种种争议和风波的缘起,这是一个环环相扣的故事。

那么,有争议是不是意味着AI作画就此停滞了呢?还真不是!

1.AI想取代人类画师,还早。

某博主测试过后发现,“搞出来的能看的图多少有一些,但符合描述意图的图基本可以说没有”;“AI画画其实在我这个修图师眼里其实跟ps里那个填充功能差不多”。原因在于,AIGC的内容质量还有提升的空间。一方面,AI大模型的自然语言理解能力与人类还有很大的差距,GPT-3所生成的文本也就相当于小学生水平,这种情况下要让AI绘图工具理解复杂的文本,并准确用图像表达出内容思想,还是有点困难的。另一方面,在商业上,艺术品市场推崇的都是极富独特性的作品,稀缺性一直是艺术品重要的定价标准,工业化、批量产出的东西对收藏家来说没有价值,随着AI绘画工具的开源,手工制作的独特产品或许才会成为人们追求的艺术。这种趋势其实已经出现了,有 友就认为未来约稿很可能“纯手工”“零AI”反而会成为卖点。

一位创作博主直言:标榜自己的图是手工绘图的画师,今后想要过得富足,或许需要尽量为自己的作品附加额外的价值——这种生活方式早已有人在运营,那就是艺术家们。

所以至少目前为止,AI绘画工具能提供很多帮助,但还是无法取代人类画师的。

2.AI作画,确实有点用。

需要注意的是,艺术创作、艺术品收藏是一种相对小众的活动,能够成为艺术家的是极少数极小众的一批人。不过,日常生产生活中存在大量视觉和设计工作。在这些领域中,AI已经能够扮演非常有用的“作图助理”角色,成为大势所趋。

一种是减少重复性/风险性工作。比如视觉创意中,与客户沟通耗费大量时间和精力,存在大量不确定性,经常画完即使版后客户说“还是第一版好”,遇到这种让美工自闭的情况,AI就可以扮演起一个任劳任怨的乙方,快速生成多样化的AI创意图片,避免了过重的前期投入乃至返工。另外,每逢节日大促活动,美工难免就会遇到大量重复枯燥的工作,比如制作高度同质化的海 ,也可以由高水准的AI能力来完成。因此有设计师将DALL·E命名为“傻逼甲方终结者”。

3.AI知识产权保护,需要加速。

有了法律与技术的保障,AI作画才能在边界内加速人机合作,而非割裂与冲突。

总而言之,现代文明的演进,是一个世界的祛魅过程。工业化的过程,就是用蒸汽机、电气化等科学技术的系统运用,去取代那些能工巧匠们的奥秘,而这个祛魅过程,也带来了生产的大批量、高效率和低成本,普罗大众的生活比传统时代的任何时候都要便利和富足。

没有什么能瓦解人的灵魂和创造力,就像摄影术不会瓦解梵高和莫奈。智能时代,拥抱AI已成定局,这个进程中,人如何寻找到人的价值与意义,将是我们每个人所共同面临的一个课题。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年9月7日
下一篇 2022年9月7日

相关推荐