AI作画的人机战争走向何方？

文｜脑极体

AI对于人类职业的影响及其引发的舆论波澜，迅猛到让人难以想象。还记得2017年，AI还是个标准的新生事物，我们的核心工作之一就是向读者们解释，同声传译、漫画作家、主持人等人类工作短期内仍是无法被AI取代的。而到了今年，一场因AI作画而引发的人类画家危机大讨论却在国内外交媒体上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……这些从文本生成图像的AI作画工具大量出现，越来越受欢迎，市面上由AI生成的画作越来越多，不断刷新着大众对AI能力边界的认知，大量围绕AI作画的争议、AI取代人类画手的忧虑，喷涌而出。

在AIGC的激变时刻，关于AI作画的法律、伦理等问题也变得愈发重要，这场人机战争究竟走向何方？我们尝试用一文说清整个事件的起承转合。

起：引发众怒的科技与狠活

AI生成的艺术画作已经存在了很长时间，2017年，AI绘画就成为佳士得、苏富比等高端拍卖场所的座上宾，拍出过数百万美元的高价，除了引发行业内人士的一些分析和唏嘘之外，大众舆论场并没有掀起什么波澜。

然而，对AI作画的声讨，却在近几个月来，在交媒体中发展到了一个高峰。

站Danbooru发布的声明显示，像NovelAI这样的生成器是在数千个站的数十亿张图片上进行训练的，包括Pixiv、Twitter、DeviantArt和Tumblr等艺术家站，以及Reddit、Pinterest等站，所以从Danbooru平台上删除作品并不会阻止AI继续使用画家在其他站的作品。也就是说，只要是络上开放的，就有可能成为学习数据，除了询问模型的开发者之外，没有其他方法可以阻止自己的作品被AI学习，除非画家把自己的画全都删完，否则也很难一一查清楚是否被用来学习了。

担心AI取代人类画师，将AI作画视为对人类能力的贬低，成为一种正在传染的情绪。

如前所说，AI生成绘画并不是什么新鲜事物，为什么偏偏近期突然在大众群体中掀起了水花，引发众怒？人当然不是只靠最后一根稻草压垮的。

承接：AI作画的内卷之路

有必要先来简单了解一下，AI作画是如何在几年间从拍卖行、收藏家们关注的小众艺术，成长为大众创作的主流标配。

计算机视觉一直是深度学习的主要任务方向之一，包括目标识别、目标跟踪、图像分割、图形处理等，有着大量成熟且广泛的应用。具体到图像生成领域，2015年左右，AI艺术创作主要是通过基于卷积神经络的迁移学习，来进行图像风格转换，先对图像内容进行语义分割，再将内容和场景通过线条弯曲、风格迁移等手法，转换成指定艺术风格，类似美颜软件的“滤镜”功能。显然，这种生成方法的艺术价值并不高，能一键p图的人也并不因此就自认是大艺术家，而且经常出现很鬼畜的作品，谷歌深度学习绘画系统DeepDream加工过的图片就十分诡异。

AI生成真正开始展现出艺术价值和媲美人类的水平，是从2016年生成对抗络GAN（Generative Adversarial Nets）的走红开始的，GAN模型的原理就是让生成器络和判别器络相互对抗，从而创作出真实度和准确度都更高的全新图像。这一时期，各种XXGAN的图像生成器出现，诞生了大量“以假乱真”的艺术作品。2018年10月佳士得以43.25 万美元的价格拍卖了由AI创作的《爱德蒙·贝拉米肖像》，成为人类历史上首次AI艺术品拍卖。

但是，GAN也不能摆脱传统AI深度模型的问题：无法理解“逻辑”和“常识”，比如AI能够根据文本关键词把元素堆叠在一起，但因为无法理解隐藏在自然语言背后的逻辑关系，所以经常会画出非常“克苏鲁”的反常识作品。而改变，来自预训练大模型的兴起。

通过大规模数据和暴力计算而训练出来的大模型，展现出了强大的鲁棒性，不仅在机器视觉领域表现优异，而且还不断迭代出了跨模态生成的能力，推动AI生成从语言走向视觉。这一波 “文本转图像”绘画工具能够产生以假乱真的画作，背后的“脑力”普遍来自大模型基础技术的支撑。在AI绘画工具上展开技术竞赛的谷歌、OpenAI、百度等都是大模型技术的佼佼者和AIGC的推动者。

读懂了AI作画的技术传承之路，也就不难理解，为什么AI创作的争议会在此时此刻被发酵。

首先，巨头云集，技术进展超乎想象。AI作画汇聚了大量科技巨头“亮肌肉”，包括谷歌、OpenAI、Meta、微软、百度、腾讯等AI能力者，使得技术突飞猛进，工具数量以前所未有的速度爆发性增长，AI作画（图像生成）能力也因内卷而达到令人震惊的水平。2021年1月，OpenAI推出了DALL-E一年后，又推出了最新的DALL·E 2，分辨率提高4倍，可以从自然语言的描述中创建逼真的图像。谷歌内部就卷出了多个AI绘图工具，包括Imagen、Parti等，微软推出的AI绘图平台则起名为NUWA女娲，足见野心不小。

大模型优秀的生成效果，使得AI作画具备了一定的实用性和商用潜力，包括结合文本生成插画、创意工作的初样展示、自动完成勾线等重复机械劳动等，AIGC在走向产业的同时自然面临传统从业者的怀疑。

其次，大模型的积极开源，让AI作画门槛一降再降。

这一轮主流的AI绘图工具都选择了开源，繁荣大模型的开发生态，降低技术的使用门槛，任何人都可以使用这些工具进行创作，有的甚至是免费的。比如英国初创公司Stability AI打造的StableDIffusion就完全开放，OpenAI在9月28日开放了Dall-E 2 并提供免费试用，NovelAI在10月3 开放，都吸引了大量用户前去使用。

相比此前AIGC只作为小众艺术品和收藏投资对象，基于大模型的AIGC让更多人参与到训练、开发和使用中来。尽管各个开源区都明确公布了知识产权相关规定，包括不得用于成人内容、仇恨或暴力图像，避免使用受版权保护的材料。但随着用户的增多和门槛的下降，一旦有人不了解并遵守开源区的知识产权规范和协议，违规情况就难免发生。

技术、文化、伦理与法律等各种因素交织在一起，构成了开篇中AI作画的种种争议和风波的缘起，这是一个环环相扣的故事。

那么，有争议是不是意味着AI作画就此停滞了呢？还真不是！

1.AI想取代人类画师，还早。

某博主测试过后发现，“搞出来的能看的图多少有一些，但符合描述意图的图基本可以说没有”；“AI画画其实在我这个修图师眼里其实跟ps里那个填充功能差不多”。原因在于，AIGC的内容质量还有提升的空间。一方面，AI大模型的自然语言理解能力与人类还有很大的差距，GPT-3所生成的文本也就相当于小学生水平，这种情况下要让AI绘图工具理解复杂的文本，并准确用图像表达出内容思想，还是有点困难的。另一方面，在商业上，艺术品市场推崇的都是极富独特性的作品，稀缺性一直是艺术品重要的定价标准，工业化、批量产出的东西对收藏家来说没有价值，随着AI绘画工具的开源，手工制作的独特产品或许才会成为人们追求的艺术。这种趋势其实已经出现了，有友就认为未来约稿很可能“纯手工”“零AI”反而会成为卖点。

一位创作博主直言：标榜自己的图是手工绘图的画师，今后想要过得富足，或许需要尽量为自己的作品附加额外的价值——这种生活方式早已有人在运营，那就是艺术家们。

所以至少目前为止，AI绘画工具能提供很多帮助，但还是无法取代人类画师的。

2.AI作画，确实有点用。

需要注意的是，艺术创作、艺术品收藏是一种相对小众的活动，能够成为艺术家的是极少数极小众的一批人。不过，日常生产生活中存在大量视觉和设计工作。在这些领域中，AI已经能够扮演非常有用的“作图助理”角色，成为大势所趋。

一种是减少重复性/风险性工作。比如视觉创意中，与客户沟通耗费大量时间和精力，存在大量不确定性，经常画完即使版后客户说“还是第一版好”，遇到这种让美工自闭的情况，AI就可以扮演起一个任劳任怨的乙方，快速生成多样化的AI创意图片，避免了过重的前期投入乃至返工。另外，每逢节日大促活动，美工难免就会遇到大量重复枯燥的工作，比如制作高度同质化的海，也可以由高水准的AI能力来完成。因此有设计师将DALL·E命名为“傻逼甲方终结者”。

3.AI知识产权保护，需要加速。

有了法律与技术的保障，AI作画才能在边界内加速人机合作，而非割裂与冲突。

总而言之，现代文明的演进，是一个世界的祛魅过程。工业化的过程，就是用蒸汽机、电气化等科学技术的系统运用，去取代那些能工巧匠们的奥秘，而这个祛魅过程，也带来了生产的大批量、高效率和低成本，普罗大众的生活比传统时代的任何时候都要便利和富足。

没有什么能瓦解人的灵魂和创造力，就像摄影术不会瓦解梵高和莫奈。智能时代，拥抱AI已成定局，这个进程中，人如何寻找到人的价值与意义，将是我们每个人所共同面临的一个课题。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

AI作画的人机战争走向何方？

起：引发众怒的科技与狠活

承接：AI作画的内卷之路

相关推荐