很多人说今年是“AI 绘画元年”。先是 Disco Diffusion 火出了圈,从 Text-to-Image(用文字生成图像)开发 区和创意设计行业,火到了普通人的视野中。
人们热衷将两种完全不搭界的对象,比如“达芬奇”和“iPhone”字样,输入 AI 程序,然后等着画面层层渲染完成。
然后,OpenAI 的 DALL·E 2 半途杀出,和前两者擅长“概念画风”不同,DALL·E 2 更“写实”,60 秒不到可以生成 10 张图,不满意还可以擦去局部重新生成……短短几个月,“最强 AI 画师”的称 几次易主。
谷歌也坐不住,五月底发论文介绍自家选手——Imagen,直接叫板 DALL·E 2, 称 Imagen 有“前所未有的写实感和深度的语言理解”,目前暂未开放。
这两个月来,我和前面三位“AI 画师”频繁打交道,几乎每天都在测试描述词、调教机器人,踩了很多坑,翻了不少车。但与此同时,我收获了不少杰作。
这次,我将对比它们的画作生成特点、用户友好度等方面,同时整理好了它们的 址,以及一些简单的操作方法。
在普通用户那里,它们是具像化想象的得力工具;在专业人群那里,如果将它们和其他工具联动起来,能有无穷尽的想象空间。
Disco Diffusion:生成图的艺术性最高
一般来说,你需要等半个小时,如果盯着屏幕看,你会看到图像从满是噪点,逐渐变得清晰、有细节起来。
使用期间,Disco Diffusion 可能会提示你在电脑上空出足够的运行内存,但因为它运行在谷歌免费提供的 GPU 等计算资源上,对用户的电脑硬件要求并不高,打开浏览器运行就可以。
当你使用了风格鲜明的艺术家(尤其是在世的艺术家),以及某部商业作品作为关键词时,都请不要直接拿来商用。
Midjourney:不怎么“超纲”,更“听话”
我用 Midjourney 生成的画
Midjourney 的优点就是:快。软件生成图非常快,一张算下来大概 60 秒。你要是对成品不满意,还可以几乎实时地提升细节,或延伸变化。
比如,我尝试生成《爱,死亡和机器人》里那集《糟糕之旅》的场景,参考了上图两位艺术家的描述词,之后就生成了满意的画作:
我当了回“托尼”,用 DALL·E 2 给梵高理发,申请地址:
labs.openai.com/waitlist
我等了一个多月,才拿到了 DALL·E 2 的内测资格。如果说 Disco Diffusion 更擅长描绘氛围、风景或概念艺术,那么 DALL· E 2 则擅长写实。
“大象能转身吗我以这个“经典甲方需求”为例,试试 DALL· E 2 的写实能力。
让大象和鲨鱼共舞:
让大象被曹冲称:
榴莲沙发|用 DALL·E mini 生成,软件地址:
https://huggingface.co/spaces/dalle-mini/dalle-mini
生成图像,只是第一步
“能不能让它们动起来我看着 AI 返回来的画作,开始想办法:
AI 生成图像完成,并不代表创意就结束了。如果你把它当成其中一个环节,再连接其他创意流程,想象空间是巨大的。
我再展示一下插画师 Nerko 的创意:他先用 Midjourney 生成自己想要的素材,然后再将这些局部组装起来。
@NekroXIII
在他手里,AI 是种“生产力”。挑选和合成,仍是他全权主导。在用上 Midjourney 之前,他已经画了 15 年插画。
文章知识点与官方知识档案匹配,可进一步学习相关知识Java技能树首页概览91749 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!