简单聊聊:“让照片动起来”背后的AI算法

你是不是也曾经在短视频平台看到过老照片的修复视频?甚至可能花钱请别人帮忙修复过珍贵的老照片?但这些可能你以为是专业的照片修复人员做的事情,其实只用一个软件进行 AI 计算后就能获得。今天就简单聊一聊“让照片动起来”背后的 AI 算法。

为什么目前 AI 技术带火的视频都是基于人像照片的内容?这就要从这项技术的原理“生成对抗 络”说起了。生成对抗 络,业内简称“GAN”( Generative Adversarial Networks )。

拟人化的GAN

Generative 在英语里面是“有生殖性的”意思,Adversarial 是“对抗的”,Networks 是 “ 络”,所以简单来说“GAN”就是一种可以自我繁殖进化的 络模型。

那么“GAN”主要做的是什么呢?以它最常用的图像识别领域为例,比如看图识狗, 络模型会有一组算法专门搜集狗的图片,并根据这些图片生成一只“不存在”的新狗,而它的对抗算法则是要识别出这只“不存在”的狗。

然后通过它们不断地对抗训练,最终这套算法一方面“造”狗能力超强,一方面“识”狗能力也超强。

目前,我发现在图片领域做得比较深入的是国内飞桨 AI 工作室做的“PaddleGAN”,基本上我们看到比较火的照片动态视频技术他们都有涉猎:

照片动漫化

人像卡通化

唇形同步

脸部动作迁移

老视频修复

图像变换

超分辨率

老照片修复曾经是抖音上风靡一时的收费项目,后来小火了一阵的“蚂蚁呀嘿”也让不少人为之付费,现在它们则是加成在一起,让老照片活过来唱歌说话成了更新的玩法。而这些技术,只要会一点 Python 语言,就可以找到开源的代码让 AI 来完成。

目前看到的新项目有老人变年轻、大人变小孩,可以克隆声音的“柯南变声器”等等,未来你可能真的无法判断屏幕后面的那个 TA 到底是男是女,是老是小。这是科技带给我们的神奇,也是科技带给我们的困扰,要科技向善,终究还是要看使用它的人。


这里是,观察世间动向,剖析深度思考,为你分享科技生活新认知,说说我的所闻所想,也欢迎在留言区 po 出你的观点或者问题,我会精选出有价值的观点和问题,为你解读和解答 ~

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年7月2日
下一篇 2021年7月2日

相关推荐