黑科技!18+ 开源 AI 工具箱

AI语音合成

AI 语音合成适用于配音、讲解、说书等场景,相比传统 TTS 有着特殊优势:有呼吸声、万千音色、自然流畅、媲美真人。

目前提供了三种语音合成,分别是微软语音、火山语音、阿里云语音,操作简单、支持音效试听、支持无限多开、中文语音丰富、自带呼吸声,效果逼真。

AI视频补帧

目前一般来说视频的帧数在 30FPS 左右,加上拍摄视频为了节省成本,几乎大多数电影都是 24 帧拍摄的。现在 30FPS 的影片已经开始满足不了一些人的观感了,例如我们玩游戏通常需要到 60 帧才会发现画面是流畅的。所以可以借助 AI 软件来实现插帧。

AI视频超分辨放大

对于一些老旧视频、电影想要转换成高分辨率在以前是靠人工逐帧修复,成本非常高,修复的时间也很长,据说每人每天可能只能修复二三十秒,修复一部电影甚至需要两三年的时间。

而现在可以用 AI 来自动超分辨率放大,支持把视频放大2倍、3倍、4倍,甚至优化画质。AI视频超分辨放大目前提供了四种超分模型,分别是 RealCugan、RealESRGAN、RealSR、waifu2x,不同算法对不同的图像效果不一样,例如动漫类的可以优先考虑用 waifu2x 。

软件使用很简单,你只需要输入文件路径,选择要放大的倍数,开始处理即可。不过对硬件要求比较高,低配置电脑耐心等待处理了。

AI图像风格化

之前很流行把自己的头像变成卡通动漫风格,通常需要自己用 PS 等软件处理,不过现在用 AI 算法也可以快速转换,目前开源算法主要用的 AnimeGAN,软件使用很简单,打开图片直接开始处理即可。

AI视频抠图

图片抠图没什么难度,但是手动对视频抠图就比较麻烦了,现在借助 AI 智能算法 RVM、MODNet、MobileNetV2 等可以自动抠出图片。使用也很简单,导入视频后点击开始按钮处理即可。

AI人像修复

对于一些有纪念价值的老旧照片,如果损坏的话想要修复比较麻烦,现在用 AI 技术可以自动对丢失的细节进行自动绘制。据介绍,这个项目采用的是 GFPGAN 腾讯开源的人脸修复算法,它利用预先训练好的面部 GAN(中封装的丰富和多样的先验因素进行盲脸修复。

修复效果还支持给黑白的照片上色,不过如果你的照片损坏的太严重,那么修复的效果也是不太理想,只能等 AI 算法继续训练了。

AI人像抠图

AI抠图现在已经很成熟了,有非常多的在线 AI 智能抠图 站,例如比较流行的 remove.bg,识别和抠图的结果都非常不错。现在用 Paper2GUI 也可以本地人像抠图了,支持设置抠图后的背景,例如透明、绿幕。

不过目前这个模型算法的抠图效果并不太好,对于比较复杂背景图片,例如毛发,识别抠出来的效果比较一般了。

AI目标检测

AI目标检测可以识别视频/图片里面的一些东西,采用 Yolo 目标算法,支持的检测比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

总结

以上这些工具都是基于开源的 AI 项目制作成 GUI 界面版本,方便大家使用了。所有依赖和模型都是内嵌的,所有打包输出的桌面APP都是可以开箱即用。

另外「Paper2GUI」项目都是独立软件,并不是整合在一起,你可以根据你的需求来选择性下载。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年7月15日
下一篇 2022年7月15日

相关推荐