前言

有时候我们想将一段视频中的音频转换成文本，最简单最笨的方法就是通过人耳去听，然后通过打字打出来。但这种方法无疑是十分费劲的。机智的小伙伴肯定都知道我们可以借助语音识别工具来做这件事，但是比较现实的一点就是，很多识别软件不是要收费，就是识别准确率比较低。那么我们有什么办法可以既不花钱又准确的将视频中的音频转换成文本呢p>

解决方法

有剪辑经验的小伙伴一定知道，这款软件的字幕识别功能，其背后有字节跳动的语音识别技术支撑，对普通话的识别准确率是杠杠的。但是有一点是，他识别的字幕是分段的，要将它们一条条复制出来组成完整的文本，其工作量也不少。

7.根据英文名称不难找出，draft_content.json 中就是我们草稿内容，刚刚生成的字幕文本也保存在这个json文件中。

8.既然是json文件，下一步自然就是json解析了，我们将字幕内容从这个文件中提取出来即可。

9.分析json文件，找出要解析的字段, 简化后的json结构如下:

而我们需要的字幕内容，被三个xml元素标签包裹。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

剪映+json解析将视频中的声音转换成文本

前言

解决方法

相关推荐