有这5款开源软件，语音转文字很简单！

来自：开源最前线（ID：OpenSourceTop）

链接：https://fosspost.org/lists/open-source-speech-recognition-speech-to-text

语音文字转换（STT）系统，一种能够将语音单词转换成文本的方法，用途十分广泛，比如我们经常在用的微信聊天中语音转文字功能。

过去，语音转文本技术由专有软件和库控制；开源替代方案不存在或存在极端局限，如今这种形势已经发生变化，今天你可以使用许多开源的语音转文本工具和库，今天，我们就举5个好用的开源语音识别库。

1、DeepSpeech项目

Github地址：https://github.com/mozilla/DeepSpeech

2、Kaldi

这可能是有史以来最古老的语音识别软件之一；京都大学在1991年的时候开发的，然后于2005年将它移交给一个独立的项目团队。

Julius 的主要特点包括了执行实时 STT 的能力，低内存占用（20000 单词少于 64 MB），能够输出最优词N-best word和词图Word-graph，能够作为服务器单元运行等等。这款软件主要为学术和研究所设计。它是由C 语言写成，并且可以运行在 Linux、Windows、macOS 甚至 Android（在智能手机上）。

目前，它仅支持英语和日语，该软件可能很容易安装在Linux发行版的仓库中。只需在软件包管理器中搜索julius包即可。

项目主页：https://github.com/julius-speech/julius

4、Wav2Letter ++

百度的研究人员也在研究自己的语音转文本引擎DeepSpeech2。这是一个端到端的开源引擎，它使用“ PaddlePaddle”深度学习框架将英语和普通话的语音转换为文本。该项目在BSD许可下发布。

该引擎可以针对任何模型和所需的任何语言进行培训。模型不随代码一起发布；就像其他软件一样，你必须自己构建它们。DeepSpeech2的源代码是用Python编写的；因此，如果这是你使用的语言，你应该很快就能使用上手

项目地址：https://github.com/PaddlePaddle/DeepSpeech

语音识别类别主要还是由专有软件巨头（例如Google和IBM）来主导（它们确实为此提供了自己的闭源商业服务），但是开源替代方案是有希望的。这5个开源语音识别引擎让你可以自己着手构建应用程序，不知道有没有你用过的呢p>

– END –

如果看到这里，说明你喜欢这篇文章，请转发、点赞。扫描下方二维码或者微信搜索「perfect_iscas」，添加好友后即可获得10套程序员全栈课程+1000套PPT和简历模板，向我私聊「进群」二字即可进入高质量交流群。

送几本书《Pytorch深度学习入门》《算法交易员》等

喜欢文章，点个在看

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

有这5款开源软件，语音转文字很简单！

相关推荐