环境:
-
Hardware: Raspberry PI 4B – 8G – SD 卡(16G)
-
OS :Raspberry Pi OS 2021Desktop Download
-
Python3/ Win32DiskImager(烧录镜像软件) Or Raspberry Pi Imager(树莓派自带镜像烧录软件)
-
USB 麦克风/音箱(耳机)
1. 搭建操作系统
Step 1: 官 下载镜像文件,经测试树莓派4B安装 Ubuntu20 桌面版本经常出现卡顿现象,而且 Ubuntu20 总是出现令人抓狂的依赖问题,最终还是刷回了 Raspberry Pi OS 2021桌面版系统。官 镜像下载慢的话,可以使用迅雷下载,通常能在 5 分钟左右下载完成。
Step 2: 使用 Win32DiskImager 将下载好的镜像烧录进 SD 卡中,烧录 Ubuntu20 多次出现无法树莓派无法启动的现象。最稳定的还是 Raspberry Pi OS。
Step 3: 烧录好镜像之后,将 SD 卡插入树莓派,通电启动。如果出现树莓派标志和二维码则说明镜像烧录出现故障,需要重新烧录镜像。Ubuntu 18 以下的系统似乎很难成功烧录并运行,搜索了很久也没有找到正确的解决办法,如果有小伙伴成功了,不妨分享一下。
Step 4: 系统尽量设置成英文,避免莫名其妙的故障。成功启动树莓派之后,需要更换国内源。在此之前需要对 vi 配置进行修改,默认配置极其难用,上下左右键各种恶心,修改如下:
按 Esc 键,再输入 :wq!
Step 5: 完成以上步骤,就可以使用 vi 来修改源文件,增加国内源。在修改源文件之前,请先备份,指令如下:
备份好后,修改 sources.list 文件和 raspi.list 文件如下:
- sources.list
注释掉之前的内容,最后添加两句:
- raspi.list
注释掉之前的内容,最后添加两句:
tips: 虽然有很多国内源,但是此项目使用清华源出现的坑最少。
如果不习惯使用单调无趣的 vi ,可以安装功能更加强大的 vim:
如果vim右键赋值出了问题,树莓派默认装好vim之后,右键不能粘贴,反而进入了visual模式,那么执行以下操作
在第 70 行, mouse=a 中间加 ‘-’, 改为: mouse-=a
在hostname里面,也个更改为自己的名称
对 pa_stable_v190600_20161030.tgz 进行解压 通过 tar -xzf pa_stable_v190600_20161030.tgz 进行解压,然后进行安装
进到解压后的文件下面,进行如下操作
这样就安装好了
Python3的方案如下:
先按照Python2的方式把所有的都装一遍
安装 PyAudio:
安装 SWIG :
安装 ATLAS:
安装pluseaudio和python3-dev,不然会 出9997的问题
下载snowboy源码
进到
然后
进到Python3的的例子中
开始运行,喊一声snowboy就可以听到叮的一声
会出现 错
把官方案例文件中的 snowboydecoder.py 文件修改一下,把from . import snowboydetect改为import snowboydetect然后再运行。就ok了。
参考链接
3、 树莓派如果新增了麦克风的输入设备,需要进行如下操作,改配置文件让usb声卡作为默认的音频输入
以上步骤安装完成 snowboy 模块,接下来就是使用 snowboy 唤醒模块来配合百度语音识别和合成 API 以及智能对话机器人 API 完成语音到文字再传输到智能对话系统中,接收到智能对话系统的反馈之后,再将文字转换为语音信息。
手动安装 wukong-robot
wukong-robot 官
- 克隆本仓库:
- 安装 sox ,ffmpeg 和 PyAudio:
Linux 系统
如果遇到 pip3 安装慢的问题,可以考虑使用 Pypi 镜像。例如 清华大学 Pypi 镜像 。
Mac 系统:
-
安装依赖的库:
这一步极其重要,因为这个项目年代久远,操作系统环境依赖已经没有办法解决,经过多次尝试。我选择将 requirements.txt 中的版本 全部删除,python 库全部选择默认安装最新版本,最终成功解决了令人吐血的无限循环依赖问题,执行如下命令:
requirements.txt 安装完成之后,就可以进行最后一步。命令行进入 wukong-robot/ 目录下,执行:
弹出提示,输入 ‘y’ 即可。
此时,不出意外就能听到提示音。对着麦克风大喊“孙悟空”,如果能得到智能的回应,则说明整个链路全部跑通了,接下来就是功能扩展部分了。如果一直得到无法听清你在说什么的提示音的话,就需要去检查图灵机器人的 API 是否已经失效,换个图灵机器人 API 重新测试即可。如果无法听到语音播 ,则有可能是百度语音识别模块出现问题,需要检查百度语音识别 API 是否失效,注册百度语音服务账 ,然后将自己的 AppId 等信息填入到后台管理选项中。
在浏览器中输入 localhost:5000 ,即可进入登陆页面,账 默认 wukong ,密码默认:wukong@2019
登录进后台之后,就可以对 wukong-robot 的 API 进行修改和配置了。
3. 测试智能语音 API
百度语音识别接口:https://console.bce.baidu.com/ai/romai=1#/ai/speech/overview/index
参考博客:https://www.cnblogs.com/apollo1616/p/10274511.html
人工智能(百度AI+图灵) https://www.cnblogs.com/lbzbky/articles/12088900.html
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!