智能语音
功能介绍
智能语音算法采用本地离线模式,订阅音频数据后送给BPU处理,然后发布唤醒、命令词识别、声源定位DOA角度信息以及语音ASR识别结果等消息。智能语音功能的实现对应于TogetheROS.Bot的hobot_audio package,适用于RDK配套的环形和线形四麦阵列。
代码仓库: (https://github.com/D-Robotics/hobot_audio.git)
应用场景:智能语音算法能够识别音频中的唤醒词以及自定义的命令词,并将语音内容解读为对应指令或转化为文字,可实现语音控制以及语音翻译等功能,主要应用于智能家居、智能座舱、智能穿戴设备等领域。
语音控制小车运动案例:4.6 语音控制小车运动
支持平台
平台 | 运行方式 | 示例功能 |
---|---|---|
RDK X3, RDK X5, RDK X5 Module | Ubuntu 20.04 (Foxy), Ubuntu 22.04 (Humble) | 启动音频模块算法,并在终端显示结果 |
准备工作
-
RDK已烧录好Ubuntu 20.04/Ubuntu 22.04系统镜像。
-
RDK已成功安装TogetheROS.Bot。
-
RDK已成功安装智能语音算法包,安装命令:
- Foxy
- Humble
sudo apt update
sudo apt install tros-hobot-audiosudo apt update
sudo apt install tros-humble-hobot-audio
注意
如果sudo apt update
命令执行失败或报错,请查看常见问题章节的Q10: apt update 命令执行失败或报错如何处理?
解决。
- 按照以下方法在RDK上接好环形或线形四麦音频板。
连接音频板
接口连接
环形麦克风阵列
环形麦克风板为一体化设计,实物如下图:
购买链接如下:
(https://www.waveshare.net/shop/Audio-Driver-HAT.htm)
连接步骤:
-
将麦克风板连接到RDK X3 40PIN GPIO 接口上,连接后实物如下图:
-
接上电源,网线等。