Sensevoice
功能介绍
智能语音算法采用SenseVoiceGGUF的算法,订阅音频数据后送给sensevoicegguf模型处理,然后发布命令词识别、语音ASR识别结果等消息。智能语音功能的实现对应于TogetheROS.Bot的sensevoice_ros2 package,适用于3.5mm的耳麦。
代码仓库: (https://github.com/D-Robotics/sensevoice_ros2.git)
应用场景:智能语音算法能够识别音频中自定义的命令词,并将语音内容解读为对应指令或转化为文字,可实现语音控制以及语音翻译等功能,主要应用于智能家居、智能座舱、智能穿戴设备等领域。
语音控制小车运动案例:4.6 语音控制小车运动
支持平台
平台 | 运行方式 | 示例功能 |
---|---|---|
RDK X5, RDK X5 Module | Ubuntu 22.04 (Humble) | 启动音频模块算法,并在终端显示结果 |
准备工作
-
RDK已烧录好Ubuntu 22.04系统镜像。
-
RDK已成功安装TogetheROS.Bot。
-
RDK已成功安装智能语音2算法包,安装命令:
- Humble
sudo apt update
sudo apt install tros-humble-sensevoice-ros2
注意
如果sudo apt update
命令执行失败或报错,请查看常见问题章节的Q10: apt update 命令执行失败或报错如何处理?
解决。
- 音频板正确连接到RDK X5的3.5mm的耳麦接口。
- USB音响正确连接到RDK X5的usb接口。
使用介绍
智能语音sensevoice_ros2 package开始运行之后,会从麦克风采集音频,并且将采集到的音频数据送入语音智能算法做智能处理,输出命令词、ASR结果等智能信息,其中命令词通过audio_msg::msg::SmartAudioData
类型消息发布,ASR结果通过std_msgs::msg::String
类型消息发布。
智能语音功能支持对原始音频进行ASR识别,默认的命令词定义在智能语音功能代码模块根目录下config/cmd_word.json文件,默认为:
{
"cmd_word": [
"向前走",
"向后退",
"向左转",
"向右转",
"