5.1.6 版本发布记录
tros-humble
版本号:2.4.4 (2025-10-24)
新增功能(RDK S100平台):
- 板端算法推理框架
dnn_node新增ROI推理模式,输出的output tensor数量为output_size x roi_size。 - 新增人体检测和跟踪(Ultralytics YOLO Pose)算法示例。
- 新增人体实例跟踪算法示例,基于
reid模型提取人体特征,通过SQlite数据库存储、管理、查询特征。 launch 文件中关闭了人体检测和跟踪节点mono2d_body_detection基于ROI的人体跟踪方式;限制输入的ROI尺寸小于 3.5 倍实际模型输入尺寸。 - 新增人手关键点及手势识别(mediapipe)算法示例。实现手掌检测基本功能,前后处理以及发送
ai msg;支持mipi相机、usb相机、本地回灌图片的方式;支持零拷贝和非零拷贝方式获取图片。 - 新增DeepSeek大语言模型算法示例。支持人机对话;
RDK S100,RDK S100P新增支持DeepSeek_R1_Distill_Qwen_1.5B模型,DeepSeek_R1_Distill_Qwen_7B模型。
版本号:2.4.3 (2025-9-15)
新增功能(RDK X5平台):
- MIPI图像采集支持启动多路图像采集。
- 双目MIPI图像采集支持
sc132gs双目相机。
版本号:2.4.2 (2025-8-29)
新增功能(RDK S100平台):
- MIPI图像采集支持
230ai双目模组。 - 目标检测YOLO支持
yolo11和yolov12算法;增加使用component方式启动的脚本,支持使用mipi cam采集4K图像进行推理。 - EdgeSAM分割一切算法新增
edgesam作为模型推理;新增nv12格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增文本图片特征检索算法,用于文本图片特征提取检索。
- 新增DOSOD算法,新增地瓜自研开放性词汇检测DOSOD端侧部署功能包;新增DOSOD模型自定义修改检测类别的重参数量化方法。
- 新增双目OCC,集成地瓜双目
OCC网络。 - 视觉语言模型算法新增
smolvlm2模型适配, 支持图片回灌、订阅模式;新增llm模型推理结束后输出完整话题的能力。 - 新增双目深度估计算法。
版本号:2.4.1 (2025-7-30)
新增功能(RDK X5平台):
- MIPI图像采集支持
imx415模组。 - EdgeSAM分割一切算法新增
edgesam作为模型推理;新增nv12格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增人体实例跟踪算法,基于
reid模型提取人体特征,通过SQlite数据库存储、管理、查询特 征。 - 新增双目OCC算法,集成地瓜双目
OCC网络。 - 视觉语言模型新增
smolvlm2模型适配, 支持图片回灌、订阅模式;新增llm模型推理结束后输出完整话题的能力。
版本号:2.4.0 (2025-5-12)
新增功能:
- 支持
RDK S100平台。
版本号:2.3.3 (2025-4-30)
新增功能:
- 支持
RDK X5 Module平台。 - 新增基于
sensevoice_cpp的ASR开源方案,支持命令词和ASR数据的推送。 - 双目深度估计算法优化后处理耗时,新增V2.3版本模型。
- 新增基于
llama.cpp的端侧视觉语言模型算法示例。
版本号:2.3.2 (2025-1-15)
功能变更:
新增功能:
问题修复:
- 修复yolov8-seg图像分割算法后处理中由于box越界导致的crash问题。
- 图像编解码修复帧率统计错误的问题。
- 双目MIPI图像采集修复i2c detection的问题,增加lpwm开关的配置。
版本号:2.3.1 (2024-11-20)
功能变更:
- 依赖的
opencv版本从3.4.5升级到4.5.4(Ubuntu 22.04使用的最新release版本)。
新增功能:
- 图像发布工具支持发布
bgr/rgb格式消息数据;支持配置发布消息的frame_id。 - 人体检测和跟踪算法支持配置订阅的消息topic;支持component模式运行;算 法前处理支持对输入图片进行缩放后推理;launch启动脚本支持使用压缩图片回灌,并支持配置图片的路径。
- 板端算法模型推理与部署框架修复多线程推理中推理耗时计算错误的问题;支持在配置文件中配置任务数功能。
- 图像编解码Node使用订阅到图像消息的frame_id作为输出图像消息的frame_id;支持发布丢帧控制。
- 手势识别算法支持启动时配置后处理阈值;支持动态手势识别。
- 新增人脸年龄检测算法,用于检测人的年龄。
- 新增人脸106关键点检测算法,用于检测人脸106个关键点信息。
- 新增感知消息融合Node,用于订阅多个PerceptionTargets类型的topic,经过时间对齐、数据去重后,再融合成一个topic后发布。应用参考多算法推理。
- 新增感知消息滤波Node,采用OneEuroFilter滤波策略对点和框做平滑操作,用于对感知结果中的人体、人脸、人手等检测框和关键点数据进行位置纠正,修复框和点的抖动问题。应用参考多算法推理。
- 新增双目辅助功能包,用于对双目图像、深度图像进行采集。
- 新增多路视频分析算法应用示例,通过rtsp协议拉取多路h264和h265码流并推理,在WEB端可视化感知结果。
问题修复:
版本号:2.3.0 (2024-09-19)
新增功能:
- 支持
RDK X5平台。 - 数据采集增加双目MIPI图像采集功能。
- 算法仓库新增
yolov8和yolov10目标检测,yolov8-seg图像分割参考算法。 - 算法仓库新增YOLO-World算法,用于开放性词汇输入检测。
- 算法仓库新增光流估计算法,用于光流检测。
- 算法仓库新增分割一切算法,用于无差别分割一切。
- 算法仓库新增文本 图片特征检索算法,用于文本图片特征提取检索。
- 算法仓库新增双目深度估计算法,实现基于视觉的深度估计。
版本号:2.2.0 (2024-04-11)
功能变更:
- 基于TROS Foxy 2.1.3版本,适配Ubuntu 22.04系统和ROS2 Humble。
- TROS的安装路径由
/opt/tros变更为/opt/tros/humble,和ROS2的安装路径层级和命名保持一致。 - 不再提供
tros-ros-base安装包(包含rclcpp、rclpy、ros2cli等ROS2基础功能包),使用标准的ROS2发行包,安装TROS Humble时自动安装依赖的ROS2 Humble。 - 使用ROS2 fastdds的零拷贝通信功能,涉及到数据采集、图像编解码、算法示例等使用到图像数据的模块。
- 零拷贝通信使用的QoS的Reliability由
RMW_QOS_POLICY_RELIABILITY_RELIABLE(rclcpp::QoS())变更为RMW_QOS_POLICY_RELIABILITY_BEST_EFFORT(rclcpp::SensorDataQoS()),避免使用零拷贝时潜在的稳定性风险。 - 重构
hobot_dnn,使用更底层的板端推理框架libdnn,不再使用easydnn。 hobot_audio升级语音算法SDK,使用更底层的板端推理框架libdnn,不再使用easydnn。hobot_trigger适配ROS2 Humble版本rosbag2。
新增功能:
robot_dev_config新增bloom编译和打包的脚本,用于ARM平台编译和打包TROS。hobot_mipi_camnode新增frame_ts_type配置项,支持realtime(用于计算通信延迟)和sensor(默认,用于传感器 的时间戳同步)配置参数。- 新增
hobot_shmnode,用于配置ROS2零拷贝环境。
问题修复:
- 修复编译器升级引入的兼容性问题。
- 修复板端编译部分ROS2 pkg存在的路径依赖问题。
tros-foxy
版本号:2.1.3 (2024-03-11)
功能变更:
- jpeg压缩格式图片使用的数据类型由
sensor_msgs::msg::Image变更为标准的sensor_msgs::msg::CompressedImage,支持使用foxglove和ros2 rqt等工具查看TROS发布的jpeg格式图片。涉及到hobot_websocket, hobot_codec, hobot_image_publisher, hobot_usb_cam模块。 - 统一使用jpeg/mjpeg配置项指定发布/订阅jpeg压缩格式图片,删除jpeg-compressed/mjpeg-compressed配置项,涉及到hobot_codec和hobot_usb_cam模块。
- 引入表示TROS发行版的环境变量TROS_DISTRO,执行
source /opt/tros/setup.bash/source /opt/tros/local_setup.bash命令后,环境变量TROS_DISTRO的值为空。hobot_codec, hobot_audio, hobot_mipi_cam, hobot_usb_cam等模块使用的配置文件路径由/opt/tros/lib变更为/opt/tros/${TROS_DISTRO}/lib。
版本号:2.1.2 (2024-01-19)
新增功能:
- 重构
hobot_usb_cam,支持更多format配置和转码。 hobot_audio更新语音SDK,同时支持2mic和4mic麦克风板;增加micphone_name配置设备ID号。
问题修复:
hobot_rgbd_camnode修复发送数据消息step字段设置错误问题。hobot_tts更新音频播放函数调用,解决新版本系统播放失败问题。hobot_llm删除config设备树文件,以及更新README,新版本系统可通过命令工具设置ION内存大小。
版本号:2.1.1 (2023-11-03)
新增功能:
- 新增
hobot_chatbotnode,调用智能语音、大语言模型、文本转语音模块,实现板端语音聊天功能。
问题修复:
- 文本转语音
hobot_ttsnode,修复某些字符导致应用退出问题。
版本号:2.1.0 (2023-09-14)
功能变更:
tros-ros-base更新到最新ROS2 foxy源码,兼容最新ROS2 foxy软件包。- 使用ROS2 foxy软件包只
source /opt/tros/setup.bash即可,不再需要使用脚本建立软链接。
新增功能:
- 文本转语音
hobot_ttsnode新增参数指定播放音频设备。 - 新增大语言模型
hobot_llmnode,可在端侧体验LLM。 - 图像编解码
hobot_codecnode配置参数in_format新增jpeg-compressed配置项,同时根据配置项选择订阅的话题数据类型。
问题修复:
- MIPI图像采集
hobot_mipi_camnode修复发送RGB格式数据消息step字段设置错误问题。
版本号:2.0.2 (2023-08-28)
功能变更:
- tros.b安装时配置的ROS2源(
/etc/apt/sources.list.d/ros2.list)变更为清华镜像源,解决安装ROS2 package速度慢和失败的问题。
新增功能:
- 启动tros.b脚本配置环境时(
source /opt/tros/setup.bash和source /opt/tros/local_setup.bash)新增权限检查的功能。如果当前账户不具有root权限将会自动进入切换到root账户的流程,解决因为权限不够导致的使用tros.b失败的问题。 - 智能语音算法
hobot_audionode新增音频设备号参数配置功能,方便二次开发。 - 事件触发
hobot_triggernode新增通过std_msg话题给Trigger模块发放任务功能,规范Trigger配置方法。
问题修复:
- 修复图像加速处理
hobot_cvnode同时进行crop&resize处理图像时,处理失败的问题。 - 修复MIPI图像采集
hobot_mipi_camnode启动时输出error log的问题。 - 修复数据可视化消息转换
hobot_visualizationnode的launch启动文件配置无效的问题。