5.1.6 版本发布记录

tros-humble

版本号：2.4.5 (2025-10-28)

问题修复（RDK X5平台）：

修复图像处理加速模块hobot_cv使用vse加速图像resize的bug。
修复板端模型推理框架dnn_node统计推理延迟错误的问题。
修复由于MIPI图像采集和算法等模块的ros component so安装路径错误，导致运行时加载失败的问题。
优化图像编解码的配置，删除无效的配置参数，增加用于debug的配置参数。

版本号：2.4.4 (2025-10-24)

新增功能（RDK S100平台）：

板端算法推理框架 dnn_node 新增 ROI 推理模式，输出的 output tensor 数量为 output_size x roi_size。
新增人体检测和跟踪(Ultralytics YOLO Pose)算法示例。
新增人体实例跟踪算法示例，基于reid模型提取人体特征，通过SQlite数据库存储、管理、查询特征。 launch 文件中关闭了人体检测和跟踪节点 mono2d_body_detection 基于 ROI 的人体跟踪方式；限制输入的 ROI 尺寸小于 3.5 倍实际模型输入尺寸。
新增人手关键点及手势识别(mediapipe)算法示例。实现手掌检测基本功能，前后处理以及发送 ai msg ；支持mipi相机、usb相机、本地回灌图片的方式；支持零拷贝和非零拷贝方式获取图片。
新增DeepSeek大语言模型算法示例。支持人机对话；RDK S100, RDK S100P 新增支持 DeepSeek_R1_Distill_Qwen_1.5B 模型, DeepSeek_R1_Distill_Qwen_7B 模型。

版本号：2.4.3 (2025-9-15)

新增功能（RDK X5平台）：

MIPI图像采集支持启动多路图像采集。
双目MIPI图像采集支持sc132gs双目相机。

版本号：2.4.2 (2025-8-29)

新增功能（RDK S100平台）：

MIPI图像采集支持230ai双目模组。
目标检测YOLO支持yolo11和yolov12算法；增加使用component方式启动的脚本，支持使用mipi cam采集4K图像进行推理。
EdgeSAM分割一切算法新增edgesam作为模型推理；新增nv12格式数据输入；新增对分割结果padding, 用于在双目深度案例一同可视化。
新增文本图片特征检索算法，用于文本图片特征提取检索。
新增DOSOD算法，新增地瓜自研开放性词汇检测DOSOD端侧部署功能包；新增DOSOD模型自定义修改检测类别的重参数量化方法。
新增双目OCC，集成地瓜双目OCC网络。
视觉语言模型算法新增smolvlm2模型适配, 支持图片回灌、订阅模式；新增llm模型推理结束后输出完整话题的能力。
新增双目深度估计算法。

版本号：2.4.1 (2025-7-30)

新增功能（RDK X5平台）：

MIPI图像采集支持imx415模组。
EdgeSAM分割一切算法新增edgesam作为模型推理；新增nv12格式数据输入；新增对分割结果padding, 用于在双目深度案例一同可视化。
新增人体实例跟踪算法，基于reid模型提取人体特征，通过SQlite数据库存储、管理、查询特征。
新增双目OCC算法，集成地瓜双目OCC网络。
视觉语言模型新增smolvlm2模型适配, 支持图片回灌、订阅模式；新增llm模型推理结束后输出完整话题的能力。

版本号：2.4.0 (2025-5-12)

新增功能：

支持RDK S100平台。

版本号：2.3.3 (2025-4-30)

新增功能：

支持RDK X5 Module平台。
新增基于sensevoice_cpp的ASR开源方案，支持命令词和ASR数据的推送。
双目深度估计算法优化后处理耗时，新增V2.3版本模型。
新增基于llama.cpp的端侧视觉语言模型算法示例。

版本号：2.3.2 (2025-1-15)

功能变更：

双目深度估计算法更新双目模型，优化深度估计效果。
多路视频分析算法应用示例，优化示例处理流程以及WEB端可视化效果。
双目辅助功能包删除部分不能启动的launch文件。

新增功能：

新增ZED相机图像采集，用于启动zed相机获取双目图像，用于双目深度估计算法输入。
新增DOSOD算法，新增地瓜自研开放性词汇检测DOSOD端侧部署功能包。

问题修复：

修复yolov8-seg图像分割算法后处理中由于box越界导致的crash问题。
图像编解码修复帧率统计错误的问题。
双目MIPI图像采集修复i2c detection的问题，增加lpwm开关的配置。

版本号：2.3.1 (2024-11-20)

功能变更：

依赖的opencv版本从3.4.5升级到4.5.4（Ubuntu 22.04使用的最新release版本）。

新增功能：

图像发布工具支持发布bgr/rgb格式消息数据；支持配置发布消息的frame_id。
人体检测和跟踪算法支持配置订阅的消息topic；支持component模式运行；算法前处理支持对输入图片进行缩放后推理；launch启动脚本支持使用压缩图片回灌，并支持配置图片的路径。
板端算法模型推理与部署框架修复多线程推理中推理耗时计算错误的问题；支持在配置文件中配置任务数功能。
图像编解码Node使用订阅到图像消息的frame_id作为输出图像消息的frame_id；支持发布丢帧控制。
手势识别算法支持启动时配置后处理阈值；支持动态手势识别。
新增人脸年龄检测算法，用于检测人的年龄。
新增人脸106关键点检测算法，用于检测人脸106个关键点信息。
新增感知消息融合Node，用于订阅多个PerceptionTargets类型的topic，经过时间对齐、数据去重后，再融合成一个topic后发布。应用参考多算法推理。
新增感知消息滤波Node，采用OneEuroFilter滤波策略对点和框做平滑操作，用于对感知结果中的人体、人脸、人手等检测框和关键点数据进行位置纠正，修复框和点的抖动问题。应用参考多算法推理。
新增双目辅助功能包，用于对双目图像、深度图像进行采集。
新增多路视频分析算法应用示例，通过rtsp协议拉取多路h264和h265码流并推理，在WEB端可视化感知结果。

问题修复：

MIPI图像采集修复imx219模组启动失败的问题.
人手关键点检测算法前处理增加人手框外扩功能，解决算法输出的关键点错误的问题。

版本号：2.3.0 (2024-09-19)

新增功能：

支持RDK X5平台。
数据采集增加双目MIPI图像采集功能。
算法仓库新增yolov8和yolov10目标检测，yolov8-seg图像分割参考算法。
算法仓库新增YOLO-World算法，用于开放性词汇输入检测。
算法仓库新增光流估计算法，用于光流检测。
算法仓库新增分割一切算法，用于无差别分割一切。
算法仓库新增文本图片特征检索算法，用于文本图片特征提取检索。
算法仓库新增双目深度估计算法，实现基于视觉的深度估计。

版本号：2.2.0 (2024-04-11)

功能变更：

基于TROS Foxy 2.1.3版本，适配Ubuntu 22.04系统和ROS2 Humble。
TROS的安装路径由/opt/tros变更为/opt/tros/humble，和ROS2的安装路径层级和命名保持一致。
不再提供tros-ros-base安装包（包含rclcpp、rclpy、ros2cli等ROS2基础功能包），使用标准的ROS2发行包，安装TROS Humble时自动安装依赖的ROS2 Humble。
使用ROS2 fastdds的零拷贝通信功能，涉及到数据采集、图像编解码、算法示例等使用到图像数据的模块。
零拷贝通信使用的QoS的Reliability由RMW_QOS_POLICY_RELIABILITY_RELIABLE（rclcpp::QoS()）变更为RMW_QOS_POLICY_RELIABILITY_BEST_EFFORT（rclcpp::SensorDataQoS()），避免使用零拷贝时潜在的稳定性风险。
重构hobot_dnn，使用更底层的板端推理框架libdnn，不再使用easydnn。
hobot_audio升级语音算法SDK，使用更底层的板端推理框架libdnn，不再使用easydnn。
hobot_trigger适配ROS2 Humble版本rosbag2。

新增功能：

robot_dev_config新增bloom编译和打包的脚本，用于ARM平台编译和打包TROS。
hobot_mipi_cam node新增frame_ts_type配置项，支持realtime（用于计算通信延迟）和sensor（默认，用于传感器的时间戳同步）配置参数。
新增hobot_shm node，用于配置ROS2零拷贝环境。

问题修复：

修复编译器升级引入的兼容性问题。
修复板端编译部分ROS2 pkg存在的路径依赖问题。

tros-foxy

版本号：2.1.3 (2024-03-11)

功能变更：

jpeg压缩格式图片使用的数据类型由sensor_msgs::msg::Image变更为标准的sensor_msgs::msg::CompressedImage，支持使用foxglove和ros2 rqt等工具查看TROS发布的jpeg格式图片。涉及到hobot_websocket, hobot_codec, hobot_image_publisher, hobot_usb_cam模块。
统一使用jpeg/mjpeg配置项指定发布/订阅jpeg压缩格式图片，删除jpeg-compressed/mjpeg-compressed配置项，涉及到hobot_codec和hobot_usb_cam模块。
引入表示TROS发行版的环境变量TROS_DISTRO，执行source /opt/tros/setup.bash/source /opt/tros/local_setup.bash命令后，环境变量TROS_DISTRO的值为空。hobot_codec, hobot_audio, hobot_mipi_cam, hobot_usb_cam等模块使用的配置文件路径由/opt/tros/lib变更为/opt/tros/${TROS_DISTRO}/lib。

版本号：2.1.2 (2024-01-19)

新增功能：

重构hobot_usb_cam，支持更多format配置和转码。
hobot_audio更新语音SDK，同时支持2mic和4mic麦克风板;增加micphone_name配置设备ID号。

问题修复：

hobot_rgbd_cam node修复发送数据消息step字段设置错误问题。
hobot_tts更新音频播放函数调用，解决新版本系统播放失败问题。
hobot_llm删除config设备树文件，以及更新README，新版本系统可通过命令工具设置ION内存大小。

版本号：2.1.1 (2023-11-03)

新增功能：

新增hobot_chatbot node，调用智能语音、大语言模型、文本转语音模块，实现板端语音聊天功能。

问题修复：

文本转语音hobot_tts node，修复某些字符导致应用退出问题。

版本号：2.1.0 (2023-09-14)

功能变更：

tros-ros-base更新到最新ROS2 foxy源码，兼容最新ROS2 foxy软件包。
使用ROS2 foxy软件包只source /opt/tros/setup.bash即可，不再需要使用脚本建立软链接。

新增功能：

文本转语音hobot_tts node新增参数指定播放音频设备。
新增大语言模型hobot_llm node，可在端侧体验LLM。
图像编解码hobot_codec node配置参数in_format新增jpeg-compressed配置项，同时根据配置项选择订阅的话题数据类型。

问题修复：

MIPI图像采集hobot_mipi_cam node修复发送RGB格式数据消息step字段设置错误问题。

版本号：2.0.2 (2023-08-28)

功能变更：

tros.b安装时配置的ROS2源（/etc/apt/sources.list.d/ros2.list）变更为清华镜像源，解决安装ROS2 package速度慢和失败的问题。

新增功能：

启动tros.b脚本配置环境时（source /opt/tros/setup.bash和source /opt/tros/local_setup.bash）新增权限检查的功能。如果当前账户不具有root权限将会自动进入切换到root账户的流程，解决因为权限不够导致的使用tros.b失败的问题。
智能语音算法hobot_audio node新增音频设备号参数配置功能，方便二次开发。
事件触发hobot_trigger node新增通过std_msg话题给Trigger模块发放任务功能，规范Trigger配置方法。

问题修复：

修复图像加速处理hobot_cv node同时进行crop&resize处理图像时，处理失败的问题。
修复MIPI图像采集hobot_mipi_cam node启动时输出error log的问题。
修复数据可视化消息转换hobot_visualization node的launch启动文件配置无效的问题。

版本号：2.0-Release（2.0.1） (2023-06-10)

功能变更：

升级语音算法，优化ASR（语音识别）效果。
优化算法示例的model_name配置项，从模型文件中自动解析model_name配置，解决参数配置错误导致的加载模型失败问题，提升算法二次开发的易用性。
tros.b安装包中不再包含nav2功能包，用户直接在RDK上使用apt命令安装ROS2最新版本的nav2功能包，解决老版本nav2存在的稳定性问题。

新增功能：

新增支持RDK Ultra平台。
新增Trigger事件触发并获取和可视化rosbag数据的hobot_trigger和hobot_visalization等node，帮助用户定位、复现和可视化机器人场景中的感知、规控等问题。同时用户可以二次开发实现数据触发、录制和实时回传的功能。
USB图像采集node自适应USB摄像头的设备号，降低用户使用USB摄像头的门槛。
新增视觉惯性里程计（Visual Inertial Odometry，VIO）算法node，基于视觉实现低成本、鲁棒性高的机器人高精度定位算法。
新增文本转语音的hobot_tts node，实现将文本转化为语音进行播报的功能。
新增激光雷达目标检测算法hobot_centerpoint node。
新增BEV感知算法hobot_bev node。
新增双目深度估计算法hobot_stereonet node。

问题修复：

升级RDK X3的easydnn（版本号1.6.1）和dnn（版本号1.18.4），修复算子crash问题以及支持更多算子。
修复RGBD图像采集node发布的深度数据错误的问题。

其他更新：

优化人体检测和跟踪算法node，支持根据输入图像分辨率自适应输出的算法感知结果坐标。
修复orb_slam3算法编译脚本路径错误导致的编译失败问题。

版本号：2.0-Beta（2.0.0） (2023-05-29)

2.0-Beta（2.0.0）是第一个2.x版本tros.b，建议1.x版本tros.b的用户升级到2.x版本。

功能变更：

代码托管平台从Gitlab更换为GitHub，方便更多开发者进行二次开发。
集成更高效的包管理机制，加快版本升级效率，让机器人应用安装更加便捷。

新增功能：

支持全新的核心板开发套件RDK X3 Module。
hobot_audio增加语音ASR识别结果输出，方便用于开发语音应用。

问题修复：

修复dnn_node内置的MobileNet_SSD模型后处理在多线程情况下崩溃问题。
修复X86平台下dnn_node使用DDR输入模型推理失败问题
修复X86平台下hobot_codec和hobot_image_publisher编译失败问题。

其他更新：

更新示例的launch启动脚本，应用引用依赖模块的launch脚本并配置参数。
webscoket更新展示端的D-Robotics logo。

tros-humble​

版本号：2.4.5 (2025-10-28)​

版本号：2.4.4 (2025-10-24)​

版本号：2.4.3 (2025-9-15)​

版本号：2.4.2 (2025-8-29)​

版本号：2.4.1 (2025-7-30)​

版本号：2.4.0 (2025-5-12)​

版本号：2.3.3 (2025-4-30)​

版本号：2.3.2 (2025-1-15)​

版本号：2.3.1 (2024-11-20)​

版本号：2.3.0 (2024-09-19)​

版本号：2.2.0 (2024-04-11)​

tros-foxy​

版本号：2.1.3 (2024-03-11)​

版本号：2.1.2 (2024-01-19)​

版本号：2.1.1 (2023-11-03)​

版本号：2.1.0 (2023-09-14)​

版本号：2.0.2 (2023-08-28)​

版本号：2.0-Release（2.0.1） (2023-06-10)​

版本号：2.0-Beta（2.0.0） (2023-05-29)​

tros-humble

版本号：2.4.5 (2025-10-28)

版本号：2.4.4 (2025-10-24)

版本号：2.4.3 (2025-9-15)

版本号：2.4.2 (2025-8-29)

版本号：2.4.1 (2025-7-30)

版本号：2.4.0 (2025-5-12)

版本号：2.3.3 (2025-4-30)

版本号：2.3.2 (2025-1-15)

版本号：2.3.1 (2024-11-20)

版本号：2.3.0 (2024-09-19)

版本号：2.2.0 (2024-04-11)

tros-foxy

版本号：2.1.3 (2024-03-11)

版本号：2.1.2 (2024-01-19)

版本号：2.1.1 (2023-11-03)

版本号：2.1.0 (2023-09-14)

版本号：2.0.2 (2023-08-28)

版本号：2.0-Release（2.0.1） (2023-06-10)

版本号：2.0-Beta（2.0.0） (2023-05-29)