5.1.6 版本发布记录
tros-humble
版本号:2.4.2 (2025-8-29)
新增功能(RDK S100
平台):
- MIPI图像采集支持
230ai
双目模组。 - 目标检测YOLO支持
yolo11
和yolov12
算法;增加使用component
方式启动的脚本,支持使用mipi cam
采集4K图像进行推理。 - EdgeSAM分割一切算法新增
edgesam
作为模型推理;新增nv12
格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增文本图片特征检索算法,用于文本图片特征提取检索。
- 新增DOSOD算法,新增地瓜自研开放性词汇检测DOSOD端侧部署功能包;新增DOSOD模型自定义修改检测类别的重参数量化方法。
- 新增双目OCC,集成地瓜双目
OCC
网络。 - 视觉语言模型算法新增
smolvlm2
模型适配, 支持图片回灌、订阅模式;新增llm
模型推理结束后输出完整话题的能力。 - 新增双目深度估计算法。
版本号:2.4.1 (2025-7-30)
新增功能(RDK X5
平台):
- MIPI图像采集支持
imx415
模组。 - EdgeSAM分割一切算法新增
edgesam
作为模型推理;新增nv12
格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增人体实例跟踪算法,基于
reid
模型提取人体特征,通过SQlite
数据库存储、管理、查询特征。 - 新增双目OCC算法,集成地瓜双目
OCC
网络。 - 视觉语言模型新增
smolvlm2
模型适配, 支持图片回灌、订阅模式;新增llm
模型推理结束后输出完整话题的能力。
版本号:2.4.0 (2025-5-12)
新增功能:
- 支持
RDK S100
平台。
版本号:2.3.3 (2025-4-30)
新增功能:
- 支持
RDK X5 Module
平台。 - 新增基于
sensevoice_cpp
的ASR开源方案,支持命令词和ASR数据的推送。 - 双目深度估计算法优化后处理耗时,新增V2.3版本模型。
- 新增基于
llama.cpp
的端侧视觉语言模型算法示例。
版本号:2.3.2 (2025-1-15)
功能变更:
新增功能:
问题修复:
- 修复yolov8-seg图像分割算法后处理中由于box越界导致的crash问题。
- 图像编解码修复帧率统计错误的问题。
- 双目MIPI图像采集修复i2c detection的问题,增加lpwm开关的配置。
版本号:2.3.1 (2024-11-20)
功能变更:
- 依赖的
opencv
版本从3.4.5升级到4.5.4(Ubuntu 22.04使用的最新release版本)。
新增功能:
- 图像发布工具支持发布
bgr/rgb
格式消息数据;支持配置发布消息的frame_id。 - 人体检测和跟踪算法支持配置订阅的消息topic;支持component模式运行;算法前处理支持对输入图片进行缩放后推理;launch启动脚本支持使用压缩图片回灌,并支持配置图片的路径。
- 板端算法模型推理与部署框架修复多线程推理中推理耗时计算错误的问题;支持在配置文件中配置任务数功能。
- 图像编解码Node使用订阅到图像消息的frame_id作为输出图像消息的frame_id;支持发布丢帧控制。
- 手势识别算法支持启动时配置后处理阈值;支持动态手势识别。
- 新增人脸年龄检测算法,用于检测人的年龄。
- 新增人脸106关键点检测算法,用于检测人脸106个关键点信息。
- 新增感知消息融合Node,用于订阅多个PerceptionTargets类型的topic,经过时间对齐、数据去重后,再融合成一个topic后发布。应用参考多算法推理。
- 新增感知消息滤波Node,采用OneEuroFilter滤波策略对点和框做平滑操作,用于对感知结果中的人体、人脸、人手等检测框和关键点数据进行位置纠正,修复框和点的抖动问题。应用参考多算法推理。
- 新增双目辅助功能包,用于对双目图像、深度图像进行采集。
- 新增多路视频分析算法应用示例,通过rtsp协议拉取多路h264和h265码流并推理,在WEB端可视化感知结果。
问题修复:
版本号:2.3.0 (2024-09-19)
新增功能:
- 支持
RDK X5
平台。 - 数据采集增加双目MIPI图像采集功能。
- 算法仓库新增
yolov8
和yolov10
目标检测,yolov8-seg
图像分割参考算法。 - 算法仓库新增YOLO-World算法,用于开放性词汇输入检测。
- 算法仓库新增光流估计算法,用于光流检测。
- 算法仓库新增分割一切算法,用于无差别分割一切。
- 算法仓库新增文本图片特征检索算法,用于文本图片特征提取检索。
- 算法仓库新增双目深度估计算法,实现基于视觉的深度估计。
版本号:2.2.0 (2024-04-11)
功能变更:
- 基于TROS Foxy 2.1.3版本,适配Ubuntu 22.04系统和ROS2 Humble。
- TROS的安装路径由
/opt/tros
变更为/opt/tros/humble
,和ROS2的安装路径层级和命名保持一致。 - 不再提供
tros-ros-base
安装包(包含rclcpp、rclpy、ros2cli等ROS2基础功能包),使用标准的ROS2发行包,安装TROS Humble时自动安装依赖的ROS2 Humble。 - 使用ROS2 fastdds的零拷贝通信功能,涉及到数据采集、图像编解码、算法示例等使用到图像数据的模块。
- 零拷贝通信使用的QoS的Reliability由
RMW_QOS_POLICY_RELIABILITY_RELIABLE
(rclcpp::QoS())变更为RMW_QOS_POLICY_RELIABILITY_BEST_EFFORT
(rclcpp::SensorDataQoS()),避免使用零拷贝时潜在的稳定性风险。 - 重构
hobot_dnn
,使用更底层的板端推理框架libdnn
,不再使用easydnn
。 hobot_audio
升级语音算法SDK,使用更底层的板端推理框架libdnn
,不再使用easydnn
。hobot_trigger
适配ROS2 Humble版本rosbag2。
新增功能:
robot_dev_config
新增bloom编译和打包的脚本,用于ARM平台编译和打包TROS。hobot_mipi_cam
node新增frame_ts_type配置项,支持realtime(用于计算通信延迟)和sensor(默认,用于传感器的时间戳同步)配置参数。- 新增
hobot_shm
node,用于配置ROS2零拷贝环境。
问题修复:
- 修复编译器升级引入的兼容性问题。
- 修复板端编译部分ROS2 pkg存在的路径依赖问题。