5.1.6 版本发布记录
tros-humble
版本号:2.4.3 (2025-9-15)
新增功能(RDK X5
平台):
- MIPI图像采集支持启动多路图像采集。
- 双目MIPI图像采集支持
sc132gs
双目相机。
版本号:2.4.2 (2025-8-29)
新增功能(RDK S100
平台):
- MIPI图像采集支持
230ai
双目模组。 - 目标检测YOLO支持
yolo11
和yolov12
算法; 增加使用component
方式启动的脚本,支持使用mipi cam
采集4K图像进行推理。 - EdgeSAM分割一切算法新增
edgesam
作为模型推理;新增nv12
格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增文本图片特征检索算法,用于文本图片特征提取检索。
- 新增DOSOD算法,新增地瓜自研开放性词汇检测DOSOD端侧部署功能包;新增DOSOD模型自定义修改检测类别的重参数量化方法。
- 新增双目OCC,集成地瓜双目
OCC
网络。 - 视觉语言模型算法新增
smolvlm2
模型适配, 支持图片回灌、订阅模式;新增llm
模型推理结束后输出完整话题的能力。 - 新增双目深度估计算法。
版本号:2.4.1 (2025-7-30)
新增功能(RDK X5
平台):
- MIPI图像采集支持
imx415
模组。 - EdgeSAM分割一切算法新增
edgesam
作为模型推理;新增nv12
格式数据输入;新增对分割结果padding, 用于在双目深度案例一同可视化。 - 新增人体实例跟踪算法,基于
reid
模型提取人体特征,通过SQlite
数据库存储、管理、查询特征。 - 新增双目OCC算法,集成地瓜双目
OCC
网络。 - 视觉语言模型新增
smolvlm2
模型适配, 支持图片回灌、订阅模式;新增llm
模型推理结束后输出完整话题的能力。
版本号:2.4.0 (2025-5-12)
新增功能:
- 支持
RDK S100
平台。
版本号:2.3.3 (2025-4-30)
新增功能:
- 支持
RDK X5 Module
平台。 - 新增基于
sensevoice_cpp
的ASR开源方案,支持命令词和ASR数据的推送。 - 双目深度估计算法优化后处理耗时,新增V2.3版本模型。
- 新增基于
llama.cpp
的端侧视觉语言模型算法示例。