DeepSeek大语言模型

功能介绍

本章节介绍如何在RDK S100系列平台体验端侧 Large Language Model (LLM)。

代码仓库： (https://github.com/D-Robotics/hobot_xlm.git)

支持平台

平台	运行方式	示例功能
RDK S100, RDK S100P	Ubuntu 22.04 (Humble)	端侧大语言模型体验

算法信息

模型	参数量	Token长度	量化方式	平台	prefill eval (tokens/s)	eval (tokens/s)
Deepseek-R1	1.5B	1024	Q8	S100	635.24	17.05
Deepseek-R1	7B	1024	Q8	S100	279.17	3.72
Deepseek-R1	1.5B	1024	Q8	S100P	1326.40	26.52
Deepseek-R1	7B	1024	Q8	S100P	468.86	6.68

准备工作

系统准备

RDK已烧录好Ubuntu 22.04系统镜像。
RDK已成功安装TogetheROS.Bot。

模型下载

运行程序前，需要下载模型文件，命令如下：

DeepSeek_R1_Distill_Qwen_1.5B

wget -c ftp://oeftp@sdk.d-robotics.cc/oe_llm/model/DeepSeek_R1_Distill_Qwen_1.5B_1024.hbm --ftp-password=Oeftp~123$%

DeepSeek_R1_Distill_Qwen_7B

wget -c ftp://oeftp@sdk.d-robotics.cc/oe_llm/model/DeepSeek_R1_Distill_Qwen_7B_1024.hbm --ftp-password=Oeftp~123$%

系统配置

设置 ION 内存空间最大, 满足大模型推理需求

/usr/hobot/bin/hb_switch_ion.sh bpu_first
reboot

设置性能模式 注意：仅RDK S100P 支持性能模式

devmem 0x2b047000 32 0x99
devmem 0x2b047004 32 0x99

使用方式

目前提供两种体验方式，一种直接终端输入文本聊天体验，一种订阅文本消息，然后将结果以文本方式发布出去。

终端交互体验

# 配置tros.b环境
source /opt/tros/humble/setup.bash

lib=/opt/tros/humble/lib/hobot_xlm/lib
export LD_LIBRARY_PATH=${lib}:${LD_LIBRARY_PATH}
# config中为示例使用的模型配置文件
cp -r /opt/tros/humble/lib/hobot_xlm/config/ .
ros2 run hobot_xlm hobot_xlm --ros-args -p feed_type:=0 -p model_name:="DeepSeek_R1_Distill_Qwen_1.5B"

程序启动后，可直接在当前终端和机器人聊天。

当前支持的模型类型为DeepSeek_R1_Distill_Qwen_1.5B"，"DeepSeek_R1_Distill_Qwen_7B"。其中 7B 模型仅适用于RDK S100P。

订阅发布体验

启动 hobot_llm

# 配置tros.b环境
source /opt/tros/humble/setup.bash

lib=/opt/tros/humble/lib/hobot_xlm/lib
export LD_LIBRARY_PATH=${lib}:${LD_LIBRARY_PATH}
# config中为示例使用的模型配置文件
cp -r /opt/tros/humble/lib/hobot_xlm/config/ .
ros2 run hobot_xlm hobot_xlm --ros-args -p feed_type:=1 -p ros_string_sub_topic_name:="/prompt_text" -p model_name:="DeepSeek_R1_Distill_Qwen_1.5B"

当前支持的模型类型为DeepSeek_R1_Distill_Qwen_1.5B"，"DeepSeek_R1_Distill_Qwen_7B"。其中 7B 模型仅适用于RDK S100P。

新开一个终端订阅输出结果topic

# 配置tros.b环境
source /opt/tros/humble/setup.bash

ros2 topic echo /tts_text

新开一个终端发布消息

# 配置tros.b环境
source /opt/tros/humble/setup.bash

ros2 topic pub --once /prompt_text std_msgs/msg/String "{data: ""简单描述人工智能的发展""}"

消息发送后，可以在订阅输出结果终端查看输出结果。

结果示例

[UCP]: log level = 3
[UCP]: UCP version = 3.7.3
[VP]: log level = 3
[DNN]: log level = 3
[HPL]: log level = 3
[UCPT]: log level = 6
[WARN] [1757949703.788157149] [xlm_node]: This is hobot xlm node!
[WARN] [1757949703.800199173] [xlm_node]: Parameter:
 feed_type(0:local, 1:sub): 0
 model_name: DeepSeek_R1_Distill_Qwen_1.5B
 ai_msg_pub_topic_name: /generation/lanaguage/deepseek
 text_msg_pub_topic_name: /tts_text
 ros_string_sub_topic_name: /prompt_text
[WARN] [1757949703.800428372] [xlm_node]: Model Parameter:
 model_path:   ./DeepSeek_R1_Distill_Qwen_1.5B_4096.hbm
 token_path:   ./config/DeepSeek_R1_Distill_Qwen_1.5B_config/
 k_cache_int8: 0
 model_type:   3
 context_size: 1024
 prompt_file:
 path_prompt_cache:
 sampling: {
     top_k:    3
     top_p:    0.95
     min_p:    0.1
     temp:     0.1
     typ_p:    1
     min_keep: 5
 }
[BPU][[BPU_MONITOR]][281473285378048][INFO]BPULib verison(2, 1, 2)[0d3f195]!
[DNN] HBTL_EXT_DNN log level:6
[DNN]: 3.6.1_(4.2.7post0.dev202307211111+6aaae37 HBRT)
[WARN] [1757949705.795194210] [xlm_node]: model init successed!
板端大模型多轮对话交互demo，请输入你的问题并按下回车
- 退出请输入Ctrl C
- 清除缓存请输入reset
[User] <<< 简单描述人工智能的发展
[Assistant] >>> ...

人工智能（AI）的发展可以分为几个主要阶段：

1. **早期AI**：
   - **人工智能**：最初用于特定任务，如游戏和客服。
   - **机器学习**：1950年代，计算机开始学习，如自动识别和语音识别。
   - **专家系统**：1970年代，如“维基”系统，模拟人类专家。

2. **计算机视觉**：
   - **图像识别**：1980年代，计算机识别简单的图像，如手写数字。
   - **自然语言处理**：1990年代，如维基百科的自动搜索和编辑。

3. **深度学习**：
   - **神经网络**：1980年代，神经网络用于处理复杂数据。
   - **卷积神经网络（CNN）**：1990年代，用于图像识别，如自动驾驶汽车。
   - **深度学习**：2010年代，如GPT和BERT，用于自然语言处理。

4. **强化学习**：
   - **机器人控制**：1980年代，机器人学习动作。
   - **自动驾驶**：2010年代，如自动驾驶汽车。

5. **深度学习和神经网络**：
   - **图像识别**：如分类、分割和生成。
   - **自然语言处理**：如文本生成、翻译和对话。
   - **语音识别**：如转录和语音合成。

6. **AI应用**：
   - **医疗**：如诊断和药物研发。
   - **交通**：如自动驾驶和交通管理系统。
   - **教育**：如智能学习系统。
   - **金融**：如自动交易和风险管理。

7. **伦理和挑战**：
   - **隐私问题**：数据泄露和隐私侵犯。
   - **伦理争议**：如算法偏见和隐私问题。

8. **未来展望**：
   - **AI芯片**：用于训练和推理。
   - **边缘AI**：在设备上运行，减少数据传输。
   - **多模态AI**：结合视觉、听觉等多模态数据。
   - **人类助手**：如聊天机器人和生命支持系统。

AI将继续在多个领域发展，推动技术进步和社会变革。
Performance prefill: 1113.04tokens/s    decode: 20.22tokens/s

功能介绍​

支持平台​

算法信息​

准备工作​

系统准备​

模型下载​

DeepSeek_R1_Distill_Qwen_1.5B​

DeepSeek_R1_Distill_Qwen_7B​

系统配置​

使用方式​

终端交互体验​

订阅发布体验​

结果示例​