DeepSeek大语言模型
功能介绍
本章节介绍如何在RDK S100系列平台体验端侧 Large Language Model (LLM)。
代码仓库: (https://github.com/D-Robotics/hobot_xlm.git)
支持平台
| 平台 | 运行方式 | 示例功能 |
|---|---|---|
| RDK S100, RDK S100P | Ubuntu 22.04 (Humble) | 端侧大语言模型体验 |
算法信息
| 模型 | 参数量 | Token长度 | 量化方式 | 平台 | prefill eval (tokens/s) | eval (tokens/s) |
|---|---|---|---|---|---|---|
| Deepseek-R1 | 1.5B | 1024 | Q8 | S100 | 635.24 | 17.05 |
| Deepseek-R1 | 7B | 1024 | Q8 | S100 | 279.17 | 3.72 |
| Deepseek-R1 | 1.5B | 1024 | Q8 | S100P | 1326.40 | 26.52 |
| Deepseek-R1 | 7B | 1024 | Q8 | S100P | 468.86 | 6.68 |
准备工作
系统准备
- RDK已烧录好Ubuntu 22.04系统镜像。
- RDK已成功安装TogetheROS.Bot。
模型下载
运行程序前,需要下载模型文件,命令如下:
DeepSeek_R1_Distill_Qwen_1.5B
wget -c ftp://oeftp@sdk.d-robotics.cc/oe_llm/model/DeepSeek_R1_Distill_Qwen_1.5B_1024.hbm --ftp-password=Oeftp~123$%
DeepSeek_R1_Distill_Qwen_7B
wget -c ftp://oeftp@sdk.d-robotics.cc/oe_llm/model/DeepSeek_R1_Distill_Qwen_7B_1024.hbm --ftp-password=Oeftp~123$%