3.2.6 选择回复模式
RDK Studio 提供 快速 和 思考 两种回复模式。输入区可以直接切换模式,设置页中也可以分别指定默认模型。
两种模式的职责
| 模式 | 适合任务 | 推荐模型 |
|---|---|---|
| 快速 | 简短问答、执行结果摘要、轻量文件说明 | 小模型或本地 Ollama 模型 |
| 思考 | 多步排障、代码修改、执行计划、 复杂设备任务 | 更强的云端或自建模型 |
快速模型未配置时,简单任务也会使用思考模型,速度和成本都会变差。建议至少配置一个成本较低的快速模型。
本地 Ollama 与快速模式
本地大模型页可以把已下载的 Ollama 模型一键设为 Moss 快速模式。常见流程:
- 打开 AI 能力 → 本地大模型。
- 安装并启动 Ollama。
- 下载对话模型。
- 测试模型。
- 点击“设为快速模型配置”。
若输入区提示本机 Ollama 不可达,说明电脑上的本地模型服务没有启动,或被其他程序占用。
配置入口
- 快速配置:左侧 AI 能力 → 本地大模型。
- 完整配置:设置 → AI 引擎。
模型条目的服务类型要和模型平台一致。详细字段见 3.13.3 配置 AI 模型。