跳到主要内容

3.2.6 选择回复模式

RDK Studio 提供 快速思考 两种回复模式。输入区可以直接切换模式,设置页中也可以分别指定默认模型。

两种模式的职责

模式适合任务推荐模型
快速简短问答、执行结果摘要、轻量文件说明小模型或本地 Ollama 模型
思考多步排障、代码修改、执行计划、复杂设备任务更强的云端或自建模型

快速模型未配置时,简单任务也会使用思考模型,速度和成本都会变差。建议至少配置一个成本较低的快速模型。

本地 Ollama 与快速模式

本地大模型页可以把已下载的 Ollama 模型一键设为 Moss 快速模式。常见流程:

  1. 打开 AI 能力 → 本地大模型
  2. 安装并启动 Ollama。
  3. 下载对话模型。
  4. 测试模型。
  5. 点击“设为快速模型配置”。

若输入区提示本机 Ollama 不可达,说明电脑上的本地模型服务没有启动,或被其他程序占用。

配置入口

  • 快速配置:左侧 AI 能力 → 本地大模型
  • 完整配置:设置 → AI 引擎

模型条目的服务类型要和模型平台一致。详细字段见 3.13.3 配置 AI 模型