3.15.2 查看 Token 用量
Token 是模型处理文本时使用的计量单位。你不需要记精确换算,只要知道:消息越长、附件越多、执行步骤越多,Token 用量通常越高。
RDK Studio 在两处提供 Token 用量统计:AI Dock 顶部的会话胶囊与单次任务完成后的总结。它能帮助你判断一次任务大概用了多少模型处理量和成本。
AI Dock 顶部胶囊
AI Dock 顶部状态栏中的"用量胶囊"实时显示:
- 当前会话累计的 Token 数(输入 + 输出)
- 占当前模型可处理内容上限的比例
- 接近上限时变红预警
胶囊数据是会话级的:切换到另一个会话时,胶囊显示该会话的累计;新建会话时归零。
单次任务完成后的总结
每次 AI 完成一轮回复后,会在消息尾部显示本轮 Token 用量概览:
| 字段 | 含义 |
|---|---|
| 本轮合计 | 输入 Token、输出 Token、总计 |
| 轮次 | Moss 为完成任务来回处理的次数 |
| 操作次数 | 读取文件、运行命令、查看设备状态等操作的次数 |
| 耗时 | 从你发送到 AI 完成的总时间 |
| 折合费用 | 仅供大致参考,实际以模型厂商账单为准 |
一次看起来简单的提问,背后可能会经历多轮处理:例如先读取文件,再分析输出,最后整理答案。每一轮都会消耗 Token。
统计边界
Token 统计适合做会话内观察,不适合作为正式账单依据:
| 你看到的 | 实际行为 |
|---|---|
| AI Dock 胶囊(本会话) | 准确,会话级实时 |
| 单次任务完成后的总结 | 准确,单次任务累计 |
| 同一会话多轮加总 | 准确 |
| 跨会话累计 | 不作为长期统计依据 |
| 按日 / 周 / 月累计 | 建议以模型厂商账单为准 |
| 折合费用历史 | 仅供估算参考 |
如果需要做月度账单核对,不要只看 Studio 内的累计数据。
需要精确统计时
| 周期 | 推荐做法 |
|---|---|
| 短期(每日) | 每天截图 AI Dock 胶囊存档,便于对比 |
| 长期(每月) | 在模型厂商控制台开账单告警与日报 |
模型厂商控制台的账单数据更适合做正式核对,不会因为 Studio 重启或切换会 话而丢失。
折合费用的精度
Studio 显示的折合费用是估算,可能与实际账单存在偏差,原因:
- 厂商实际计费可能包含输入缓存折扣、模型服务费等多项目
- 厂商价格调整时 Studio 可能未及时同步
- 批量折扣、企业合同价 Studio 不知道
要精确成本请看厂商账单。Studio 的费用估算只适合日常粗略比较,例如判断某个任务是否明显更贵。
使用建议
- 简单问答尽量使用 快速 模式。
- 大文件先截取关键片段再发给 Moss。
- 需要长期控制成本时,以模型厂商控制台的账单和告警为准。