跳到主要内容

3.15.2 查看 Token 用量

Token 是模型处理文本时使用的计量单位。你不需要记精确换算,只要知道:消息越长、附件越多、执行步骤越多,Token 用量通常越高。

RDK Studio 在两处提供 Token 用量统计:AI Dock 顶部的会话胶囊与单次任务完成后的总结。它能帮助你判断一次任务大概用了多少模型处理量和成本。

AI Dock 顶部胶囊

AI Dock 顶部状态栏中的"用量胶囊"实时显示:

  • 当前会话累计的 Token 数(输入 + 输出)
  • 占当前模型可处理内容上限的比例
  • 接近上限时变红预警

胶囊数据是会话级的:切换到另一个会话时,胶囊显示该会话的累计;新建会话时归零。

单次任务完成后的总结

每次 AI 完成一轮回复后,会在消息尾部显示本轮 Token 用量概览:

字段含义
本轮合计输入 Token、输出 Token、总计
轮次Moss 为完成任务来回处理的次数
操作次数读取文件、运行命令、查看设备状态等操作的次数
耗时从你发送到 AI 完成的总时间
折合费用仅供大致参考,实际以模型厂商账单为准

一次看起来简单的提问,背后可能会经历多轮处理:例如先读取文件,再分析输出,最后整理答案。每一轮都会消耗 Token。

统计边界

Token 统计适合做会话内观察,不适合作为正式账单依据:

你看到的实际行为
AI Dock 胶囊(本会话)准确,会话级实时
单次任务完成后的总结准确,单次任务累计
同一会话多轮加总准确
跨会话累计不作为长期统计依据
按日 / 周 / 月累计建议以模型厂商账单为准
折合费用历史仅供估算参考

如果需要做月度账单核对,不要只看 Studio 内的累计数据。

需要精确统计时

周期推荐做法
短期(每日)每天截图 AI Dock 胶囊存档,便于对比
长期(每月)在模型厂商控制台开账单告警与日报

模型厂商控制台的账单数据更适合做正式核对,不会因为 Studio 重启或切换会话而丢失。

折合费用的精度

Studio 显示的折合费用是估算,可能与实际账单存在偏差,原因:

  • 厂商实际计费可能包含输入缓存折扣、模型服务费等多项目
  • 厂商价格调整时 Studio 可能未及时同步
  • 批量折扣、企业合同价 Studio 不知道

要精确成本请看厂商账单。Studio 的费用估算只适合日常粗略比较,例如判断某个任务是否明显更贵。

使用建议

  • 简单问答尽量使用 快速 模式。
  • 大文件先截取关键片段再发给 Moss。
  • 需要长期控制成本时,以模型厂商控制台的账单和告警为准。