5.10 Token 用量异常
典型现象:发了几条消息后,AI Dock 顶部 Token 用量明显偏高;模型平台账单也比预期高。
先看模型配置
进入 设置 → AI 引擎,先确认“思考”和“快速”两种模式的默认模型是否配置合理:
- 快速模型未配置:短任务也可能走更强、更贵的思考模型。
- 快速模型选错:把它改成适合摘要、简短问答的小模型。
- 模型已配置:继续检查是否反复发送大文件或长日志。
Token 统计边界
| 你看到的 | 实际行为 |
|---|---|
| AI Dock 右上角胶囊(本次会话) | 准确,会话级实时 |
| AI Dock 单次任务完成后的总结 | 准确,单次任务累计 |
| 跨会话累计 / 按日累计 / 折合费用 | 只作参考,正式成本以模型厂商账单为准 |
如果需要严格控制成本:
- 短期:每天记录 AI Dock 顶部用量。
- 长期:在模型平台控制台开启账单告警,正式费用以平台账单为准。
按场景排查
-
快速模型没启用:思考模式适合复杂任务,快速模式适合简短问答、摘要和结果总结。如果快速模型为空, 短任务也可能走思考模型。到 设置 → AI 引擎 配置快速模型。
-
大文件被反复发送:每条消息都附长文件 / 截图,会让模型反复处理同一批内容:
- 用 附件 而不是粘贴
- 长日志先截取关键片段
- 长会话明显变慢或跑题时,新建会话
-
单次任务连续工作太久:复杂任务会连续调用模型和工具。保持默认设置即可,不建议把单次任务轮数调得过高。
处理建议
- 配好快速模型,让短任务走轻量模型。
- 长文件、长日志尽量用附件或截取关键片段。
- 定期看模型平台账单,发现异常再按这个问题继续排查。