5.10 Token 用量异常

典型现象：发了几条消息后，AI Dock 顶部 Token 用量明显偏高；模型平台账单也比预期高。

先看模型配置

进入 设置 → AI 引擎，先确认“思考”和“快速”两种模式的默认模型是否配置合理：

如果需要严格控制成本：

快速模型没启用：思考模式适合复杂任务，快速模式适合简短问答、摘要和结果总结。如果快速模型为空，短任务也可能走思考模型。到 设置 → AI 引擎 配置快速模型。
大文件被反复发送：每条消息都附长文件 / 截图，会让模型反复处理同一批内容：
- 用附件而不是粘贴
- 长日志先截取关键片段
- 长会话明显变慢或跑题时，新建会话
单次任务连续工作太久：复杂任务会连续调用模型和工具。保持默认设置即可，不建议把单次任务轮数调得过高。