跳到主要内容

5.10 Token 用量异常

典型现象:发了几条消息后,AI Dock 顶部 Token 用量明显偏高;模型平台账单也比预期高。

先看模型配置

进入 设置 → AI 引擎,先确认“思考”和“快速”两种模式的默认模型是否配置合理:

  • 快速模型未配置:短任务也可能走更强、更贵的思考模型。
  • 快速模型选错:把它改成适合摘要、简短问答的小模型。
  • 模型已配置:继续检查是否反复发送大文件或长日志。

Token 统计边界

你看到的实际行为
AI Dock 右上角胶囊(本次会话)准确,会话级实时
AI Dock 单次任务完成后的总结准确,单次任务累计
跨会话累计 / 按日累计 / 折合费用只作参考,正式成本以模型厂商账单为准

如果需要严格控制成本:

  • 短期:每天记录 AI Dock 顶部用量。
  • 长期:在模型平台控制台开启账单告警,正式费用以平台账单为准。

按场景排查

  1. 快速模型没启用:思考模式适合复杂任务,快速模式适合简短问答、摘要和结果总结。如果快速模型为空,短任务也可能走思考模型。到 设置 → AI 引擎 配置快速模型。

  2. 大文件被反复发送:每条消息都附长文件 / 截图,会让模型反复处理同一批内容:

    • 附件 而不是粘贴
    • 长日志先截取关键片段
    • 长会话明显变慢或跑题时,新建会话
  3. 单次任务连续工作太久:复杂任务会连续调用模型和工具。保持默认设置即可,不建议把单次任务轮数调得过高。

处理建议

  • 配好快速模型,让短任务走轻量模型。
  • 长文件、长日志尽量用附件或截取关键片段。
  • 定期看模型平台账单,发现异常再按这个问题继续排查。