24小时热文
五块钱如何花三天... horsley,一位腾讯应用开发高级工程师从token 焦虑到系统化治理,horsley这次想分享的不是几个省 token 小技巧,而是额度收紧后,团队怎样更稳定、更可持续地使用 Agent。要真正管住 Token 成本,不能只靠临时节流,关键是先把这四件事看清楚: 一,真正的问题是浪费不可见很多 token 不是花在难题上,而是花在黑盒里的绕路上。尤其在 IDE vibe 里,外部只看到结果,却看不到 agent 有没有选错模型、反复读旧上下文、工具失败后重试,或因为环境问题绕远路。所以第一步不是让每个人更克制,而是先把浪费看清楚。常见的四类浪费:(1)任务和模型不匹配:低复杂度任务也默认上顶级模型。(2)上下文越来越厚:长对话里旧信息、工具输出、历史判断不断累积。(3)工具和 MCP 太吵:日志、测试、命令输出里大量噪音被原样塞进上下文。(4)失败反复重来:依赖缺失、参数错误、工具失败导致 agent 一轮轮尝试。这些单次看都不大,但每天反复发生,就会成为账单上的大头。 二,值得花和该治理要分开复杂设计、关键判断、疑难排障、探索新 workflow,这些 token 花得值,因为它们换来真实进展。真正该治理的是模型错配、上下文膨胀、工具噪音和失败重试这些低质量消耗。 三,个人经验&平台能力现在很多节省方式都靠个人经验:谁知道该用便宜模型,谁记得哪个 prompt 稳,谁的机器工具链更顺。但换个人、换机器、换一轮会话,经验就容易归零。团队不能长期靠个人自觉控成本。长期看,省 token 应该从个人技巧变成系统能力。平台至少要做到:过程可见,能看到 tool call、失败重试和 token 花费位置;经验可沉淀,记录任务适合什么模型、prompt、skill;实验可回放,在同一状态下比较不同方案;环境可统一,减少本地差异带来的绕路。 四,两个启发 caveman 说明输出也是上下文,少寒暄、少复述、结论优先,可以减少后续语言垃圾。 RTK 说明工具输出不该原样喂给模型,而应先过滤、聚合、截断和去重。它们共同证明:真正有效的 token 优化,不靠人临场克制,而要做进 workflow。 最后共识先把不同浪费拆开看,再承认只靠个人兜底不可持续,最后再把可观测、经验沉淀、模型分层和工具治理做成平台能力。这样,Token 成本管理才不是一场临时省钱运动,而是一次真正的工程化治理。五块钱未必能花三天,但至少要让每一块钱花得更明白。 越野跑最先淘汰的,是只会跑快的人 沃尔玛造了一座迪士尼痛城 DeepSeek开始认真收费了 自变量 200 亿估值背后,具身智能在给什么定价? 2 年,他和 AI「聊」出一家智能戒指公司,还盈利了 全球供应链转向:东南亚和美国行业巨头为何都在选择中国伙伴? 习近平:在庆祝中国共产党成立105周年大会上的讲话 习近平:在庆祝中国共产党成立105周年大会上的讲话 中共中央关于表彰全国优秀共产党员、全国优秀党务工作者和全国先进基层党组织的决定
年费限时8折
所有数据均采集于网络,如有侵权请联系站长删除
粤ICP备18050166号-1