每日推荐
早报
搜索
登录
互联网
产品
技术
金融
京东办了场双11版脱口秀大会,「拿钱办事」的李诞很开心
10.22 21:45
荣耀:卖还是不卖?
10.09 22:36
爱奇艺联合长虹推出电视新物种,乐播投屏构建互联网新基建
10.09 18:47
关于开展工业互联网产业联盟实训基地建设有关工作的通知
10.09 18:22
华为又拿一单
10.09 17:15
超2014亿!AMD或收购赛零思
10.09 17:15
特斯拉被骂「割韭菜」,「老用户」真的不值钱?
10.09 17:00
再也不怕理发店、健身房跑路了!
10.09 16:10
爬取UP主弹幕与评论,进行广告投放分析,这里有一课
10.09 13:08
应用安全的十二个最低参照基准
10.09 11:21
重新认识美菜:用最长的时间,做最难的事| 高瓴未来观
10.09 08:58
美政府或寻求限制腾讯及蚂蚁集团支付系统;传华为或考虑出售荣耀品牌;霸王龙骨架拍卖超 3000 万美元|极客早知道
10.09 08:38
5G网络与地铁开通神同步:揭秘“5G新基建”如何高质量布局
10.08 21:03
爱立信拿下印度5G订单
10.08 15:42
特朗普盯上蚂蚁、腾讯支付系统!
10.08 14:20
特斯拉不需要公关,“宇宙网红”摆平一切?
10.08 11:58
APT“商业化”倒逼企业威胁模型变革
10.08 10:45
SD-WAN的世界大战
10.07 21:29
高启全:做好中低端芯片供应链,中国还需10~15年
10.07 20:55
表情包AI生成器:识别人脸情绪,自动配文字
10.07 19:29
加载更多
24小时热文
五块钱如何花三天... horsley,一位腾讯应用开发高级工程师从token 焦虑到系统化治理,horsley这次想分享的不是几个省 token 小技巧,而是额度收紧后,团队怎样更稳定、更可持续地使用 Agent。要真正管住 Token 成本,不能只靠临时节流,关键是先把这四件事看清楚: 一,真正的问题是浪费不可见很多 token 不是花在难题上,而是花在黑盒里的绕路上。尤其在 IDE vibe 里,外部只看到结果,却看不到 agent 有没有选错模型、反复读旧上下文、工具失败后重试,或因为环境问题绕远路。所以第一步不是让每个人更克制,而是先把浪费看清楚。常见的四类浪费:(1)任务和模型不匹配:低复杂度任务也默认上顶级模型。(2)上下文越来越厚:长对话里旧信息、工具输出、历史判断不断累积。(3)工具和 MCP 太吵:日志、测试、命令输出里大量噪音被原样塞进上下文。(4)失败反复重来:依赖缺失、参数错误、工具失败导致 agent 一轮轮尝试。这些单次看都不大,但每天反复发生,就会成为账单上的大头。 二,值得花和该治理要分开复杂设计、关键判断、疑难排障、探索新 workflow,这些 token 花得值,因为它们换来真实进展。真正该治理的是模型错配、上下文膨胀、工具噪音和失败重试这些低质量消耗。 三,个人经验&平台能力现在很多节省方式都靠个人经验:谁知道该用便宜模型,谁记得哪个 prompt 稳,谁的机器工具链更顺。但换个人、换机器、换一轮会话,经验就容易归零。团队不能长期靠个人自觉控成本。长期看,省 token 应该从个人技巧变成系统能力。平台至少要做到:过程可见,能看到 tool call、失败重试和 token 花费位置;经验可沉淀,记录任务适合什么模型、prompt、skill;实验可回放,在同一状态下比较不同方案;环境可统一,减少本地差异带来的绕路。 四,两个启发 caveman 说明输出也是上下文,少寒暄、少复述、结论优先,可以减少后续语言垃圾。 RTK 说明工具输出不该原样喂给模型,而应先过滤、聚合、截断和去重。它们共同证明:真正有效的 token 优化,不靠人临场克制,而要做进 workflow。 最后共识先把不同浪费拆开看,再承认只靠个人兜底不可持续,最后再把可观测、经验沉淀、模型分层和工具治理做成平台能力。这样,Token 成本管理才不是一场临时省钱运动,而是一次真正的工程化治理。五块钱未必能花三天,但至少要让每一块钱花得更明白。
DeepSeek开始认真收费了
沃尔玛造了一座迪士尼痛城
2 年,他和 AI「聊」出一家智能戒指公司,还盈利了
利好落地!美伊谈判,传来大消息!高盛发布最新预警
字节决定赌一把
这封电报穿越了105年!
【财闻联播】4倍大牛股,最新公告!7月5日起,国内航线燃油附加费下调
基金重磅预判!2026下半年AI行情新变局:告别炒概念,业绩说了算
中共中央关于表彰全国优秀共产党员、全国优秀党务工作者和全国先进基层党组织的决定
年费限时8折
所有数据均采集于网络,如有侵权请联系站长删除
粤ICP备18050166号-1