每日推荐
早报
搜索
登录
互联网
产品
技术
金融
京东办了场双11版脱口秀大会,「拿钱办事」的李诞很开心
10.22 21:45
荣耀:卖还是不卖?
10.09 22:36
爱奇艺联合长虹推出电视新物种,乐播投屏构建互联网新基建
10.09 18:47
关于开展工业互联网产业联盟实训基地建设有关工作的通知
10.09 18:22
华为又拿一单
10.09 17:15
超2014亿!AMD或收购赛零思
10.09 17:15
特斯拉被骂「割韭菜」,「老用户」真的不值钱?
10.09 17:00
再也不怕理发店、健身房跑路了!
10.09 16:10
爬取UP主弹幕与评论,进行广告投放分析,这里有一课
10.09 13:08
应用安全的十二个最低参照基准
10.09 11:21
重新认识美菜:用最长的时间,做最难的事| 高瓴未来观
10.09 08:58
美政府或寻求限制腾讯及蚂蚁集团支付系统;传华为或考虑出售荣耀品牌;霸王龙骨架拍卖超 3000 万美元|极客早知道
10.09 08:38
5G网络与地铁开通神同步:揭秘“5G新基建”如何高质量布局
10.08 21:03
爱立信拿下印度5G订单
10.08 15:42
特朗普盯上蚂蚁、腾讯支付系统!
10.08 14:20
特斯拉不需要公关,“宇宙网红”摆平一切?
10.08 11:58
APT“商业化”倒逼企业威胁模型变革
10.08 10:45
SD-WAN的世界大战
10.07 21:29
高启全:做好中低端芯片供应链,中国还需10~15年
10.07 20:55
表情包AI生成器:识别人脸情绪,自动配文字
10.07 19:29
加载更多
24小时热文
刚刚,Anthropic 宣布商务部解除了对 Claude Fable 5 和 Mythos 5 的出口管制,明天恢复访问,还顺带感谢了「耐心等待的用户」。不过耐心等待的中国用户,估计永远等不到了。最近 Claude 刚完成了一轮针对中文用户的大清洗。这几天同事见面,打招呼第一句都不是「吃了吗」,是「你号被封了吗」。 Pro 用户封、Max 用户封、刚充值的封、用了两年老号的封、人在国外做过电话验证的也封——甚至有没注册过 Claude 的人,邮箱也收到了封号通知。社区统计申诉成功率 3%,还行,比考上 985 要容易一点了。一边封你的号,一边解禁模型,今天还发了 Sonnet 5,Anthropic 这周真挺忙的。这还不是最骚的。有人把 Claude Code 的二进制扒开逆向,挖出来一段藏着的代码。专门用来识别你是不是中国用户,看你的代理是不是绕道中国。这不是那种「收集匿名使用数据」的遥测,Anthropic 故意混淆过、更新日志一个字不提、你完全不知情的那种。它在 system prompt 里给你打了个只有它自己看得懂的水印: -你把 API 端点指到第三方 → 先查时区,是不是上海、乌鲁木齐 -再查你连的域名,是不是中国域名,里面有没有 deepseek、moonshot、zhipu 这些字眼 -对上了,就偷偷改 prompt 里的字符——日期格式换一下,撇号换成长得一模一样但编码不同的 Unicode 变体,三种,对应三种身份 -肉眼看不出差别,但后端一读编码就对上号了代码还拿 XOR 91 加了层混淆,就为了不被 strings 一扫就扫出来。 Dario Amodei 2020 年带人离开 OpenAI,说不信任权力集中、不信任过程不透明、不信任少数人替所有人做决定。现在这家公司在你终端里跑地理审查,用一套不可见的风控脚本决定谁的号被封。封号比年初体面了一点:给你 48 小时抢救数据,留了导出和申诉入口。但导出的是 CSV 语料,你过去长时间调教出来的写作风格、项目上下文、提示词库、那些让你觉得「它终于懂了」的默契,并不在里面。说真的 Claude 产品力确实强,我也一直在用。但一个把「负责任」写进 DNA 的公司,对待付费用户的方式是终端里塞隐写代码、一封轻飘飘的封号邮件、一张 3% 胜率的申诉表。 Dario 说:AI 不应该被少数人控制,被控制者应该有话语权,过程应该透明,但他也曾在美国国会说「开源AI 非常危险,我们需要监管」我们也想再次问出那个问题:Anthropic ,你的梦想是什么?
五块钱如何花三天... horsley,一位腾讯应用开发高级工程师从token 焦虑到系统化治理,horsley这次想分享的不是几个省 token 小技巧,而是额度收紧后,团队怎样更稳定、更可持续地使用 Agent。要真正管住 Token 成本,不能只靠临时节流,关键是先把这四件事看清楚: 一,真正的问题是浪费不可见很多 token 不是花在难题上,而是花在黑盒里的绕路上。尤其在 IDE vibe 里,外部只看到结果,却看不到 agent 有没有选错模型、反复读旧上下文、工具失败后重试,或因为环境问题绕远路。所以第一步不是让每个人更克制,而是先把浪费看清楚。常见的四类浪费:(1)任务和模型不匹配:低复杂度任务也默认上顶级模型。(2)上下文越来越厚:长对话里旧信息、工具输出、历史判断不断累积。(3)工具和 MCP 太吵:日志、测试、命令输出里大量噪音被原样塞进上下文。(4)失败反复重来:依赖缺失、参数错误、工具失败导致 agent 一轮轮尝试。这些单次看都不大,但每天反复发生,就会成为账单上的大头。 二,值得花和该治理要分开复杂设计、关键判断、疑难排障、探索新 workflow,这些 token 花得值,因为它们换来真实进展。真正该治理的是模型错配、上下文膨胀、工具噪音和失败重试这些低质量消耗。 三,个人经验&平台能力现在很多节省方式都靠个人经验:谁知道该用便宜模型,谁记得哪个 prompt 稳,谁的机器工具链更顺。但换个人、换机器、换一轮会话,经验就容易归零。团队不能长期靠个人自觉控成本。长期看,省 token 应该从个人技巧变成系统能力。平台至少要做到:过程可见,能看到 tool call、失败重试和 token 花费位置;经验可沉淀,记录任务适合什么模型、prompt、skill;实验可回放,在同一状态下比较不同方案;环境可统一,减少本地差异带来的绕路。 四,两个启发 caveman 说明输出也是上下文,少寒暄、少复述、结论优先,可以减少后续语言垃圾。 RTK 说明工具输出不该原样喂给模型,而应先过滤、聚合、截断和去重。它们共同证明:真正有效的 token 优化,不靠人临场克制,而要做进 workflow。 最后共识先把不同浪费拆开看,再承认只靠个人兜底不可持续,最后再把可观测、经验沉淀、模型分层和工具治理做成平台能力。这样,Token 成本管理才不是一场临时省钱运动,而是一次真正的工程化治理。五块钱未必能花三天,但至少要让每一块钱花得更明白。
DeepSeek开始认真收费了
越野跑最先淘汰的,是只会跑快的人
热烈庆祝中国共产党成立105周年
这个00后凭什么拿到高瓴们的1亿美元
《恋与深空》取消敖尹上线,承诺不再推出新男主;英伟达在华启动机器人人才招聘;中国大学停招众多语言专业|极客早知道
Claude Fable 5 明天回归!但 Anthropic 又被曝出离谱大瓜
Anthropic偷偷在Claude Code中植入了隐形代码,只为识别中国用户。
生日快乐!今天,宜告白!
年费限时8折
所有数据均采集于网络,如有侵权请联系站长删除
粤ICP备18050166号-1