24小时热文
你讲卫生吗? Enri,一位腾讯AI产品工程师,过去半年Enri和大模型打交道,最大收获就两个字:卫生。 不是物理卫生,是交互习惯的卫生。Token 越来越便宜,但你的注意力和决策带宽不会。脏活干多了,模型变傻,脑子也跟着乱。 以下七条实战经验:一、锁死模型配置 很多工具默认"自适应思考",实际上它会让Token 消耗失控。正确做法是固定配置:推理档位锁死 high,关掉自适应,思考预算设上限 32K,关掉超长上下文,设定 200K 自动压缩。降智是你没把档位锁死,不是模型变笨。 二、固定内容别动,利用缓存 模型对完全相同的输入前缀有缓存命中机制,重复使用只需十分之一的费用。长期不变的内容(如身份、业务、输出偏好、原则、约束)固定下来,不要每次重新组织语言。临时放本次任务、材料、目标、截止时间。变动的成本远高于你想象。 三、别喂 PPT PPT、Word 这类复杂格式文件包含大量排版控制信息,喂给模型会消耗 80% 以上的无效 Token。先转成 Markdown 再喂。格式是给人看的,Markdown 是给模型看的。 四、别让会话变垃圾桶 超长会话堆积历史日志和工具调用记录,模型翻旧账,又贵又慢。换任务就开新对话,跑偏了重开重说背景,距上一条超一小时也重开。只有同一任务连续推进且不足一小时,留原对话才划算。 五、让 AI 看一段,别扫一片 用 @ 精准指定文件或函数,别让 AI 自己扫描整个项目。@文件名引用文件,@函数名引用函数,选中代码直接改。改一个验证规则从扫几十个文件降到几百 Token,差距是几十倍。能 @ 函数不 @ 文件,能 @ 文件不靠扫描。 六、让模型先问 告诉模型"你一次问我一个问题,帮我把思路理清",等它问完再整理成文档,产出的 AI 感会弱很多。或先问"你需要我给你什么信息才能完成得更好?",让模型主动暴露你的盲区。让模型先问,比让模型先猜便宜。 七、把想和干拆开 用顶配模型讨论方案,只出方案不动文件;然后交给便宜模型机械执行。顶配模型不需要读取整个项目,消耗降 3-5 倍;便宜模型不思考只管干,Token 极便宜。机械的活交给机器,思考留给最贵的脑子。 这些习惯不是为了省钱。Token 会继续变便宜,但你的思考带宽和注意力不会。AI 太便宜反而容易滥用——一十个 Agent 全开,扫整个项目,无限试错无限返工。 你的决策带宽有限。对自己前额叶好点,注意 AI 时代的工作卫生。 Claude要把Cowork塞进手机,关掉App活儿照跑 200块薅出1.4万算力!OpenAI被薅秃了? 破局类脑智能底层模型:在大脑深处,寻找下一代智能的源代码|甲子光年 94毫秒延迟、监控胜率100%!国产视频模型干翻Gemini GPT-5.6大量实测流出:本周四或登场 新智元ALL in ASI英雄帖 腾讯王腾飞:从生成内容到生成环境,世界模型的3D落地之路 尴尬了!OpenAI刚派GPT-5.5-Cyber修补地球,Codex却爆出致命bug 央行“翻译官”形象的奠基者走了
年费限时8折
所有数据均采集于网络,如有侵权请联系站长删除
粤ICP备18050166号-1