MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 6 / 10
A 厂超越自己,Claude Fable 5 ⁠发布:迄今最强模型面向所有人开放这里是墨问最全中文介绍Claude Fable 5 ⁠发布 这个高于 Opus 的模型,用法有所变化: 1、Fable 5 ⁠今日起全面上线,API ⁠与按量计费的企业版即刻可用。2、6 ⁠月 9 ⁠日至 22 ⁠日,Pro、Max、Team ⁠及按席位的企业版用户免费包含使用。3、6 ⁠月 23 ⁠日起将从订阅套餐中移除,之后需用 ⁠usage credits;待产能充足后会重新纳入标准订阅。 Andrej Karpathy 加入了 A 厂之后很少发推特了,这次产品发布,他在 x 上盛赞了这款模型产品:这是一条令人超级兴奋的发布——Claude Fable 5 与 Mythos 使用相同的基础模型,但增加了安全防护。各项基准测试成绩出色,在所有任务上都是 SOTA(最先进的),而且幅度不小。但我还要补充一点——从定性角度来说,这也是一次值得大版本更新的飞跃(我个人认为与去年 11 月 Claude 4.5 的进步属于同一量级),尤其在处理极其困难的问题时的长时间推理任务上表现突出。你可以给它布置比以前大胆得多的任务,模型能"理解"你要做什么,然后直接开干,而且这种感觉前所未有地强烈——让人忍不住想完全不看代码了(但生产环境里可别真这么做!)。模型仍有一些小毛病,用户会遇到一些怪问题,安全防护在发布时配置得有点过于敏感,希望后续能逐步调优。我感觉很多事情正在发生变化——工作软件正越来越多地按需涌现。Jevons 悖论开始生效,我感觉自己对软件的需求也在大幅增长。你可以要求任何东西——解释器、可视化图表、数据仪表盘、定制的单次使用应用(比如一个专门为你项目高度定制的完整 wandb)、你可以把测试套件放大 10 倍、自动优化代码、用自定义 HTML 运行大型研究项目来展示结果——任何事!"释放你的思维"(Matrix 梗)。真的非常期待看到大家会做出什么样的东西!——————我自己由于年初 Claude 账户无端被封,一直在用第三方平台的 Opus,或者用 Claude Code 接其他模型,但第三方平台也只能采购 A 厂的 API 服务,相比于订阅,非常不耐用,最近尝试用回原生 Claude。周一处理一个相对复杂的问题,Opus 4.8 基于水位线模式优化了之前的方案,相当于其他模型,4.8 完成的非常漂亮。模型强还真是不讲理啊。Vibe 时代才刚刚开始,欢迎一起: 墨问 Vibe 社群计划
^__^ 6 / 05
昨天 CatReader 系统一上线,新增的会员不说,墨问老会员呼一下就涌了进来,立刻暴露了一个问题,我司大师就告诉我了,说你赶紧弄弄(而不是他帮我弄弄),于是赶紧让 AI 偷摸给修复了。 然后,墨友 Rocky 就说,文章收藏了,但无法从 reading list 里移除啊,老池你快看看咋回事。 我说这个不是小 bug 么,立刻启动了 Codex GPT 5.5 修复,修了两回,没搞定。然后切到 CC + GLM5.1,又修复了两回,一共四次,每次都跟我说搞定了,然并卵。 这要是工程师我早就发火了,然而,这是我让 AI 干的,跟 AI 发,就有点可笑了。 于是找到前端夏老师,夏老师看了一会说, AI 写太复杂了,短时间看不明白,但是我有这些思路供你参考……然后丢给我点解题思路(嫌弃脸),我只能和 和 Codex 重归于好,把解题思路丢给了它,你得再次修复啊兄嘚……终于搞定了,至于怎么搞定了……这叫 Vibe。 CatReader:https://cat.mowen.cn,你用了没?一个现代 RSS 阅读器,老池的私藏信息源公开,一网打尽海内外 AI 技术和产品信息源,除此之外还有商业、创业、摄影、图书、人文类内容。 今天还发生了另一件事,Anthropic 发了一篇博客,我看到公众号一堆媒体在写,其实就是最后一段,写了这么几句话: We believe it would be good for the world to have the option to slow or temporarily pause frontier AI development… If such systems existed, we expect that we would slow down or temporarily pause, if other developers at or near the frontier also did so in a verifiable manner. 意思是:我们认为,如果世界有选择去放缓或暂时停止前沿 AI 研发的可能,那将是一件好事……如果真的出现了这样的机制,并且其他处在或接近技术前沿的开发者也以一种可验证的方式同步放缓或暂时停下,我们预计自己也会相应放慢脚步,或者暂时暂停相关研发。 乍一看就很扯,你丫自己研究跑最前头,模型最厉害,赚了大量高净值用户和企业的钱,然后又融了那么多钱,没上市都快一亿刀了。现在要上市了,出来表个态,说大家都慢点吧,你们要是都慢点,我也慢点。纳尼? 问大师,大师说,Anthropic 可能是在研发的过程看到了什么了不得的事情,给提个醒,目前的现状是,Anthropic 80% 以上的合并代码由 Claude 生成,Mythos Preview 在"加速小型训练脚本"测试中达到约 52 倍加速,而 Claude Opus 4 约为 3 倍。 那么,就让我们一起 Vibe 吧