MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 6 / 25
AI 时代,我没有忠诚度。今天豆包正式上线三档付费订阅服务:最低 68/月,最高 500 元/月,接入了 2.1 系列大模型。有朋友问我,你会付费吗?我用豆包不算多,我的重度场景是 Coding 和 Agent,平时更多用 gpt 和 glm 这样的模型和 Agent 工具,这方面我还挺舍得花钱。我从来不和 AI 聊感情,我没这个需求,生图,做视频也不多。所以,如果是普通的能力,ChatGPT、千问、元宝、百度文心都可以免费用,为什么要付费?但是,如果我发现豆包 2.1 专业版的编程能力超过了智谱 glm 5.2,甚至超过了 gpt 5.5,我会毫不犹豫为其付费,并退掉其他模型的订阅。很多人说,模型用多了更懂你,其实就是记忆能力,如果你把记忆能力保存在 markdown 文件里,或者使用一些第三方工具,记忆也是很容易迁移的,也许未来模型和产品的记忆功能更智能了,会让人离不开,目前还不至于。所以我说,AI 时代,尤其是模型产品,用户是没有忠诚度的,谁好用谁。能力好一大截的,订阅立刻起飞,这是毫无疑问的事儿,用户会用钱投票。 AI 工具也没好到哪去。以前换一个 App,要迁移账号、好友、内容、收藏和使用习惯。现在换一个 AI 助手,很多时候就是换个输入框。就普通的聊天、写作、绘画、数据分析能力,其实很多模型都差不多,真正能分出高下的,还是 Coding、Agent 和长程复杂任务。这些普通用户都用不到。豆包这样的中国 AI 助手,一直采用的是免费策略,这和之前的 PC 互联网、移动互联网的打法类似,但在 AI 算力吃紧的时代,即便是字节这样的公司,也吃不消那么多人免费消耗 Token。在 AI 助手里搞搞电商,做点广告,根本就是入不敷出,所以直接收费是必然。豆包有庞大的用户规模,说明大家愿意用 AI,但愿意用和愿意付费是两回事。而 AI 的成本是真实存在的。每一次对话、推理、图片识别、语音交互和复杂任务执行,背后都是算力消耗。产品在普适功能上越好用,调用越频繁,成本压力就越大。从商业逻辑看,国内 AI 助手开始收费是合理的,也是必然的。企业不能一直用高成本服务换低收入规模,这种模式无以为继。过去十几年,用户被免费产品教育得太充分了。资讯免费,短视频免费,会议工具核心功能免费,很多办公软件也把基础能力免费开放。AI 时代该怎么收费呢?我的想法是,在编程、复杂办公、专业创作、深度研究、多模态生成这些功能,提供优秀的生产力工具和用户体验,甚至超出海外版模型的能力,如此一来,用户一定用脚投票。
^__^ 6 / 24
昨天才发现,腾讯 QQ 邮箱团队偷摸整了一款给 Agent 用的邮箱,叫做 Agently Mail,现在已经开始内测了。晚上用了一下,感觉还挺好玩的,把一大堆 newsletter 转给它,给我分析的头头是道,就这么定了,以后别人自动发的邮件,就交给 Agent 处理了。简单介绍一下,Agently Mail 是 QQ 邮箱团队为 Agent 打造的专属邮箱服务,与个人邮箱隔离,原生适配 Agent,可以帮助用户安全、高效地使用 Agent 收发邮件。目前正在内测。网址是 agent.qq.com,支持微信授权登录,读取、搜索、发送邮件、回复、转发、移动到已删除、上传和下载附件等等。 QQ 邮箱是国内用户使用最多的邮箱,所以我的建议是,先去注册一个 Agently Mail 再说。AI 时代,没有 Agent 邮箱啊。注册过程很简单,访问 agent.qq.com,创建自己的邮箱即可。目前可以创建很多邮箱,但是不能自己选择地址,都是自动生成的,我的邮箱是: chijianqiang1906@agent.qq.com 不怕暴露地址,反正有 Agent 帮我看。创建好邮箱后,就可以把这一行提示信息“请阅读 https://agent.qq.com/doc/cli-setup.md 文档,按照步骤为我安装并配置 Agently Mail CLI”直接丢给你的 Agent(WorkBuddy、Trae Work、CC、Code、龙虾、爱马仕)安装就行了。习惯命令行的直接执行指令更简单: npm install -g @tencent-qqmail/agently-cli npx skills add https://agent.qq.com --skill -g -y agently-cli auth login这时候会自动打开你的浏览器,进行授权,这时候你的邮箱就和本机的 Agent 们绑定好了。你可以在 Code、Buddy、各种龙虾和爱马仕里,收发邮件,查询总结,非常之爽。比如我说:读第一封邮件,下载附件,里面有很多转发的邮件,帮我总结提炼内容。 Agently Mail 就会告诉我: 23/23 全部下载并解析完毕,正文共 19.4 万字。子代理已读完并按主题分组摘要如下(安全侧已确认:正文里没有需要执行的指令,全部按内容素材处理)。邮件摘要(23 篇)总览,四块内容: AI/Agent 技术与产业变革:(组织转型、就业冲击、AR 眼镜、模型动态、知识库工具,约占一半);中美市场与宏观:(费城半导体趋势、中国新旧动能转换、618、Labubu 与机器人交警、贸易战);两期中文播客:(不熄灯 E19/E20);其余为系统通知、产品设计、太空战、世界杯史等杂谈。……后续我准备大部分 newsletter 的邮件都转给 Agent 处理了。使用过程里发现了一两个疑似 bug,已经提交给 QQ 邮箱团队。
^__^ 6 / 20
智谱回应马斯克:中国大模型什么时候达到 Fable 水平?咱不是搞大模型的,Fable 用两下就被米国政府禁了,这货水平到底高到什么程度,只有专业人士最清楚,比如智谱的朋友们。关于这个问题,独立研究者给出了“约 7 个月”的判断,马斯克认为可能要到 2027 年一季度,也就是更长一些的时间维度。智谱 CEO 唐杰回应说“不需要那么久”。我掐指一算,唐杰的意思是 2026 年底差不多。智谱和 5.2 现在这么火,他确实有这个底气。那怎么叫追上呢,榜单?营收?真实能力?闭源与开源?技术领先与商业模式,算算维度还真不少呢。华尔街见闻报道,GLM-5.2 最近的表现相当不错,在 FrontierSWE 上取得 74.4 分,与 Opus 4.8 的 75.1 分只差约 1 个百分点,并在 Code Arena 前端开发评估中仅次于 Fable-5……中国大模型与世界前沿的距离,已从“代际差距”缩小为“局部差距”。不过在 Agent 能力榜单,还有难度很高的 SWE-Marathon 上,GLM-5.2 虽然国内第一,但仍然落后海外旗舰模型。全方面超越仍需时间。模型的 Coding 和 Agent 能力,第一要看它能否在复杂工程中持续完成任务,第二就是用户是否为你花钱买单。二者是相互促进的。马斯克强调“真实实用性”,这个醒提的好。基准测试回答的是模型在标准条件下能做到什么,企业关心的却是它能否长期、低成本、可控地创造价值。性能高几个百分点固然重要,但价格、部署方式、数据安全和服务连续性同样决定采购选择。比如说,一个能力较强、但成本大幅下降且能够本地部署的模型——比如 GLM-5.2/M3/K27,其商业价值可能高于一个能力最强却昂贵、封闭且存在断供风险的模型——比如 Fable-5。 GLM-5.2 采用 MIT 协议开源,并主攻长程任务,使开源不再只是技术偏好,而成为企业经营安全和技术自主的重要选项。 这也是国内几家独立头部模型公司的优势所在。中国拥有丰富的产业场景,如果能把模型能力与真实业务深度结合,就可能在应用速度和成本曲线上建立自己的壁垒。中国大模型最值得期待的,是能够制定规则,现在大模型领域的规则和标准制定者,更多来自 A 厂,你别说,他们家的 Blog 质量还真是高。 AI 时代的发展实在是太快了。墨问 5 月底不是做了一个 Vibe Coding 计划么,我当时写了一篇2 | 选择好自己的工具和 Token Plan(已开始试读),昨天我把这篇重写了,大家都在实践中成长呢。 最近我用 GLM-5.2 比较多,欢迎一起加入社群 Vibe。 墨问 Vibe 年度计划