MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 3 / 14
写完 Mac 本地安装原生 OpenClaw 的教程之后,我看大家还挺感兴趣的。Mac 系统本身就是 Unix 和 FreeBSD 演化而,很适合当服务器用,养虾最合适。今天再补充说明几个问题: 1、当我们沉迷 OpenClaw 和其他 Agent 给你带来新奇体验的同时,一定不要忘记安全和防护。具体可以看这一篇:安全养龙虾 2、安装了原生的 OpenClaw 最好跟着系统版本升级。升级不光是功能增强增多,随着用户量扩大,这个系统会越来越规范和安全。升级方式也很简单:npm i -g openclaw@latest,然后重启 gateway 即可,目前最新版本是:v2026.3.11 3、OpenClaw 是很费 Token 的,海外模型这么烧确实贵,我推荐用国产大模型,选你自己喜欢的即可,相对国外的模型基本就是白菜价,尤其是一些 Coding Plan API,让我实现了 Token 自由。还有个提醒,如果你用 Gemini 的 API 给 OpenClaw 用,大概率会被 Google 封号,要小心。 4、我自己用 MiniMax M2.5,因为 Vibe Coding 的工作比较多,是年度会员。不过 MiniMax M2.5 不是原生多模态的模型,无法直接识别图片。昨天有用户问到这个事情,我详细说一下。 MiniMax 去年发布了一套 Coding Plan MCP,Claude Code 和 OpenClaw 都可以用这套工具进行精确搜索和图片识别。俩工具分别是:web_search 和 understand_image。使用链接在这里: https://platform.minimaxi.com/docs/guides/coding-plan-mcp-guide 我一直用这个能力,不过文档里只介绍了如何在 Claude Code 和 Cursor 里使用 Coding Plan MCP,OpenClaw 怎么用没说,其实和安装企业微信的 MCP 方式类似: - 安装 mcpporter:npm install -g mcporter,这个主要用来发现和管理 mcp 工具。OpenClaw 会用到。 - 安装uvx:curl -LsSf https://astral.sh/uv/install.sh | sh,MiniMax MCP 是本地 Python 工具,会用到 uvx 命令。 - 在这段 json 代码里设置好你的 API Key,丢给 OpenClaw 让它为你安装这个 mcp 服务: { "mcpServers": { "MiniMax": { "command": "uvx", "args": ["minimax-coding-plan-mcp", "-y"], "env": { "MINIMAX_API_KEY": "更换你的MINIMAX_API_KEY", "MINIMAX_API_HOST": "https://api.minimaxi.com" } } } } 安装好之后用把图片发给龙虾识别即可。
^__^ 3 / 08
GPT 5.4 是 OpenClaw(龙虾)的“天选模型”。上周有个重要的发布,就是 GPT 5.4。貌似 5.3 只发布了 Codex 版,5.4 就直接入驻 ChatGPT 了。5.4 的特点,我理解就三个: 1、个性化交流做得更好了,也就是 ChatGPT 不再冷冰冰的,更像人。能听懂弦外之音,能在长对话里保持稳定的气质。更重要的是,这种“像人”的感觉,没有削弱它的专业能力,像朋友一样聊天,像专家一样干活。奥特曼自己发帖说,虽然 GPT 5.4 在编码、知识、工作等方面很出色,但最让他惊奇的是,这是他最喜欢与之交谈的模型。OpenAI 在模型个性方面已经偏离航道一段时间了,现在终于回到了正确的方向。 2、办公能力增强,可以更好的处理类似 Excel 相关的数据,金融圈给了 GPT 5.4 务实的认可:在真实的电子表格里,它能把那些繁琐又精细的工作处理得非常妥当。我看 x 上有用户直接吹爆 GPT 5.4:在 Excel 和数据分析方面表现出色,无人能及,宣布 OpenAI 王者归来。这就有点过了,在我看来,谁发布新模型,谁王者归来。 3、GPT 5.4 操控电脑的能力增强了,是首个具备原生 computer-use 能力的主线模型,可以直接与软件和网页交互,完成真实任务;让 Agent 直接操作软件,进入“build-run-verify-fix”的闭环,更适合开发者构建能“跨网站、跨软件系统”执行任务的 Agent;关于第三点,我觉得与最近龙虾(OpenClaw)爆火不无关系,毕竟 OpenClaw 创始人已经收入 OpenAI 麾下,这里不做原生的改进是不可能的。所以,如果你有 OpenClaw 和 GPT 5.4 的 API Key,不妨试试这两个组合,据说因为 GPT-5.4 强大的原生操控能力,它已经被视为 OpenClaw 的“天选模型”。步骤如下:获取 API Key:访问 OpenAI 官网 获取 GPT-5.4 的 API Key。修改配置文件:在 openclaw.json 增加 models 和 providers 的相关信息调整上下文窗口:OpenClaw 运行 Skills 插件通常需要较大的上下文。建议将上下文窗口设置为 16K-24K Token 以上以保证多轮长链路任务的稳定性。后面我准备在 OpenClaw 里用 多 Agent 配置试试,看看能不能做到多 Agent 在我睡觉的时候继续干活。不过 GPT 的 token 还是太贵了,只要方向对,咱等国内大模型跟进就好了,Coding Plan 真是又便宜又好用。当工具既有个性,又能交付结果,还会操作电脑了,我们也许该认真想一想:在这样一个时代,自己最想保留、最不愿意外包给 AI 的能力,到底是什么。这个问题,比模型又强大了多少更重要。
^__^ 3 / 06
软件行业正处于巨变之中,绝非“常规时刻” 中午吃饭的时候和一群工程师墨友在一个 AI 交流群里聊天,大家介绍自己在用什么工具编程。有用 Claude Code 的,有用 Codex 和 AntiGravity 的,有用 TRAE 的,还有 Cursor 和 Windsurf 的。模型也是五花八门,Claude 的模型少了,因为总封号,国内用 MiniMax、Kimi 和 GLM 居多,海外首选 Codex GPT 5.3 和 Gemini 3 Pro 的。用法也不一样,有的还处在智能补全阶段,有的基本上转成 Coding Agent 模式了。还有用 OpenClaw 做运维的。有的墨友说:从现在的 Code Review 来看,除非吹毛求疵的看,否则代码已经不需要我做什么大的调整了。这让我想起了前几天在 x 上看到 AI 大神 Andrej Karpathy 的一条长文:软件行业正处于巨变之中,绝非“常规时刻”。他说: > 很难形容过去两个月 AI 对编程带来的巨变。这不是某种“循序渐进”的常规进步,这种质变具体发生在去年 12 月。在我看来,编程智能体(Coding Agents)在去年 12 月之前基本不可用,此后则变得真正可用了。现在的模型拥有更高的质量、长期的连贯性和韧性。它们能扛住大型且复杂的任务,这足以彻底颠覆默认的编程工作流……编程正变得面目全非。你不再像计算机诞生以来那样,在编辑器里敲代码。那个时代结束了……翻译好的全文我放墨问里了:软件行业正处于巨变之中,绝非“常规时刻” 这个时间点和我的感觉一模一样。智能补全这样的功能,我们团队从 2025 年初就开始用了。后端从 Vim 切换到了 Cursor 和 TRAE,前端一直在用 VS Code 的 AI 助手等等。不过 Coding Agent?我从下半年就开始尝试,一直不算得心应手,这个改变是从 2025 的年底开始的,尤其是国内一系列价格便宜 Token 量又足的模型持续发布,用户花一点费用就可以持续做各种各样的 Vibe Coding,代码质量提升,功能完成度提高,大家也可以反复迭代自己的产品。这一点从墨问用户的成果也可以看出来,持续有生产级别的产品上线,比如于波的墨问剪藏助手,吴优秀的音视频网站(月营收破万美金了),腾讯敬哥的数独休闲小游戏,还有不少移动 App 都上架了……我自己也做了几个小工具,目前正在打磨的是 Cat Reader,一款 Web 阅读器,希望能早日面世。这一切都发生在最近的几个月里,并且是工程师驱动的,也就是说,这些工具和模型,大都是员工自己掏钱订阅的,员工在自带干粮推动 AI 的普及……