MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 5 / 06
推荐一款免费屏幕录制软件 Recordly,特别好用 Coding Agent 技术让我们可以快速构建自己想要的软件产品,但是,如果你想让你的产品被更多人使用,甚至为你获取收入,这依然是一件高难度的事情。你需要识别需求,能够驱动 AI 做事,懂得一点商业知识,还需要把你的产品推广出去。怎么推广呢,做个演示视频是绕不过去的一环。做 Coding Agent 演示、产品使用视频和教程的时候,最常见的做法就是录频,然后录音,音视频合在一起形成一个完整的演示 demo。不过呢,原始屏幕录制是很业余的,光标抖动,点击的时候没有强调,背景杂乱,缩放产品局部需要在后期添加,等等。以前我们会使用类似 剪映、Screen Studio 这样的付费产品,挺好,就是得交钱呗。最近我发现了一个新产品叫做:Recordly。这是一款免费开源的屏幕录制和编辑工具,可以制作精美的 demo、用户引导和产品展示视频。这款产品发布在 Github 之后, 8 周内获得 1.3 万左右的 star,它采用的是 AGPL-3.0 协议,用户在使用上没有任何限制,约束是:如果你修改源代码后再次发布,也需要开源。 Mac、Windows 和 Linux 都能用。 Recordly 有这些功能:自动追踪光标活动进行缩放,无需手动标记缩放区域平滑光标移动,添加点击弹跳、动态模糊和晃动效果将录制内容放入带墙纸、渐变、留白、模糊和阴影的精美框架中摄像头气泡叠加,支持自定义位置、镜像、圆角和缩放自适应缩放拖拽式时间线,支持裁剪、变速区域、注释、音频区域和裁剪编辑 MP4 和 GIF 导出,支持画质预设、帧率控制和宽高比选项 macOS 原生录制(ScreenCaptureKit)和 Windows 原生录制(Windows Graphics Capture + WASAPI)项目保存为 .recordly 文件,可随时重新打开和编辑扩展市场,提供光标点击音效、设备框架、浏览器模拟、墙纸等可自定义键盘快捷键和内置快捷键参考免费。永久。无限录制。无限导出。无水印。我看了贡献者,这款产品应该 Coding Agent 也有贡献。这个项目是 2026 年 3 月 12 日创建的,README 支持英语和简体中文,非常友好。下载一份 Recordly 到你的机器,在本机运行,在本机录制、编辑和导出,然后,你就有一份精美的产品推广素材啦。地址:https://github.com/webadderallorg/Recordly
^__^ 5 / 01
看起来 Karpathy 给出了三条线索,说实话挺牛今天看了 Andrej Karpathy 的一篇文章,写的是他的一次炉边谈话的要点。我觉得他给出了三条线索,还挺有启发的。以下是我整理的中文版,分享给读者:我想强调的第一个线索是,LLM 的意义远不止加速已有事物(比如编程)。这是三个新领域的例子: 1、menugen(应该是 AK 之前做的一个 App):一个可以被 LLM 完全吞没的应用,不需要任何经典代码:输入一张图片,输出也是一张图片,LLM 可以原生完成这件事,根本不需要 App。 2、用 .md 技能代替 .sh 脚本:为什么还要写一个复杂的 Software 1.0 bash 脚本来安装某个软件?直接用文字描述安装过程,告诉你的 LLM "把这个给它看"就行了。LLM 是一个高级的英语解释器,可以智能地适配你的安装环境、即时调试一切等等。 3、LLM 知识库:这是一个用经典代码不可能实现的例子,因为它是针对非结构化数据(知识)——来自任意来源、任意格式,包括纯文本文章等——的计算。(之前 AK 基于 md + 图片 + wiki + llm 构建知识库的理论和实践)我之所以强调这些,是因为在每一次新的范式变革中显而易见的东西往往都是在加速或改进已有的事物,但实际上我们看到了上面这些例子,你会发现,有些东西根本不该存在了(1、2),有些在以前则根本不可能实现(3)。第二个(持续进行中的)线索是试图解释 LLM 能力"参差不齐"(jaggedness)的模式。为什么同一个产物可以一边连贯地重构一个 10 万行代码库,一边又让你走去洗车行洗车(被人类嘲笑的步行洗车问题)?我之前写过这源于领域的可验证性,这里我进一步补充说这还与经济因素有关,因为收入/TAM 决定了前沿实验室选择在 RL 阶段打包进训练数据分布中的内容。你要么在数据分布中(在 RL 电路的轨道上)飞速前进,要么在丛林里用砍刀开路。相对而言,还是那句话。我对目前这个解释还不完全满意,但这是一个持续的挑战——如果你想实际利用 LLM 的力量同时避开它们的陷阱,就需要建立一个对 LLM 能力的准确心智模型。这也引出了……最后一个线索是 Agent 原生经济。产品和服务如何分解为传感器、执行器和逻辑(分散在 1.0/2.0/3.0 计算范式中),我们如何让信息对 LLM 最大化地清晰可读,快速兴起的 Agent 工程及其技能组合,一些相关的招聘实践等等,甚至可能涉及完全由神经网络处理大部分计算、而由(经典)CPU 作为协处理器辅助的梦想/暗示。
^__^ 4 / 30
字节、阿里、智谱入选《时代》2026 最具影响力 10 家人工智能公司名单。昨天看到《时代》公布了“2026 年最具影响力 10 家人工智能公司”名单,入选者包括 OpenAI、Alphabet(Google)、Meta、Anthropic、亚马逊、Mistral、Hugging Face,以及中国的字节跳动、智谱和阿里巴巴。这个名单有意思的地方在于,把 AI 公司的影响力放在了第一位,比如技术路径、产业扩散、用户规模和社会影响等等。在这份名单里,模型能力只是入场券,真正起决定作用的是,这些公司的产品能不能进入开发者、企业和普通用户的日常工作和生活场景。这次中国三家字节、阿里算意料之中,智谱有一点点意外 阿里的千问 Qwen 走的是开源路线,《时代》里讲,Qwen 累计下载量突破了 10 亿次,并衍生出超过 20 万个模型。开源的价值不应该只是“免费”,Qwen 让技术进入更多人的工作流里。一个模型被下载、改造、部署、再训练,背后是生态的复利,这个阿里是非常看重的,未来能把开源影响力转化为云、算力、工具链和企业服务,阿里就不只是做模型,而是在构建 AI 基础设施了。字节的国际影响力可能是中国互联网企业里最大,他们是另一种打法,从某种程度上来说,和 OpenAI 类似,主推的模型和 C 端 AI 助手,都叫豆包,主打一个用户规模。《时代》提到,豆包周活已经超过了 1.55 亿,春节期间日活突破 1 亿。产品够快,分发够猛,场景够密,模型能力也在追上来。对 C 端来说,很多时候“足够好”比“最强”更重要。如果一个产品能让普通用户每天打开、提问、生成图片、改改文案,这些高频行为本身就是壁垒。智谱则是前沿模型公司走向资本市场和全球开发者的典范。《时代》评价 GLM-5 以开源许可发布,在部分基准测试中表现突出,并在编码和智能体任务上接近国际头部模型。我最近使用 GLM 5.1,确实很强,接近 Opus 4.6 的水准。智谱已经服务了来自 218 个国家和地区的 400 多万企业用户和开发者。这说明中国大模型公司并不只是在本土竞争,也开始进入全球技术市场。腾讯的缺席有一点点刺眼。腾讯有流量、场景、云、微信生态,也有足够多的工程能力,但在大模型这轮竞争里,外界感知始终不够强。也许今年腾讯应该重点 bet Coding Agent 能力了,最近的 Workbuddy 反向还是不错的。对一家拥有超级入口的公司来说,我还是很期待腾讯(微信)AI 的。 Agent 的进展太快了,半年之后,应该又是一番光景。明天开启五一长假,终于可以好好在家 Vibe Coding 了