MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 5 / 01
看起来 Karpathy 给出了三条线索,说实话挺牛今天看了 Andrej Karpathy 的一篇文章,写的是他的一次炉边谈话的要点。我觉得他给出了三条线索,还挺有启发的。以下是我整理的中文版,分享给读者:我想强调的第一个线索是,LLM 的意义远不止加速已有事物(比如编程)。这是三个新领域的例子: 1、menugen(应该是 AK 之前做的一个 App):一个可以被 LLM 完全吞没的应用,不需要任何经典代码:输入一张图片,输出也是一张图片,LLM 可以原生完成这件事,根本不需要 App。 2、用 .md 技能代替 .sh 脚本:为什么还要写一个复杂的 Software 1.0 bash 脚本来安装某个软件?直接用文字描述安装过程,告诉你的 LLM "把这个给它看"就行了。LLM 是一个高级的英语解释器,可以智能地适配你的安装环境、即时调试一切等等。 3、LLM 知识库:这是一个用经典代码不可能实现的例子,因为它是针对非结构化数据(知识)——来自任意来源、任意格式,包括纯文本文章等——的计算。(之前 AK 基于 md + 图片 + wiki + llm 构建知识库的理论和实践)我之所以强调这些,是因为在每一次新的范式变革中显而易见的东西往往都是在加速或改进已有的事物,但实际上我们看到了上面这些例子,你会发现,有些东西根本不该存在了(1、2),有些在以前则根本不可能实现(3)。第二个(持续进行中的)线索是试图解释 LLM 能力"参差不齐"(jaggedness)的模式。为什么同一个产物可以一边连贯地重构一个 10 万行代码库,一边又让你走去洗车行洗车(被人类嘲笑的步行洗车问题)?我之前写过这源于领域的可验证性,这里我进一步补充说这还与经济因素有关,因为收入/TAM 决定了前沿实验室选择在 RL 阶段打包进训练数据分布中的内容。你要么在数据分布中(在 RL 电路的轨道上)飞速前进,要么在丛林里用砍刀开路。相对而言,还是那句话。我对目前这个解释还不完全满意,但这是一个持续的挑战——如果你想实际利用 LLM 的力量同时避开它们的陷阱,就需要建立一个对 LLM 能力的准确心智模型。这也引出了……最后一个线索是 Agent 原生经济。产品和服务如何分解为传感器、执行器和逻辑(分散在 1.0/2.0/3.0 计算范式中),我们如何让信息对 LLM 最大化地清晰可读,快速兴起的 Agent 工程及其技能组合,一些相关的招聘实践等等,甚至可能涉及完全由神经网络处理大部分计算、而由(经典)CPU 作为协处理器辅助的梦想/暗示。
^__^ 4 / 30
字节、阿里、智谱入选《时代》2026 最具影响力 10 家人工智能公司名单。昨天看到《时代》公布了“2026 年最具影响力 10 家人工智能公司”名单,入选者包括 OpenAI、Alphabet(Google)、Meta、Anthropic、亚马逊、Mistral、Hugging Face,以及中国的字节跳动、智谱和阿里巴巴。这个名单有意思的地方在于,把 AI 公司的影响力放在了第一位,比如技术路径、产业扩散、用户规模和社会影响等等。在这份名单里,模型能力只是入场券,真正起决定作用的是,这些公司的产品能不能进入开发者、企业和普通用户的日常工作和生活场景。这次中国三家字节、阿里算意料之中,智谱有一点点意外 阿里的千问 Qwen 走的是开源路线,《时代》里讲,Qwen 累计下载量突破了 10 亿次,并衍生出超过 20 万个模型。开源的价值不应该只是“免费”,Qwen 让技术进入更多人的工作流里。一个模型被下载、改造、部署、再训练,背后是生态的复利,这个阿里是非常看重的,未来能把开源影响力转化为云、算力、工具链和企业服务,阿里就不只是做模型,而是在构建 AI 基础设施了。字节的国际影响力可能是中国互联网企业里最大,他们是另一种打法,从某种程度上来说,和 OpenAI 类似,主推的模型和 C 端 AI 助手,都叫豆包,主打一个用户规模。《时代》提到,豆包周活已经超过了 1.55 亿,春节期间日活突破 1 亿。产品够快,分发够猛,场景够密,模型能力也在追上来。对 C 端来说,很多时候“足够好”比“最强”更重要。如果一个产品能让普通用户每天打开、提问、生成图片、改改文案,这些高频行为本身就是壁垒。智谱则是前沿模型公司走向资本市场和全球开发者的典范。《时代》评价 GLM-5 以开源许可发布,在部分基准测试中表现突出,并在编码和智能体任务上接近国际头部模型。我最近使用 GLM 5.1,确实很强,接近 Opus 4.6 的水准。智谱已经服务了来自 218 个国家和地区的 400 多万企业用户和开发者。这说明中国大模型公司并不只是在本土竞争,也开始进入全球技术市场。腾讯的缺席有一点点刺眼。腾讯有流量、场景、云、微信生态,也有足够多的工程能力,但在大模型这轮竞争里,外界感知始终不够强。也许今年腾讯应该重点 bet Coding Agent 能力了,最近的 Workbuddy 反向还是不错的。对一家拥有超级入口的公司来说,我还是很期待腾讯(微信)AI 的。 Agent 的进展太快了,半年之后,应该又是一番光景。明天开启五一长假,终于可以好好在家 Vibe Coding 了