阿朱说
订阅
阿朱对产业的洞察与感悟
阿朱说微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 3 / 24
昨天我写了一篇《openclaw应该做什么》,人们说我胡说八道。(1)我个人感觉Harness架构,会成为大模型的一部分,而不会独立。最近OpenAI、Arthropic的探索都在这个方向。(2)一开始兵分两路:一条以Arthropic Claude Code为代表,CC+Skill,走的是代码+Skill LLM约束引导路线,需要代码搞事。一条以Openclaw为代表,走的是CLI+Skill LLM约束引导路线,纯提示工程就搞定事。我个人感觉纯提示工程难以约束住LLM这头脱缰的野马,需要代码这种规则语言来做硬约束。但是代码这事,普通用户即使在大模型和小龙虾的辅助下也搞不定啊。(3)所以我感觉这两路人马下一步会往中间凑: OpenAI、Arthropic,他们会快速增强Harness架构。而OpenClaw会想方设法,把运行过程中AI生成的成熟的代码如何简易化地固化下来,成为Skill的一部分。(4)我蛮关注openclaw自身进化,看看它是不是能作为AI原生应用,能自举进化:有PR(需求和BUG反馈),然后openclaw自己生成代码-自己生成测试代码-自己自动化测试-自己合并代码。只有这样,才能真正称得上AI原生应用。(5)我们团队上周开会,决议:先个人探索使用小龙虾。在今年下半年:7月份,团队共同协作使用小龙虾。目的就是:让产品和研发基于同一个工具、同一个视角、同一个范式、同一个流水线进行协作工作。这就是AI原生组织的协作方式:基于共同的源,大家一起添砖加瓦编辑,让AI快速生成原型验证。这就如同我们团队(需求-产品-研发)现在共同编辑一份PRD文档一样。这就是:共创-共进化-共认知。这不同于过去做产品工程:需求分析师用逻辑体系写客户视角的点滴需求,然后产品经理接着需求分析文档写精细的产品详细设计说明书,最后程序员把中文文档映射为英文编程语言代码。
^__^ 3 / 23
现在openclaw几乎一天一个版本,但我感觉它有点迷失,大家都想把对所有事情的期望都放它身上实现。这不对。(1) AI生成代码,是大模型的事,不是openclaw的事。现在大模型为了不让小事绊倒自己,也外挂了一堆:1、计算:无须死乞白赖让语言大模型这个文科生做算术,直接外调计算器就好,不用杀鸡用牛刀。2、老信息:百科知识直接取出来,而不是去费劲生成。3、新信息:联网搜索/爬取/清晰。所以这些也不是openclaw要搞的事。(2)记忆。现在大模型没有记忆能力,大模型也没有知识持续更新能力,所以大家外挂了一堆记忆系统。但是我个人感觉:记忆应该属于大模型层要搞的事,而不是Agent这个数字代理人该搞的事。当然,现在大模型这个能力没突破,Agent层来搞,算是过渡期。(3)本地控制能力。看似本地控制好像无所不包,实际上也就四类:1、控制浏览器:所以现在浏览器也在改造自己,让浏览器对AI友好。现在Web网站也在改造自己,让网站对AI友好。2、控制本地文件系统:对本地文件可以增删改查。但这就太可怕了。所以Kimi Claw采用的工作空间目录这个方式蛮好,只对这一个目录搞事。3、控制本地软件:主要是通过CLI方式、在提示词中直接对本地软件进行调用,而不用通过AI Coding、导入头文件调用API。所以现在很多本地软件也在纷纷把API改造成CLI。4、控制本地软件:主要通过GUI RPA控制。但是我个人感觉这类诉求不会在openclaw中得到增强,而是会成为一个独立的品类让openclaw来集成。(4)说来说去,上面几种,都不应该是openclaw主力进化的。那openclaw应该把功能重心放在哪里?我个人感觉:还是Skill。 Skill这个东西,本质就是精确引导大模型。从2021年的基于专家的人工反馈强化学习去,到2022年的指令跟随,到2023年的提示工程,到2024年的思维链深度思考,到2025年的Agent工作流,到2026年的Skill,都进化了很多年了。但是skill主要是由全球高人写成、他们愿意免费分享出来,放到skill clawhub平台上。openclaw作为平台又不需要写skill,只需要能很好找到-安装-正确地安全地运行skill即可,这就有点类似苹果应用商店了。(5)有人特关注openclaw能对接多少IM。openclaw连接IM,用意是让你随时随地可以过程确认以及收到结果。对接多少IM,只要这个IM愿意开放就很好对接,重心是放在IM身上,而不是openclaw千万百计绕来绕去对接。微信在周六做openclaw插件就是这个意思。
^__^ 3 / 16
大模型用不好,往往写的提示词不准确,这就如同你搜百度的时候如果关键词和你心中的期望有偏差的话,你也得不到想要的答案。我有几个心得:1、要明确角色:如我是一名资深的A股量化交易分析师,我的风格是:真实数据证据、严谨逻辑、简洁回答 2、要明确意图与目标:你这个Skill到底想干什么。一个Skill只能有一个明确意图。 3、要有详细每一步步骤任务描述:任务描述:最好按照计算机程序逻辑:输入什么-处理逻辑-输出结果是什么信息。这挺像用中文写程序。这叫渐进式披露,便于Agent生成解决方案和分解任务。如果任务步骤太多,建议每经历一个阶段,你就明确指明要求它做个阶段性总结。这样大模型就不会走的太远而忘了为什么意图而走。否则会越走越偏。描述每个步骤任务时,要尽量多写严格约束。比如需要最新、最全、最准确的数据,不能编造与幻觉。甚至我还经常性故意反问:我严重怀疑你的数据有编造,请你把所有会话的信息再检查修正一次。这个也很像谷歌的二次Query技巧,避免了Transformer Next Token这个原理的问题。 4、最好举一个真实的例子:这样方便大模型更充分理解你的意图和步骤。我越来越感觉:写Skill、写提示工程,和产品经理写PRD详细设计说明书非常像。 5、明确度量:你怎么度量结果的好坏质量,要有kpi指标项设计与指标值设定。 6、数据源要明示出来:每个excel的字段说明每个接口的输入输出字段说明 7、输出数据格式要明确:如JSON、Markdown 8、大模型的温度:尽量设低一些,如0.1,防止出现太多幻觉、防止每次出现的结果不稳定。 9、借助工具:往往一个好的提示工程需要几百行,这让大部分写都不愿意这么细节底抠(这下大家理解了产品经理写详细设计说明书时的耐力了吧)。幸好现在有很多工具:Arthropic Skill最新规范、Skill-Creator工具,ClawHub平台上全球高人写好的最佳实践Skill、火山引擎的PromptCopilot优化工具。