MacTalk
订阅
MacTalk 开通于2012年末,内容起于 Mac 而不止 Mac,内容覆盖了技术、创业、产品和人文思考。文风有趣,又有一点力量。
MacTalk微信公众号二维码
关注该公众号

会员可查看最新的全部文章

^__^ 5 / 15
抛弃 Markdown?让大模型试试 HTML技术人员一直很喜欢 Markdown,目前大模型默认吐出来的格式也是 md 的,本来 md 格式一下成香饽饽了,不过最近 AnthropicAI 的工程师 Thariq 专门写了篇文章,叫“使用 Claude Code :HTML 的惊人效果”。他说,Markdown 已经成为 AI 代理与我们沟通时使用的主流文件格式。它简单、可移植、具有一定的富文本能力,而且便于编辑。Claude 甚至已经非常擅长在 Markdown 文件中使用 ASCII 来制作图表。但随着代理变得越来越强大,我感觉 Markdown 已经成为一种限制性的格式。我发现很难阅读超过一百行的 Markdown 文件。我想要更丰富的可视化效果、颜色和图表,并且希望能够轻松分享。 AI 领域的大神 Andrej Karpathy 最近也分享了一个技巧,:向大模型提问时,在最后加一句“用 HTML 格式组织你的回答”,生成一个文件在浏览器打开,会有更丰富的显示效果。这里还有一个信号,AI 浏览器 Dia 目前在生成一些长内容的时候,会优先构建一个 HTML 文档,比如你让他翻译一篇文章,它会给你呈现一篇图文并茂的文章,而不是文本格式的 Markdown。这是咋回事呢?Markdown 不灵了?大模型初期我们习惯让 AI 回答一段文字,然后 Markdown 就成了默认格式,有标题、加粗、表格、代码块,阅读体验好了不少。但是随着内容越来越多,越来越丰富,HTML 显然是更好的展现方式,它可以有布局、图形、颜色、交互,甚至可以把一段回答变成网页、仪表盘、幻灯片或一个小工具。人类接收信息,视觉通道的效率很高。大脑有相当大一部分资源在处理视觉信息。文字是线性的,一行行读下去;视觉是并行的,结构、层级、关系、重点,可以在同一个画面里被看到。所以 Karpathy 的判断很有意思:音频可能是人类向 AI 输入信息的首选方式,视觉则可能是 AI 向人类输出信息的首选方式。对人来说,说话比打字自然。很多复杂问题,用键盘描述半天,说出来只要一分钟。对 AI 来说,把结果做成一段结构化文字,已经够用;把结果做成一个可视化页面、动态图表、交互演示,更接近人真正理解信息的方式。大模型最只是吐原始文本,然后是 Markdown,结构清楚了一些。再往后是 HTML,内容开始拥有版面、组件和交互。未来可能是交互式视频、模拟环境,甚至某种神经网络直接生成的动态世界。下次使用桌面 Agent 的时候,你这么用:看下最近两小时的墨问动态,用 HTML 生成文件展示。效果惊人。
^__^ 5 / 13
所以软件会消失吗?未来是不是只有 Agent 工具和 Skills 呢?App 还会存在吗?我不知道,但相当长的一段时间内,两者应该是并存的关系。并且,所有的软件都应该对 AI Agent 友好,也就是说,AI Friendly,说白了,就是得给 Agent 做软件。墨问也不例外,开始进入 Agent 的工作流了。最近俩月我们在做三四个项目,后续会陆续发布,第一个就是墨问官方 CLI 工具和官方 Skills 仓库。地址在这里:https://github.com/mowenxd/cli因为 CLI 依赖墨问的 API Key,目前已经开放给所有用户,包括会员和普通用户,只不过会员调用额度会更多一些。这件事可以从一个很小的场景说起。以前想看墨问社区的内容或自己的笔记,通常要打开小程序或 Web,看发现页,搜索关键词,或点进主页,一篇篇翻找。想看最近的内容动态,也得在产品里来回换界面。这个流程没什么问题,只是到了 Agent 时代,很多事情可以有新的做法。比如在 OpenClaw(龙虾)、Hermes Agent(爱马仕)、Codex、Trae SOLO、Claude Code、Cursor 这些工具里,直接说一句:“看看猫大人最近发表了哪些公开笔记”“查一下墨问二爷的笔记,产品和 AI 相关的,分分类”或者:“看看今天下午我的墨问动态。” Agent 就能通过 mocli 去调用墨问能力,把结果整理出来。人不用在几个界面之间来回跳,笔记也不再只是躺在产品里的内容,它们还可以进入 Agent 的工作流。 mocli 是墨问官方命令行工具。这次一起发布的,还有一组官方 Skills。CLI 负责提供底层能力,Skills 负责告诉 Agent:什么时候该用什么命令,结果怎么解析,怎么展示给用户。一次安装,所有 Agent 工具可用。目前它已经支持认证、笔记、用户、备注、动态和帮助几类能力。比如墨问动态就可以查看被关注、点赞、评论、收藏,以及关注用户的新笔记等内容。安装也很简单,两句话: npm install -g @mowenxd/cli npx skills add mowenxd/cli -y -g 之后可以手动配置: mocli auth init --apik 你也可以把 github 地址丢给 Agent,让它帮忙完成认证。 API Key 从墨问小程序里获取:右下角“我的”进入“开发者”,找到“我的 API Key”。这是私密凭证,需要自行保存。重新生成后,旧 Key 会即时失效。现在,墨问也成为 Agent 干活时能调用的知识资产了。未来我们还会增加创建笔记和相关素材的能力。对了,墨问用户于波做了一个非常好用的 Chrome 扩展,剪藏一切,好用,推荐,红色 Logo 的。