A 厂封账号丧心病狂,DeepSeek V4 正式版 7 月发布,GPT 5.6 Sol 强得可怕。 Anthropic 现在封 Claude 账号可谓丧心病狂,最近收到大量用户(墨问和 x 上)的反馈,刚刚注册的新账号,访问两次就被封了;老账号无付费记录,封;付费账号,封。封你没商量。我前几天看到消息说 Fable 5 要回归,心里想是不是再给 Claude 一个机会呢(或者再给我一个机会呢 )。就用一个免费无订阅几乎没有访问记录的 Claude 账号登录了 iOS Claude 看了看模型列表。第二天收到邮件,嗷嚎~~ An internal investigation of suspicious signals associated with your account indicates you may be in violation of our Supported Countries Policy. As a result, we have revoked your access to Claude.(访问权限已撤销的意思) A 厂 CEO 一直不待见开源,他认为越强的模型,需要越高等级的部署和安全控制;包括对模型权重访问的限制、监控和多方授权。开源模型无法做到这一点,就很危险,代码开源后可以 patch,模型权重一旦扩散,很难收回,开放权重会带来不可逆风险。但是,如此一来,“安全”就会变成少数大公司闭源垄断的正当性,如果最强模型只能由少数公司控制,谁来监督这些公司?你说给谁用就给谁用?你咋那么牛呢?昨天还收到了 DeepSeek 的邮件,DeepSeek V4 正式版计划于 7 月中旬正式上线。本次版本更新将带来更多功能优化和性能提升。很多人说,纳尼,V4 不是 4 月份就发了么。其实那个是个预览版,正式版也许会有更多惊喜,如果能超过 GLM 5.2 那就太开心。先期待一把。另外,我现在还期待 OpenAI 尽快普及他们的新模型:GPT-5.6。今天读完了他们的产品报告,三个系列模型,Sol,旗舰模型;Terra,面向日常工作的均衡模型;以及 Luna,一个快速且价格亲民的模型,类似其他模型的 Flash 版本。Terra 的性能可与 GPT-5.5 竞争,同时价格降低一半;Luna 则以最低的成本带来强劲能力。作为 Agent 用户,我自然最关心 Sol 的能力,OpenAI 引入了一种新的 max reasoning effort,让 Sol 拥有最充分的时间进行深度推理。此外还有个 Ultra Mode,通过利用子代理来加速复杂工作,从而超越单个代理的能力。 GPT-5.6 Sol 在 Terminal-Bench 2.1 上的得分超过了 Mythos 5 和 Fable 5。Sol 的得分是 88.8%,Mythos 5 是 84.3%,Fable 5 是 83.4%。Sol 的 Ultra 更是高达91.9%。目前,arena.ai 上的数据还没出来,可以期待一下。比 A 厂靠谱。