A 厂封账号丧心病狂，DeepSeek V4 正式版 7 月发布，GPT 5.6 Sol 强得可怕。 Anthropic 现在封 Claude 账号可谓丧心病狂，最近收到大量用户（墨问和 x 上）的反馈，刚刚注册的新账号，访问两次就被封了；老账号无付费记录，封；付费账号，封。封你没商量。我前几天看到消息说 Fable 5 要回归，心里想是不是再给 Claude 一个机会呢（或者再给我一个机会呢）。就用一个免费无订阅几乎没有访问记录的 Claude 账号登录了 iOS Claude 看了看模型列表。第二天收到邮件，嗷嚎～～ An internal investigation of suspicious signals associated with your account indicates you may be in violation of our Supported Countries Policy. As a result, we have revoked your access to Claude.（访问权限已撤销的意思） A 厂 CEO 一直不待见开源，他认为越强的模型，需要越高等级的部署和安全控制；包括对模型权重访问的限制、监控和多方授权。开源模型无法做到这一点，就很危险，代码开源后可以 patch，模型权重一旦扩散，很难收回，开放权重会带来不可逆风险。但是，如此一来，“安全”就会变成少数大公司闭源垄断的正当性，如果最强模型只能由少数公司控制，谁来监督这些公司？你说给谁用就给谁用？你咋那么牛呢？昨天还收到了 DeepSeek 的邮件，DeepSeek V4 正式版计划于 7 月中旬正式上线。本次版本更新将带来更多功能优化和性能提升。很多人说，纳尼，V4 不是 4 月份就发了么。其实那个是个预览版，正式版也许会有更多惊喜，如果能超过 GLM 5.2 那就太开心。先期待一把。另外，我现在还期待 OpenAI 尽快普及他们的新模型：GPT-5.6。今天读完了他们的产品报告，三个系列模型，Sol，旗舰模型；Terra，面向日常工作的均衡模型；以及 Luna，一个快速且价格亲民的模型，类似其他模型的 Flash 版本。Terra 的性能可与 GPT-5.5 竞争，同时价格降低一半；Luna 则以最低的成本带来强劲能力。作为 Agent 用户，我自然最关心 Sol 的能力，OpenAI 引入了一种新的 max reasoning effort，让 Sol 拥有最充分的时间进行深度推理。此外还有个 Ultra Mode，通过利用子代理来加速复杂工作，从而超越单个代理的能力。 GPT-5.6 Sol 在 Terminal-Bench 2.1 上的得分超过了 Mythos 5 和 Fable 5。Sol 的得分是 88.8%，Mythos 5 是 84.3%，Fable 5 是 83.4%。Sol 的 Ultra 更是高达91.9%。目前，arena.ai 上的数据还没出来，可以期待一下。比 A 厂靠谱。 - MacTalk