备受期待的 Sonnet 系列新模型终于问世。Anthropic 正式推出了其中端产品线中的最新力作 —— Claude Sonnet 5。作为 Sonnet 4.6 的直接继任者,这款新模型打破了以往 4.x 的命名惯例,直接跃升至“5”代,在命名体系上更接近其旗舰级的大哥 Opus 4.8。
由于目前尚缺乏充足的第三方真实场景基准测试数据,我们暂时只能以 Anthropic 官方发布的信息作为参考。官方表示,Sonnet 5 在大幅缩小与旗舰模型 Opus 4.8 性能差距的同时,依然保持了显著的成本优势。相较于前代 Sonnet 4.6,新模型在逻辑推理、智能体(Agentic)任务、工具调用、编程以及通用知识工作等方面均实现了全面升级。
不过,Anthropic 的官方基准测试也显示,作为新一代模型,Sonnet 5 并未在所有领域全面超越旗舰级的 Opus 4.8。在智能体编程测试中,Sonnet 5 的得分从 Sonnet 4.6 的 58.1% 提升至 63.2%,但依然略低于 Opus 4.8 的 69.2%。唯一的例外出现在知识工作基准测试中,Sonnet 5 在该项指标上实现了对 Opus 4.8 的微弱反超。
总体而言,对于大多数高级任务(尤其是复杂的编程需求),Opus 4.8 依然是目前面向公众开放的最强选择。
在安全性与稳定性方面,Anthropic 强调,Sonnet 5 展现出比前代更低的“不良行为”发生率,在智能体应用场景中更加安全可靠。这意味着该模型不仅能有效减少“幻觉”现象,还能在智能体工作流中输出更加稳定、一致的结果。
目前,Claude Sonnet 5 已面向所有订阅计划全面上线。它现已成为免费版(Free)和专业版(Pro)用户的默认模型,同时也向 Max、Team 和 Enterprise 订阅用户开放。此外,开发者也可以通过 Claude Code 和 Claude API 调用该模型。
在定价方面,Sonnet 5 甚至比前代 Sonnet 4.6 更加亲民。新模型的输入价格为每百万 Token 2 美元,输出价格为每百万 Token 10 美元。不过需要注意的是,这一优惠价格将持续至 8 月 31 日;在此之后,价格将上调至输入 3 美元、输出 15 美元。