
Anthropic于2026年6月30日发布Claude Sonnet 5,将其中端模型定位为自主AI代理的性价比之选。该模型在编程、推理和工具使用等多方面基准测试中达到或超越前代Sonnet 4.6,同时价格低于OpenAI和Google的竞品。
代理性能,折扣价格
Sonnet 5在Anthropic的代理编程基准测试中得分63.2%,高于Sonnet 4.6的58.1%,逼近Opus 4.8的69.2%。在知识工作基准测试中,该模型略优于价格更高的Opus 4.8,后者专为深度研究和精细判断而设计。
Anthropic在博客中表示:”用户可以在Sonnet 5和Opus 4.8之间调整投入程度,找到成本和性能的最佳平衡点。”
该模型擅长完成复杂的多步骤任务而不会中断,并能在无提示的情况下自行检查输出结果。这些能力直到近期还需要更大、更昂贵的模型才能实现。
定价
Anthropic推出促销价:每百万输入代币2美元(约合人民币14元),每百万输出代币10美元(约合人民币72元),有效期至2026年8月31日。此后,价格将调整为每百万输入代币3美元(约合人民币22元),每百万输出代币15美元(约合人民币108元)。
在促销价下,Sonnet 5低于Opus 4.8、OpenAI的GPT-5.5和Google的Gemini 3.1 Pro,但仍高于Google的低价产品Gemini 3.5 Flash。
安全改进
新模型的不良行为发生率低于Sonnet 4.6,更善于拒绝恶意请求,对提示注入劫持的抵抗力更强,幻觉和谄媚现象减少。然而,其安全得分仍不及顶级Opus 4.8或Claude Mythos Preview,尤其是在危险的网络安全任务方面。
“在Lovable,我们正在将强大的工具交到数百万创作者手中,”AI应用构建平台Lovable的联合创始人Fabian Hedin表示。”知道何时说不的模型,与知道如何构建的模型同样重要。”
早期测试者反馈
Zapier高级工程师Daniel Shepard用两步骤自动化测试了Sonnet 5:更新Salesforce账户层级并向企业客户发送发布通知。”它从头到尾完成了任务。以前会在中途卡住。对于日常自动化来说,这是无需犹豫的选择,”他说。
可用性
Sonnet 5于6月30日成为免费和Pro层级用户的默认模型,并在所有订阅层级中均可使用。
此次发布凸显了更广泛的市场转变:代理能力已成为各个价格层级的基本预期。竞争差异点已转向成本以及在无需人工监督下的可靠性。
婷 翻译

