Anthropic于周二正式发布Claude Sonnet 5,这款中端模型在多项基准测试中性能接近旗舰Opus 4.8,价格却低约60%。此举正值该公司推进IPO进程 ,旨在以高性价比策略扩大企业市场份额。

Sonnet 5在SWE-bench Pro智能体编程测试中得分63.2%,高于前代Sonnet 4.6的58.1%,逼近Opus 4.8的69.2% 。在GDPval-AA v2知识工作基准测试中 ,Sonnet 5以1618分超越Opus 4.8的1615分。发布初期API定价为每百万输入token 2美元、每百万输出token 10美元,截至8月31日;优惠期后将调整为3美元和15美元,仍远低于Opus 4.8的5美元和25美元。

早期合作伙伴反馈积极 。Cursor联合创始人表示 ,Sonnet 5能够“遵循计划 、遵守规范,并以高效成本完成多步骤变更”。Zapier高级工程师称,此前模型“往往进行到一半就卡住”的两部分自动化任务 ,Sonnet 5已能端到端完成。这种可靠性正是企业将AI从试点推向生产部署的关键 。

安全方面,Sonnet 5的幻觉和谄媚率低于前代,对恶意请求的拒绝能力更强。但在与Mozilla合作的Firefox漏洞评估中 ,其部分成功率为13.2%,高于Sonnet 4.6的8.8%,但远低于Opus 4.8的68.8%。Anthropic已默认启用实时网络安全防护 。
此次发布恰逢Anthropic冲刺IPO的关键时期。公司于6月1日秘密提交S-1文件,5月完成650亿美元H轮融资后估值达9650亿美元 ,年化营收已突破470亿美元。Sonnet 5承担双重使命:为开发者提供高性价比产品,同时向公开市场证明其推动大规模API收入的能力 。正如PitchBook分析师所言,2026年IPO窗口“要么成为自互联网时代以来最具影响力的IPO周期 ,要么成为公开市场上关于叙事与基本面关系最昂贵的一课 ”。