
Anthropicは2026年6月30日、ミッドティアモデル「Claude Sonnet 5」を公開した。同モデルは自律型AIエージェント向けの安価な選択肢として位置づけられる。コーディング、推論、ツール使用の各ベンチマークで前世代のSonnet 4.6に匹敵するか上回る性能を示し、OpenAIやGoogleの競合製品を下回る価格を実現した。
低価格で実現するエージェント性能
Sonnet 5はAnthropicのエージェント用コーディングベンチマークで63.2%を記録した。Sonnet 4.6の58.1%から向上し、Opus 4.8の69.2%に迫る。知識作業のベンチマークでは、高価なOpus 4.8をわずかに上回った。Opus 4.8は深層調査と微妙な判断に向けて設計されている。
Anthropicはブログで「Sonnet 5とOpus 4.8の間で、ユーザーはコストと性能のバランスを調整できる」と述べた。
同モデルは複雑な多段階タスクを停止せずに完了し、自身の出力を確認する。これらの能力は最近まで、より大型で高価なモデルを必要としていた。
価格
Anthropicは2026年8月31日まで、入力トークン100万件あたり2米ドル(約260円)、出力トークン100万件あたり10米ドル(約1,300円)の導入価格を提供する。その後は入力3米ドル(約390円)、出力15米ドル(約1,950円)に改定される。
プロモーション価格では、Sonnet 5はOpus 4.8、OpenAIのGPT-5.5、GoogleのGemini 3.1 Proを下回る。ただしGoogleの低価格モデルGemini 3.5 Flashよりは高価である。
安全性の向上
新モデルはSonnet 4.6よりも望ましくない動作の発生率が低い。悪意あるリクエストの拒否、プロンプトインジェクションへの耐性、幻覚と迎合の低減で改善が見られた。ただし、危険なサイバーセキュリティタスクでは、Opus 4.8やClaude Mythos Previewには及ばない。
AIアプリ構築プラットフォームLovableの共同創業者Fabian Hedin氏は「Lovableでは、何百万人もの開発者に強力なツールを提供している。拒否の判断ができるモデルは、構築能力と同じくらい重要だ」と述べた。
初期テスターの反応
ZapierのシニアエンジニアDaniel Shepard氏はSonnet 5を2段階の自動化でテストした。Salesforceのアカウント層の更新と、エンタープライズ顧客への発表通知の送信である。「最後まで完了した。以前は途中で止まっていた。日常的な自動化には最適だ」と同氏は述べた。
利用開始
Sonnet 5は6月30日に無料およびPro層のユーザーのデフォルトモデルとなり、全サブスクリプション層で利用可能である。
今回の発表は広範な市場変化を示す。エージェント機能は今や全価格帯で標準的な期待事項となった。競争の差別化要因は、人間の監視を必要としないコストと信頼性に移行している。
雅子 訳

