Claude Sonnet 5、Opus級のエージェント作業を半額以下に 規制時代の設計も見える
AnthropicがClaude Sonnet 5を公開しました。数ヶ月前なら上位モデルが必要だった自律作業を、中位モデルの価格帯に持ち込むリリースです。
3行で捉える
- 何が起きた: 6月30日、Claude Sonnet 5が全プランで即日提供開始。エージェント性能はOpus 4.8に迫り、価格は8月末まで$2/$10(以降$3/$15)とOpus($5/$25)の半額以下。
- どう読む: エージェントの実行層が日常価格帯に降りてきた。同時に、サイバー能力を意図的に抑えたまま全員に出す設計は「規制時代のモデルの出し方」の初の実例。
- 次に見る: 新トークナイザで同じ入力が1.0〜1.35倍のトークンになる点。9月以降の実効コストは自分のワークロードで測る必要がある。
所属テーマ
確認できた事実
Anthropicは6月30日、Claude Sonnet 5を公開しました。計画を立て、ブラウザやターミナルを使い、自律的に作業を進める能力を前面に出した「最もエージェント的なSonnet」です。Free/Proプランの既定モデルになり、Claude CodeとAPIでも即日利用できます。
価格は導入期間(8月31日まで)が入力$2・出力$10(100万トークンあたり)、以降は$3・$15です。Opus 4.8の$5・$25に対して半額以下になります。effort(思考の深さ)を上げると一部タスクでOpus 4.8に並ぶと公式は説明しています。
注記も重要です。Sonnet 5は新しいトークナイザを採用しており、同じ入力が旧モデル比で1.0〜1.35倍のトークン数になります。導入価格はこの増加を相殺して「移行がほぼコスト中立」になるよう設定されたと明記されています。
安全性評価では、幻覚・迎合・プロンプトインジェクション耐性がSonnet 4.6から改善しました。一方でサイバー攻撃系の能力は意図的に訓練されておらず、Firefox脆弱性の悪用評価では完全な成功率0.0%。Opus 4.8やMythos 5より大幅に低い水準です。
利用企業への影響
実務での判断材料は3つあります。第一に、移行の実質コスト。導入価格の間はほぼ中立ですが、9月以降はトークン増(最大1.35倍)×単価$3/$15で計算し直す必要があります。自社の代表的なワークロードで8月中に実測しておくのが安全です。
第二に、モデルの使い分けの見直し。「自律作業=上位モデル」という前提が崩れました。定型のエージェント業務(調査、多段のツール操作、コード修正)はSonnet 5に寄せ、判断が重い作業だけOpusに残す構成で、コストは大きく下がります。effortの段階設定で同じモデル内でも調整できます。
第三に、レート制限の緩和がChat、Cowork、Claude Code、APIで同時に入っています。高effort運用のトークン消費増を見込んだ変更で、エージェントを常駐させる運用の障壁が一段下がりました。
どう読むか
このリリースの本命は性能表ではなく価格です。数ヶ月前ならOpus級が必要だった「完走するエージェント」が、既定モデルの価格帯に降りてきました。エージェントの常駐化を試すコストが下がったということです。導入判断のボトルネックは、もはやモデル代ではなく、権限設計とログの側に移ります。
もう1つの読み筋は、出し方の設計です。先週の記事で、リリース審査の発動閾値がサイバー系ベンチマークで語られていることを書きました(AIリリースの自主基準)。Sonnet 5はまさにその文脈にいます。サイバー能力を意図的に訓練せず、審査の閾値の下に収めたまま、制限なしで全員に即日提供する。Fable 5が20日間止まり、GPT-5.6が限定提供になった同じ月に、です。「何点を取るかではなく何点に収めるか」という競争の、最初のわかりやすい実例と言えます。
次に見ること
見るべきは3つです。9月の標準価格移行後に実効コストがどう出るか。Gemini 3.5 Pro(7月公開予定)との中位帯の価格競争。そして、既定モデルがエージェント型に変わったことで、一般ユーザーの利用の仕方(と事故の型)がどう変わるかです。
前後の流れ
AIリリースの自主基準、米政府と3社が最終調整 / Anthropicの解除とOpenAIの制限 / Claude CodeのDynamic workflows / AI輸出規制とは(用語解説)