はじめに
「Claude Code、すごく便利なんだけどコストが怖くて……」。チームへの展開を検討しているEMからよく聞くセリフだ。
確かに使い方を誤ると請求が想定外に膨らむ。でも逆に言えば、コストが膨らむ原因は限られていて、そこを抑えれば品質を落とさずに支出を大幅に削減できる。本記事では「月額いくらかかるのか」という選定基準から、「1日の使い方でどこにコストが発生しているか」の診断まで、具体的な数字とともに解説する。
なお、/compact・/btw・/effortなどのコマンドの操作方法の詳細は「スラッシュコマンド完全ガイド」に委ねる。本記事ではコスト面の効果に集中する。
まず課金体系を理解する
プランは大きく2軸で選ぶ。個人か組織か、利用頻度が高いか低いかだ。
| プラン | 月額 | 主な用途 |
|---|---|---|
| Pro | $20/人 | 個人の日常利用 |
| Max 5x | $100/人 | ヘビーユーザー・上限5倍 |
| Max 20x | $200/人 | 超ヘビーユーザー・上限20倍 |
| Team Standard | $25/人 | チーム導入・軽〜中程度の利用者 |
| Team Premium | $125/人 | チームのヘビーユーザー |
| Enterprise | カスタム | 大規模組織・セキュリティ要件あり |
APIを組み合わせる場合、モデル別の料金も知っておく必要がある。
| モデル | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| Claude Opus 4.6 | $5 | $25 |
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Haiku 4.5 | $1 | $5 |
コストが膨らむ4大原因
対策を打つ前に、なぜコストが膨らむのかを見ておく。
原因①:コンテキストの無駄な肥大化
LLM APIはステートレスで毎回全履歴を再送信する。会話が長くなるほど「雪だるま式」にトークンが増え、コスト増加・精度低下・Rate Limit早期到達の三重苦が発生する。コンテキスト95%超で自動圧縮が発動すると大事な情報が消えることもある。Rate Limitに早く到達する場合は、長いセッションを続けていることが主因であることが多い。
原因②:全タスクに最高エフォートを使っている
タイポ修正にもアーキテクチャ設計にも同じ high エフォートを使っていると、簡単なタスクで重量級の推論が走りトークンを無駄に消費する。
原因③:計画なしの試行錯誤
「とりあえず実装させてみる」を繰り返すと、間違った方向への実装・巻き戻し・再実装でトークンを3〜5倍消費することがある。
原因④:不要なMCPサーバーを常時有効にしている
MCPサーバーはシステムプロンプトにツール定義を追加する。使わないサーバーが有効になっているだけで、毎リクエストのトークンを消費し続ける。気づきにくいコスト漏れの原因だ。
コスト最適化テクニック8選
① Plan Modeで手戻りをゼロにする(最大の削減策)
Shift+Tab × 2 または /plan で起動する読み取り専用モードだ。実装前に計画を確定させ、ワンショットで実装することで手戻りを排除する。
実際に比較すると、その差は想像以上だ。
| パターン | トークン(概算) | コスト(概算) |
|---|---|---|
| 計画なし→Sonnetで実装3回 | 30,000 × 3 = 90,000トークン | 約$1.35 |
| Opusで計画→Sonnetで実装1回 | 2,000(Opus)+ 30,000(Sonnet)= 32,000トークン | 約$0.46 |
1タスクあたり約$0.88の差。1日10タスクなら月額で約$264の削減になりうる。Plan Modeは読み取り専用のためファイル変更コストゼロなのも利点だ。
② エフォートレベルをタスクに合わせる
| タスク例 | 推奨 | コスト感 |
|---|---|---|
| タイポ修正・変数名変更 | low | 最小 |
| 通常の機能実装 | med(デフォルト) | 標準 |
| アーキテクチャ設計・難デバッグ | high | 高め |
| 最重要意思決定 | max | 最大 |
low/med/high はセッション間で永続するため、重いタスクが終わったら auto でリセットする習慣をつけること。
③ /compact でコンテキストを定期圧縮する
コンテキスト使用率50〜70%超えでの定期実行が基本だ。フォーカス指定(/compact focus on the auth implementation)で重要情報を保持しつつ圧縮できる。CLAUDE.mdはコンパクション後も保持される唯一の情報源のため、チームルール・開発規約は必ずCLAUDE.mdに記述しておく。
④ /btw でサイドクエスチョンを分離する
ちょっとした確認を本筋の会話に混ぜない。/btw は親会話のプロンプトキャッシュを再利用するため追加コストはほぼゼロで、会話履歴にも残らない。コンテキスト汚染防止とコスト削減を同時に実現できる。
⑤ Opus優先の逆説——計画は高品質モデルで
直感に反するが、複雑なタスクは安いモデルで始めるより高品質モデルで計画を立てる方が安くなる。原理は①で示した通りで、計画精度が高いほど手戻りが減り、トータルコストが下がる。
戦略はシンプルだ。
計画フェーズ(Plan Mode) → Opus 4.6(高精度で手戻りを最小化)
通常の実装フェーズ → Sonnet 4.6(コスト効率とのバランス)
単純な作業・確認作業 → Haiku 4.5(コスト最小)
⑥ --max-budget-usd で予算上限を設定する
APIを使う場合、コスト上限をCLIオプションで設定できる。
claude --max-budget-usd 5
マルチエージェントや長時間自律実行をさせる際の暴走を防ぐ安全装置として有効だ。
⑦ /cost・/usage でコストを可視化する
問題に気づかなければ対策できない。以下のコマンドで状況を把握する。
/cost # 現在のセッションのトークン使用量統計
/usage # プランの残量・レート制限状況
/stats # 日次使用量・セッション履歴
/context # コンテキスト使用量のグリッド表示
特に /context はどのツール・MCPサーバーがコンテキストを食っているかを特定できる。不要なサーバーが見つかったら /mcp disable で停止するだけで、コストが大きく変わることがある。
⑧ チームプランのシート配分を最適化する
全員をPremiumにする必要はない。Standard($25/人)で始めて、ヘビーユーザーだけPremium($125/人)に移行するのが推奨だ。
1. 全員 Standard ($25/人) でスタート
↓
2. Standard シートの月額上限を $100 に設定
↓
3. 上限に頻繁に到達するユーザーを把握
↓
4. ヘビーユーザーのみ Premium ($125/人) へ移行
↓
5. 定期的に構成を見直し
コスト試算の目安として、Standard 10人なら$250/月、Standard 8人+Premium 2人なら$450/月になる。なお150シートを超えるとEnterpriseプランへの移行が必要になる。
ビフォーアフター:コスト最適化の効果
Before(最適化前)
全タスクに /effort high を使い、「とりあえず実装させてみる」を繰り返し、間違った方向への実装を5回繰り返す。コンテキストの肥大化に気づかないまま放置し、月末に想定の3倍のトークン消費で請求が届く——という状況だ。
After(最適化後)
タスクの複雑さで /effort を切り替え、Plan Modeで計画を確定させてからワンショットで実装する。コンテキストは50〜70%で /compact を定期実行し、軽い質問は /btw で分離する。/cost で週次チェックを行い異常値を早期発見する。
まとめ
結局のところ、やることは4つに絞られる。コンテキストを肥大化させない、タスクに合ったエフォートを使う、Plan Modeで手戻りを排除する、使っていないMCPサーバーを止める。
まず今日やることは /cost と /usage を実行して自分の現在の消費量を把握することだ。数字を見てから対策を打つ順番が、最もROIが高い。

コメント