Claude Code /usage—使用量と制限の内訳をスキル単位で確認する

Claude Code /usage—使用量と制限の内訳をスキル単位で確認する | mohablog

Claude Code の /usage は、セッションのトークン量を出すだけのコマンドではありません。Pro / Max / Team / Enterprise プランなら、直近の消費をスキル・サブエージェント・プラグイン・個別の MCP サーバーに按分して見せます。週次の制限で作業が止まる前に、どこがトークンを食っているかをここで特定できる。バージョンは v2.1.183 系(2026年6月時点)を前提にします。

目次

/usage を開くと何が見えるか

まず実物。インタラクティブモードで /usage を打つと、画面上部にセッションブロックが出ます。

Total cost:            $0.55
Total duration (API):  6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes:    0 lines added, 0 lines removed

この4行が、起動してから現在までの API トークン消費です。Total cost はトークン数からローカルで概算した推定値。実際の請求書とはズレます。公式ドキュメントの「コストを追跡する」も、正式な請求は Claude Console の使用量ページを見るよう指示しています。

API 時間とウォール時間は別物

Total duration (API) は実際にモデルが処理していた時間。wall は人間が画面を開いていた実時間です。上の例では API は6分強、ウォールは6時間半。差のほとんどは、こちらがコードを読んだり考えたりしていた時間で、トークンは消費していません。ウォール時間が長くても、それだけでプラン枠は減らない。効くのは API 側の処理量のほうです。セッションを開きっぱなしにしても、手を止めている間は枠を食わない、と読み替えてかまいません。

サブスク勢に $ 表示は請求と無関係

Max と Pro の契約者にとって、このドル表示は請求の参考になりません。使用量はサブスクリプションに含まれているからです。公式の注記も「セッションコスト数値は請求目的では関連がありません」と明言しています。見るべきは同じ画面に並ぶプラン使用量バー・アクティビティ統計・使用量の内訳のほう。/cost でドル額を追うのは API キー利用者の話です。

プラン制限を食っている機能をスキル単位で特定する

内訳表示が /usage の主役です。Week 21(v2.1.143v2.1.149、2026年5月)で入りました。Pro / Max / Team / Enterprise なら、プラン制限にカウントされている分がカテゴリ別に並びます。直近の消費を、呼び出したスキル・サブエージェント・プラグイン・個別の MCP サーバーへ按分し、それぞれを合計に対する割合で出す仕組みです。

セッションブロックの $ 額だけでは、どの機能が重かったかまで分かりません。「先週の消費が多かった」までは見えても、原因が特定のスキルなのか繋ぎっぱなしの MCP なのかは別問題。内訳はそこを名前単位まで割ります。割合が高い順に上から並ぶので、最初の1行を見れば、消費の大きい機能の見当がつく。

スキル・サブエージェント・プラグイン・MCP サーバーに按分

並びのイメージは下のとおり(割合は構成例で、実画面のキャプチャではありません)。

カテゴリ内訳の例割合
スキルcode-review22%
サブエージェントExplore18%
MCP サーバーgithub15%
MCP サーバーsnowflake9%
プラグインsecurity-guidance6%

MCP サーバーが上位に来ていたら、繋ぎっぱなしのサーバーがトークンを吸っているサイン。MCP を5本繋いだまま放置していたら、7日間の消費の約3割が MCP 由来だった、ということがありました。どのサーバーがどれだけ食っているかが名前単位で出るので、切る判断がそのまま下せます。

d と w で24時間と7日間を切り替える

内訳画面で d を押すと過去24時間、w で過去7日間に切り替わります。週次の枠が近いときは w で1週間の偏りを見る。直近のセッションで急に消費が伸びた原因を追うなら d。同じ画面で粒度を行き来できます。週次の枠が残り少ないと気づいたら、まず w で7日間の内訳を出し、割合トップのカテゴリから止める。週次に当たる前に抑えるなら、この順序が一番手数が少ない。

ローカル履歴ベースなので claude.ai の分は出ない

数値は概算で、このマシンのローカルセッション履歴から計算します。別のデバイスや claude.ai で使った分は入りません。複数端末で回しているなら、CLI の /usage は片側しか映さない点に注意。全体像は Settings > Usage のダッシュボードのほうが正確です。

5時間枠と週次制限の2層構造

そもそもプラン制限は2層。5時間のセッション枠週次の枠が同時に走ります。/usage の使用量バーは、この2つに対する消費率を映しています。

セッションは5時間のローリング

セッション枠は最初のプロンプトから5時間。固定時計ではなくローリングで、時間の経過とともに消費分が戻ります。朝10時に最初のプロンプトを打てば、その枠は15時にリセットされる勘定。Settings > Usage の「Current session」が、使った割合と残り時間を出します。短時間にサブエージェントを並列で回したり重い処理を連打したりすると、ここから先に詰まる。重い処理を5時間の区切りにまとめると、枠を使い切りにくい。

週次は Opus 専用枠と全モデル枠が別

週次は固定スケジュールでリセットします。公式サポートの「Usage limit best practices」によると、週次の枠はOpus 専用それ以外の全モデルで別々のリセットを持ちます。Opus を回しすぎると Opus 枠だけ先に尽きる構造。重い設計判断は Opus、量産は Sonnet という振り分けが効くのはこのためです。具体的な上限値はプランと時期で動くので、数字は Settings > Usage の「Plan usage limits」を一次情報にしてください。

ターミナルを離れずに常時把握する

毎回 /usage を打つのは手間です。常時表示の置き場所が2つあります。

statusline でコンテキスト使用率を出す

ステータスラインにコンテキストウィンドウの使用率を出しておく。溢れる前に /compact/clear を打つ判断が、画面を見たまま下せます。設定は公式の「Context window usage」に従う形。プラン制限の割合そのものではないものの、1セッションあたりの肥大を抑える指標になります。/context の詳しい読み方は別記事(Claude Code /contextの読み方)へ。

VS Code 拡張の Account & usage

VS Code 拡張なら、CLI と同じ内訳が「Account & usage」ダイアログに出ます。Day / Week のトグル付きで、CLI の d / w と同じ切り替え。v2.1.174 以降が必要です。エディタから離れずに割合を確認できる分、ターミナルを開く手間が減ります。

/usage-credits で使いすぎに蓋をする

以前 /extra-usage だったコマンドは /usage-credits に名前が変わりました(旧名も動きます)。Pro と Max では、これで使用クレジットの月間支出上限を設定できます。

上限に達してもクレジットが残っていれば、Claude Code は上限を引き上げるか外すかを聞いてきます。CLI を離れずにそのまま続行できる。ただし上限の変更には、アカウントの請求アクセスが要ります。

制限に当たる前に消費を削る

週次に当たってしまうと、その週はタスクあたりの消費を減らすしか手がありません。5時間枠ならローリングで戻りますが、週次は固定リセットまで増えない。当たってから打てる手は限られます。日頃から効くのは、コンテキストを小さく保つ習慣のほう。/usage の内訳で割合の高いカテゴリから手を入れると、効きが目に見えます。

関連ないタスクは /clear で切る

古いコンテキストは後続の全メッセージでトークンを浪費します。別の作業に移るときは /clear。残したい論点があるなら /compact Focus on code samples and API usage のように、要約時に保持する内容を指定できます。

MCP サーバーは使う分だけ残す

/context で何がコンテキストを食っているか見て、/mcp で使っていないサーバーを無効化します。ghaws のような CLI ツールは、MCP サーバーよりコンテキスト効率が良い。ツールごとの定義リストを足さず、Claude がコマンドを直接叩けるからです。

前処理をフックに逃がす

大きなログを丸ごと読ませると、それだけでコンテキストが膨らみます。フックで前処理しておけば、Claude が見る前に絞れる。たとえばテスト出力を失敗行だけに削る PreToolUse フック。

#!/bin/bash
input=$(cat)
cmd=$(echo "$input" | jq -r '.tool_input.command')

# テスト実行なら失敗まわりだけ残す
if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
  filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
  echo "{\"hookSpecificOutput\":{\"hookEventName\":\"PreToolUse\",\"permissionDecision\":\"allow\",\"updatedInput\":{\"command\":\"$filtered_cmd\"}}}"
else
  echo "{}"
fi

これを通すと、1万行のログから ERROR 一致行だけが返ります。公式ドキュメントの例では、コンテキストが数万トークンから数百トークンまで落ちると説明されています。読ませる前に削るほうが、消費の効き目は大きい。

/usage・/cost・/context の役割分担

名前が似ていて混同しやすい3つ。見るものが別です。

コマンド見るもの主な対象
/usageプラン制限の消費と内訳、セッションのトークンサブスク全般 + API
/costトークン数と利用金額(ドル)API キー利用者
/context今のコンテキストウィンドウの内訳全員

レート制限が気になるなら /usage、請求額なら /cost、コンテキスト溢れなら /context。迷ったらこの対応で引けます。

まとめ

  • /usage の上部はセッションの API トークン。サブスクなら $ 表示は請求と無関係で、見るのはプラン使用量バーと内訳
  • Pro / Max / Team / Enterprise は、直近の消費をスキル・サブエージェント・プラグイン・MCP サーバー別に按分表示。d / w で24時間と7日間を切替
  • 内訳はローカル履歴ベース。claude.ai や他端末の分は入らない
  • 制限は5時間のローリング枠と週次枠の2層。週次は Opus 専用と全モデルで別リセット
  • 常時把握は statusline か VS Code 拡張(v2.1.174 以降)。月間上限は /usage-credits で設定
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次