Claude Code の /usage は、セッションのトークン量を出すだけのコマンドではありません。Pro / Max / Team / Enterprise プランなら、直近の消費をスキル・サブエージェント・プラグイン・個別の MCP サーバーに按分して見せます。週次の制限で作業が止まる前に、どこがトークンを食っているかをここで特定できる。バージョンは v2.1.183 系(2026年6月時点)を前提にします。
/usage を開くと何が見えるか
まず実物。インタラクティブモードで /usage を打つと、画面上部にセッションブロックが出ます。
Total cost: $0.55
Total duration (API): 6m 19.7s
Total duration (wall): 6h 33m 10.2s
Total code changes: 0 lines added, 0 lines removed
この4行が、起動してから現在までの API トークン消費です。Total cost はトークン数からローカルで概算した推定値。実際の請求書とはズレます。公式ドキュメントの「コストを追跡する」も、正式な請求は Claude Console の使用量ページを見るよう指示しています。
API 時間とウォール時間は別物
Total duration (API) は実際にモデルが処理していた時間。wall は人間が画面を開いていた実時間です。上の例では API は6分強、ウォールは6時間半。差のほとんどは、こちらがコードを読んだり考えたりしていた時間で、トークンは消費していません。ウォール時間が長くても、それだけでプラン枠は減らない。効くのは API 側の処理量のほうです。セッションを開きっぱなしにしても、手を止めている間は枠を食わない、と読み替えてかまいません。
サブスク勢に $ 表示は請求と無関係
Max と Pro の契約者にとって、このドル表示は請求の参考になりません。使用量はサブスクリプションに含まれているからです。公式の注記も「セッションコスト数値は請求目的では関連がありません」と明言しています。見るべきは同じ画面に並ぶプラン使用量バー・アクティビティ統計・使用量の内訳のほう。/cost でドル額を追うのは API キー利用者の話です。
プラン制限を食っている機能をスキル単位で特定する
内訳表示が /usage の主役です。Week 21(v2.1.143〜v2.1.149、2026年5月)で入りました。Pro / Max / Team / Enterprise なら、プラン制限にカウントされている分がカテゴリ別に並びます。直近の消費を、呼び出したスキル・サブエージェント・プラグイン・個別の MCP サーバーへ按分し、それぞれを合計に対する割合で出す仕組みです。
セッションブロックの $ 額だけでは、どの機能が重かったかまで分かりません。「先週の消費が多かった」までは見えても、原因が特定のスキルなのか繋ぎっぱなしの MCP なのかは別問題。内訳はそこを名前単位まで割ります。割合が高い順に上から並ぶので、最初の1行を見れば、消費の大きい機能の見当がつく。
スキル・サブエージェント・プラグイン・MCP サーバーに按分
並びのイメージは下のとおり(割合は構成例で、実画面のキャプチャではありません)。
| カテゴリ | 内訳の例 | 割合 |
|---|---|---|
| スキル | code-review | 22% |
| サブエージェント | Explore | 18% |
| MCP サーバー | github | 15% |
| MCP サーバー | snowflake | 9% |
| プラグイン | security-guidance | 6% |
MCP サーバーが上位に来ていたら、繋ぎっぱなしのサーバーがトークンを吸っているサイン。MCP を5本繋いだまま放置していたら、7日間の消費の約3割が MCP 由来だった、ということがありました。どのサーバーがどれだけ食っているかが名前単位で出るので、切る判断がそのまま下せます。
d と w で24時間と7日間を切り替える
内訳画面で d を押すと過去24時間、w で過去7日間に切り替わります。週次の枠が近いときは w で1週間の偏りを見る。直近のセッションで急に消費が伸びた原因を追うなら d。同じ画面で粒度を行き来できます。週次の枠が残り少ないと気づいたら、まず w で7日間の内訳を出し、割合トップのカテゴリから止める。週次に当たる前に抑えるなら、この順序が一番手数が少ない。
ローカル履歴ベースなので claude.ai の分は出ない
数値は概算で、このマシンのローカルセッション履歴から計算します。別のデバイスや claude.ai で使った分は入りません。複数端末で回しているなら、CLI の /usage は片側しか映さない点に注意。全体像は Settings > Usage のダッシュボードのほうが正確です。
5時間枠と週次制限の2層構造
そもそもプラン制限は2層。5時間のセッション枠と週次の枠が同時に走ります。/usage の使用量バーは、この2つに対する消費率を映しています。
セッションは5時間のローリング
セッション枠は最初のプロンプトから5時間。固定時計ではなくローリングで、時間の経過とともに消費分が戻ります。朝10時に最初のプロンプトを打てば、その枠は15時にリセットされる勘定。Settings > Usage の「Current session」が、使った割合と残り時間を出します。短時間にサブエージェントを並列で回したり重い処理を連打したりすると、ここから先に詰まる。重い処理を5時間の区切りにまとめると、枠を使い切りにくい。
週次は Opus 専用枠と全モデル枠が別
週次は固定スケジュールでリセットします。公式サポートの「Usage limit best practices」によると、週次の枠はOpus 専用とそれ以外の全モデルで別々のリセットを持ちます。Opus を回しすぎると Opus 枠だけ先に尽きる構造。重い設計判断は Opus、量産は Sonnet という振り分けが効くのはこのためです。具体的な上限値はプランと時期で動くので、数字は Settings > Usage の「Plan usage limits」を一次情報にしてください。
ターミナルを離れずに常時把握する
毎回 /usage を打つのは手間です。常時表示の置き場所が2つあります。
statusline でコンテキスト使用率を出す
ステータスラインにコンテキストウィンドウの使用率を出しておく。溢れる前に /compact や /clear を打つ判断が、画面を見たまま下せます。設定は公式の「Context window usage」に従う形。プラン制限の割合そのものではないものの、1セッションあたりの肥大を抑える指標になります。/context の詳しい読み方は別記事(Claude Code /contextの読み方)へ。
VS Code 拡張の Account & usage
VS Code 拡張なら、CLI と同じ内訳が「Account & usage」ダイアログに出ます。Day / Week のトグル付きで、CLI の d / w と同じ切り替え。v2.1.174 以降が必要です。エディタから離れずに割合を確認できる分、ターミナルを開く手間が減ります。
/usage-credits で使いすぎに蓋をする
以前 /extra-usage だったコマンドは /usage-credits に名前が変わりました(旧名も動きます)。Pro と Max では、これで使用クレジットの月間支出上限を設定できます。
上限に達してもクレジットが残っていれば、Claude Code は上限を引き上げるか外すかを聞いてきます。CLI を離れずにそのまま続行できる。ただし上限の変更には、アカウントの請求アクセスが要ります。
制限に当たる前に消費を削る
週次に当たってしまうと、その週はタスクあたりの消費を減らすしか手がありません。5時間枠ならローリングで戻りますが、週次は固定リセットまで増えない。当たってから打てる手は限られます。日頃から効くのは、コンテキストを小さく保つ習慣のほう。/usage の内訳で割合の高いカテゴリから手を入れると、効きが目に見えます。
関連ないタスクは /clear で切る
古いコンテキストは後続の全メッセージでトークンを浪費します。別の作業に移るときは /clear。残したい論点があるなら /compact Focus on code samples and API usage のように、要約時に保持する内容を指定できます。
MCP サーバーは使う分だけ残す
/context で何がコンテキストを食っているか見て、/mcp で使っていないサーバーを無効化します。gh や aws のような CLI ツールは、MCP サーバーよりコンテキスト効率が良い。ツールごとの定義リストを足さず、Claude がコマンドを直接叩けるからです。
前処理をフックに逃がす
大きなログを丸ごと読ませると、それだけでコンテキストが膨らみます。フックで前処理しておけば、Claude が見る前に絞れる。たとえばテスト出力を失敗行だけに削る PreToolUse フック。
#!/bin/bash
input=$(cat)
cmd=$(echo "$input" | jq -r '.tool_input.command')
# テスト実行なら失敗まわりだけ残す
if [[ "$cmd" =~ ^(npm test|pytest|go test) ]]; then
filtered_cmd="$cmd 2>&1 | grep -A 5 -E '(FAIL|ERROR|error:)' | head -100"
echo "{\"hookSpecificOutput\":{\"hookEventName\":\"PreToolUse\",\"permissionDecision\":\"allow\",\"updatedInput\":{\"command\":\"$filtered_cmd\"}}}"
else
echo "{}"
fi
これを通すと、1万行のログから ERROR 一致行だけが返ります。公式ドキュメントの例では、コンテキストが数万トークンから数百トークンまで落ちると説明されています。読ませる前に削るほうが、消費の効き目は大きい。
/usage・/cost・/context の役割分担
名前が似ていて混同しやすい3つ。見るものが別です。
| コマンド | 見るもの | 主な対象 |
|---|---|---|
/usage | プラン制限の消費と内訳、セッションのトークン | サブスク全般 + API |
/cost | トークン数と利用金額(ドル) | API キー利用者 |
/context | 今のコンテキストウィンドウの内訳 | 全員 |
レート制限が気になるなら /usage、請求額なら /cost、コンテキスト溢れなら /context。迷ったらこの対応で引けます。
まとめ
/usageの上部はセッションの API トークン。サブスクなら $ 表示は請求と無関係で、見るのはプラン使用量バーと内訳- Pro / Max / Team / Enterprise は、直近の消費をスキル・サブエージェント・プラグイン・MCP サーバー別に按分表示。
d/wで24時間と7日間を切替 - 内訳はローカル履歴ベース。claude.ai や他端末の分は入らない
- 制限は5時間のローリング枠と週次枠の2層。週次は Opus 専用と全モデルで別リセット
- 常時把握は statusline か VS Code 拡張(v2.1.174 以降)。月間上限は
/usage-creditsで設定

