Claude Pro & Max 週間利用制限ガイド (2026年版)
メッセージ上限、トークン制限、および使用状況を最適化する方法の完全な解説
Hyperealで構築を始めよう
Kling、Flux、Sora、Veoなどに単一のAPIでアクセス。無料クレジットで開始、数百万規模まで拡張可能。
クレジットカード不要 • 10万人以上の開発者 • エンタープライズ対応
Claude Pro & Max 週間レート制限ガイド (2026年版)
Anthropic の Claude サブスクリプションには、プラン、モデル、および現在のサーバー需要に応じて変動する利用制限があります。ワークフローの計画、適切なプランの選択、そしてプロジェクトの途中でレート制限の壁にぶつかるのを避けるためには、これらの制限を理解することが不可欠です。
このガイドでは、2026年当初時点での Claude Pro、Max、および Team プランにおけるすべてのレート制限の詳細を解説します。
プラン概要
Anthropic は Claude に対して主に4つのサブスクリプション層を提供しています。
| プラン | 料金 | 対象ユーザー |
|---|---|---|
| Free | $0/月 | カジュアルユーザー、評価用 |
| Pro | $20/月 | 個人のパワーユーザー |
| Max (5x) | $100/月 | ヘビーな個人ユーザー |
| Max (20x) | $200/月 | プロフェッショナルな日常利用者 |
| Team | $30/ユーザー/月 | 組織(最低5シートから) |
各プランは、固定された日次または月次のプロファイルではなく、ローリングウィンドウ方式のレート制限システムを採用しています。
プラン別の詳細なレート制限
Claude Free Tier
| モデル | 推定制限 | ウィンドウ |
|---|---|---|
| Opus 4 | 約10メッセージ | 1日あたり(UTC午前0時にリセット) |
| Sonnet 4 | 約30メッセージ | 1日あたり |
| Haiku | 約50メッセージ | 1日あたり |
Free ティアの制限は最も厳しく、需要のピーク時にはさらに減少します。ファイルのアップロードは制限されており、優先キューへのアクセス権もありません。
Claude Pro ($20/月)
| モデル | 推定制限 | ウィンドウ |
|---|---|---|
| Opus 4 | 約45メッセージ | 5時間のローリングウィンドウ |
| Sonnet 4 | 約100メッセージ | 5時間のローリングウィンドウ |
| Haiku | 約300メッセージ | 5時間のローリングウィンドウ |
| Claude Code (Sonnet) | 約45メッセージ | 5時間のローリングウィンドウ |
Pro は最も人気のあるプランです。「5時間のローリングウィンドウ」とは、時間の経過とともに最も古いメッセージがカウントから順次削除(有効期限切れ)されていくことを意味します。ハードリセットを待つ必要はありません。
Claude Max 5x ($100/月)
| モデル | 推定制限 | ウィンドウ |
|---|---|---|
| Opus 4 | 約225メッセージ | 5時間のローリングウィンドウ |
| Sonnet 4 | 約500メッセージ | 5時間のローリングウィンドウ |
| Haiku | ほぼ無制限 | 5時間のローリングウィンドウ |
| Claude Code (Sonnet) | 約225メッセージ | 5時間のローリングウィンドウ |
Max 5x は Pro の約5倍の制限を提供します。このプランは、一日中 Claude を主要な業務ツールとして使用するユーザー向けに設計されています。
Claude Max 20x ($200/月)
| モデル | 推定制限 | ウィンドウ |
|---|---|---|
| Opus 4 | 約900メッセージ | 5時間のローリングウィンドウ |
| Sonnet 4 | 約2,000メッセージ | 5時間のローリングウィンドウ |
| Haiku | 無制限 | 5時間のローリングウィンドウ |
| Claude Code (Sonnet) | 約900メッセージ | 5時間のローリングウィンドウ |
Max 20x は、ほぼ無制限のアクセスを必要とするプロフェッショナルユーザー向けです。5時間で 900 件の Opus メッセージを送信する場合、制限に達するには 20 秒ごとにメッセージを送信し続ける必要があります。
Claude Team ($30/ユーザー/月)
| モデル | 推定制限 | ウィンドウ |
|---|---|---|
| Opus 4 | 約90メッセージ | 5時間のローリングウィンドウ |
| Sonnet 4 | 約200メッセージ | 5時間のローリングウィンドウ |
| Haiku | 約600メッセージ | 5時間のローリングウィンドウ |
Team プランには、一括請求、管理者コントロール、30日間のデータ保持保証(データがトレーニングに使用されることはありません)などの追加機能が含まれています。
ローリングウィンドウの仕組み
5時間のローリングウィンドウは、Claude のレート制限において最も誤解されやすい側面です。実際には以下のように動作します。
タイムライン:
午前10:00 - 10メッセージ送信 (合計: 10)
午前11:00 - 15メッセージ送信 (合計: 25)
正午12:00 - 10メッセージ送信 (合計: 35)
午後 1:00 - 5メッセージ送信 (合計: 40)
午後 2:00 - 5メッセージ送信 (合計: 45) -- Opus Proの制限に接近
午後 3:00 - 午前10:00のメッセージが期限切れ (合計: 35)
午後 3:30 - 再びメッセージ送信が可能になる
重要なポイント:
- メッセージは一斉ではなく、徐々に期限切れになります。最も古いメッセージが5時間を経過するごとに、利用可能な枠が増えます。
- ウィンドウは継続的にスライドします。固定のリセット時間はありません。
- 長い会話はコストが高くなります。会話の50ターン目のメッセージには全会話履歴が含まれるため、新規メッセージよりも大幅に多くのトークンを消費します。
何が「1メッセージ」としてカウントされるか?
ここが最も混乱を招く部分です。Claude のレート制限システムにおける「メッセージ」は、送信したプロンプトの数ではなく、消費されたトークン量によって重み付けされます。
新規の会話、短いプロンプト: ~500 トークン = 約1メッセージ単位
会話の中盤 (10ターン目): ~5,000 トークン = 約2-3メッセージ単位
長い会話 (30ターン目): ~20,000 トークン = 約5-8メッセージ単位
ファイル添付ありの長い会話: ~50,000+ トークン = 約10-15メッセージ単位
つまり、長い会話の後半で送る1つのプロンプトは、新規の会話10メッセージ分以上に相当する場合があります。これが、レート制限対策として「頻繁に新しい会話を開始すること」が最も効果的である理由です。
Claude Code 特有の制限
Claude Code には独自のレート制限の考慮事項があります。
| 要因 | 制限への影響 |
|---|---|
| ツール呼び出し(ファイル読み取り、検索) | 各ツールの使用がコンテキストにトークンを追加 |
| マルチターン・エージェント・ループ | 1つのタスクで5〜20メッセージ以上を消費可能 |
| 大容量ファイルの読み取り | 大きなファイルの読み込みはトークン数を膨らませる |
/compact の使用 |
トークン数を削減し、レート制限を節約 |
「このモジュールをリファクタリングして」といった1つの Claude Code タスクは、複数のツール呼び出し、ファイル読み取り、生成ステップを伴うため、10〜30メッセージ分のレート制限を消費することがあります。
プロのヒント: --max-turns を使用して、Claude Code のエージェントループを制限してください。
# エージェントのターンを10回に制限
claude --max-turns 10 "refactor the auth module"
API レート制限(開発者向け)
Claude API を直接使用する場合、レート制限は異なる構造になっています。
| ティア | リクエスト数/分 | トークン数/分 (Input) | トークン数/日 (Input) |
|---|---|---|---|
| Tier 1 (新規) | 50 | 40,000 | 1,000,000 |
| Tier 2 | 1,000 | 80,000 | 2,500,000 |
| Tier 3 | 2,000 | 160,000 | 5,000,000 |
| Tier 4 | 4,000 | 400,000 | 10,000,000 |
API ティアのアップグレードは、支払実績とアカウントの経過日数に基づいて自動的に行われます。Anthropic コンソールからティアの引き上げをリクエストすることも可能です。
import anthropic
client = anthropic.Anthropic()
# レスポンス内の現在のレート制限ヘッダーを確認
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello"}]
)
# レート制限情報はレスポンスヘッダーに含まれます:
# x-ratelimit-limit-requests
# x-ratelimit-limit-tokens
# x-ratelimit-remaining-requests
# x-ratelimit-remaining-tokens
# x-ratelimit-reset-requests
# x-ratelimit-reset-tokens
最適化戦略
1. 頻繁に新しい会話を開始する
レート制限を最も消耗させるのは長い会話です。各メッセージには全履歴が含まれるためです。
| 会話の長さ | 実効メッセージコスト |
|---|---|
| 1-5 ターン | メッセージあたり約1倍 |
| 6-15 ターン | メッセージあたり約2-3倍 |
| 16-30 ターン | メッセージあたり約5-8倍 |
| 30+ ターン | メッセージあたり約10-15倍 |
1つの巨大なスレッドを続けるのではなく、個別のタスクごとに新しい会話を開始してください。
2. 適切なモデルを選択する
すべてのタスクに Opus が必要なわけではありません。以下の判断基準を活用してください。
単純な質問やフォーマット変更 -> Haiku (Opusと比較して約95%節約)
コード生成、執筆、分析 -> Sonnet (Opusと比較して約70%節約)
複雑な推論、アーキテクチャ設計 -> Opus (全力)
3. プロンプト・キャッシュを利用する
システムプロンプトなどの同様のプレフィックスを使用して API 呼び出しを繰り返す場合、Anthropic のプロンプト・キャッシュを利用すると、キャッシュされた部分のトークン消費を最大 90% 削減できます。
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=1024,
system=[
{
"type": "text",
"text": "あなたはシニアコードレビュアーです...", # 長いシステムプロンプト
"cache_control": {"type": "ephemeral"}
}
],
messages=[{"role": "user", "content": "このPRをレビューして..."}]
)
4. 非緊急のリクエストはバッチ処理する
Anthropic Batches API は、24時間以内の処理でコストを50%削減できます。
batch = client.batches.create(
requests=[
{
"custom_id": "review-1",
"params": {
"model": "claude-sonnet-4-20250514",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "このコードをレビューして..."}]
}
}
# ... その他のリクエスト
]
)
5. 先回りして使用状況を監視する
Claude ウェブアプリの場合:
- 制限に近づくと表示される黄色の警告バナーに注意してください。
- モデルセレクターを確認してください。特定のモデルが制限されている場合に表示されます。
- 警告が表示されたら、制限の緩いモデルに切り替えてください。
Claude Code の場合:
/costを実行してトークン消費量を確認してください。- サブタスク完了後に
/compactを使用してください。
どのプランを選ぶべきか?
| 利用パターン | 推奨プラン | 月額料金 |
|---|---|---|
| たまに使用する(1日20メッセージ未満) | Free または Pro | $0-20 |
| 日常的な業務利用 | Pro | $20 |
| 複数のプロジェクトにわたるヘビーな利用 | Max 5x | $100 |
| 一日中の Claude Code 開発 | Max 20x | $200 |
| 管理機能が必要な5名以上のチーム | Team | 1ユーザーあたり$30 |
月額$100の Max 5x プランは、Claude Code を定期的に使用するほとんどの開発者にとって最適な選択肢です。制限を常に気にすることなく、数時間に及ぶコーディングセッションを行うのに十分な余裕を提供します。
結論
Claude のレート制限は、ローリングウィンドウとトークン重み付けメッセージに基づいて設計されています。つまり、単純なメッセージ数だけでなく、「どのように使うか」が重要です。最も効果的な戦略は、新しい会話をこまめに開始すること、タスクごとに適切なモデルを選択すること、そして Claude Code で /compact を活用することです。
画像生成、動画生成、AIアバターなどの AI メディア生成機能が必要な場合は、Hypereal AI が、複雑なレート制限ティアのない、透明性の高いリクエスト単位の料金体系で統合 API を提供しています。
