Claude APIの料金:完全版コスト計算ツール (2026年)
Claude の各モデルの詳細な料金体系とコスト最適化のヒント
Hyperealで構築を始めよう
Kling、Flux、Sora、Veoなどに単一のAPIでアクセス。無料クレジットで開始、数百万規模まで拡張可能。
クレジットカード不要 • 10万人以上の開発者 • エンタープライズ対応
Claude API 料金:完全価格シミュレーター (2026年版)
Anthropic の Claude API は、チャットボットやコーディングアシスタントから文書分析、コンテンツ生成に至るまで、あらゆるものを動かしています。スケーリング時にトークンコストが急速に膨らむ可能性があるため、価格構造を理解することは予算管理において極めて重要です。
このガイドでは、すべての Claude モデルの価格を網羅し、特定のユースケースにおけるコスト計算方法を示し、API 費用を削減するための実践的なヒントを共有します。
Claude API 料金表 (2026年)
2026年初頭時点の Anthropic API で利用可能なすべての Claude モデルの完全な料金表です。
| モデル | 入力 (100万トークンあたり) | 出力 (100万トークンあたり) | コンテキストウィンドウ | 最適な用途 |
|---|---|---|---|---|
| Claude Opus 4 | $15.00 | $75.00 | 200K | 複雑な推論、研究 |
| Claude Sonnet 4.5 | $3.00 | $15.00 | 200K | 万能な最高モデル |
| Claude Sonnet 4 | $3.00 | $15.00 | 200K | コーディング、分析 |
| Claude Haiku 3.5 | $0.80 | $4.00 | 200K | 高速、軽量なタスク |
Batch API 料金 (50% 割引)
Anthropic は、緊急性の低いワークロード向けに Batch API を提供しています。リクエストは24時間以内に処理され、標準価格の半額で利用できます。
| モデル | バッチ入力 (100万あたり) | バッチ出力 (100万あたり) | 標準との比較 |
|---|---|---|---|
| Claude Opus 4 | $7.50 | $37.50 | 50% 節約 |
| Claude Sonnet 4.5 | $1.50 | $7.50 | 50% 節約 |
| Claude Sonnet 4 | $1.50 | $7.50 | 50% 節約 |
| Claude Haiku 3.5 | $0.40 | $2.00 | 50% 節約 |
プロンプトキャッシュ (Prompt Caching) 料金
プロンプトキャッシュ(同じシステムプロンプトやコンテキストを複数のリクエストで再利用する機能)を使用すると、キャッシュされた入力トークンのコストを大幅に節約できます。
| モデル | キャッシュ書き込み (100万あたり) | キャッシュ読み取り (100万あたり) | 読み取りの節約率 |
|---|---|---|---|
| Claude Opus 4 | $18.75 | $1.50 | 標準入力比 90% 減 |
| Claude Sonnet 4.5 | $3.75 | $0.30 | 標準入力比 90% 減 |
| Claude Sonnet 4 | $3.75 | $0.30 | 標準入力比 90% 減 |
| Claude Haiku 3.5 | $1.00 | $0.08 | 標準入力比 90% 減 |
Claude API コストの計算方法
トークンについて
トークンは、Claude がテキストを処理する際の単位です。大まかな目安は以下の通りです:
- 1トークン:英語で約4文字、または0.75単語(日本語の場合は1文字≒1〜2トークン程度になることが多い)
- 1,000トークン:英語で約750単語
- 一般的なコードファイル (200行):約2,000〜3,000トークン
- 1ページの文書 (約500単語):約670トークン
コスト計算式
総コスト = (入力トークン数 / 1,000,000 × 入力単価) + (出力トークン数 / 1,000,000 × 出力単価)
計算例
例 1: チャットボットの会話
- モデル: Claude Sonnet 4.5
- 平均的な会話: 入力 2,000 トークン、出力 500 トークン
- 会話1回あたりのコスト: (2,000/1M x $3) + (500/1M x $15) = $0.006 + $0.0075 = $0.0135
- 月間 10,000 回の会話: $135
例 2: コードレビューツール
- モデル: Claude Sonnet 4.5
- レビュー1回あたり: 入力 15,000 トークン (コードの文脈)、出力 3,000 トークン (レビュー結果)
- レビュー1回あたりのコスト: (15,000/1M x $3) + (3,000/1M x $15) = $0.045 + $0.045 = $0.09
- 月間 500 回のレビュー: $45
例 3: 文書要約
- モデル: Claude Haiku 3.5
- 文書1つあたり: 入力 50,000 トークン (長い文書)、出力 2,000 トークン (要約)
- 要約1回あたりのコスト: (50,000/1M x $0.80) + (2,000/1M x $4) = $0.04 + $0.008 = $0.048
- 月間 5,000 文書: $240
例 4: 研究論文のバッチ処理
- モデル: Claude Sonnet 4.5 (Batch API)
- 論文1本あたり: 入力 80,000 トークン、出力 5,000 トークン
- 論文1本あたりのコスト: (80,000/1M x $1.50) + (5,000/1M x $7.50) = $0.12 + $0.0375 = $0.1575
- 1,000本合計: $157.50 (標準料金 $315 との比較)
コスト早見表
一般的なトークン量における API コール 1,000回あたりの概算費用です。
| 1コールあたりのトークン量 | Claude Opus 4 | Claude Sonnet 4.5 | Claude Haiku 3.5 |
|---|---|---|---|
| 入力 500 / 出力 100 | $15.00 | $3.00 | $0.80 |
| 入力 2K / 出力 500 | $67.50 | $13.50 | $3.60 |
| 入力 5K / 出力 1K | $150.00 | $30.00 | $8.00 |
| 入力 10K / 出力 3K | $375.00 | $75.00 | $20.00 |
| 入力 50K / 出力 5K | $1,125.00 | $225.00 | $60.00 |
Claude API と競合他社のコスト比較
| モデル | 入力 (1Mあたり) | 出力 (1Mあたり) | 品質層 |
|---|---|---|---|
| Claude Opus 4 | $15.00 | $75.00 | プレミアム |
| GPT-4o | $2.50 | $10.00 | プレミアム |
| Gemini 2.5 Pro | $1.25 | $10.00 | プレミアム |
| Claude Sonnet 4.5 | $3.00 | $15.00 | 高品質 |
| GPT-4o-mini | $0.15 | $0.60 | ミドル |
| Claude Haiku 3.5 | $0.80 | $4.00 | ミドル |
| Gemini 2.5 Flash | $0.15 | $0.60 | ミドル |
| Llama 3.3 70B (Groq) | $0.59 | $0.79 | ミドル |
| DeepSeek V3 | $0.27 | $1.10 | ミドル |
主なポイント:
- Claude Sonnet 4.5 は、その品質層においては適正な価格設定です。GPT-4o よりは高価ですが、出力の品質において競争力があります。
- Claude Haiku 3.5 は Claude ファミリーの中では格安ですが、同等ティアのタスクにおいては GPT-4o-mini や Gemini Flash の方が大幅に安価です。
- Claude Opus 4 は群を抜いて高価なモデルです。真にその高い推論能力が必要なタスクにのみ使用するようにしましょう。
Claude API のコストを削減する 7 つのヒント
1. 繰り返されるコンテキストにはプロンプトキャッシュを使用する
すべてのリクエストで同じシステムプロンプトや参照ドキュメントを送信する場合は、プロンプトキャッシュを有効にします。最初のリクエストではキャッシュ書き込みのために 25% のプレミアムが発生しますが、それ以降のリクエストではキャッシュされたトークンを 90% 引きで読み取ることができます。
import anthropic
client = anthropic.Anthropic()
# 初回リクエスト:キャッシュに書き込み
# First request: writes to cache
response = client.messages.create(
model="claude-sonnet-4-5-20250514",
max_tokens=1024,
system=[
{
"type": "text",
"text": "You are a senior code reviewer. Here are the project coding standards: [... long document ...]",
"cache_control": {"type": "ephemeral"}
}
],
messages=[{"role": "user", "content": "Review this pull request: ..."}]
)
# 以降のリクエスト:90% 割引でキャッシュを読み取り
# Subsequent requests: reads from cache at 90% discount
2. 急ぎではない作業には Batch API を使用する
処理時間が最大 24 時間かかっても許容できるワークロードの場合、Batch API を使用することでコストを半分に抑えることができます。
import anthropic
client = anthropic.Anthropic()
# バッチリクエストの作成
# Create a batch request
batch = client.batches.create(
requests=[
{
"custom_id": "doc-001",
"params": {
"model": "claude-sonnet-4-5-20250514",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Summarize this document: ..."}]
}
},
{
"custom_id": "doc-002",
"params": {
"model": "claude-sonnet-4-5-20250514",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Summarize this document: ..."}]
}
}
]
)
print(f"Batch ID: {batch.id}")
3. タスクに適したモデルを選択する
すべてのタスクに Opus 4 を使用しないでください。タスクに応じて適切なモデルにルーティングしましょう。
| タスク | 推奨モデル | 理由 |
|---|---|---|
| シンプルな Q&A、フォーマット整形 | Haiku 3.5 | 最安で、十分な速度 |
| コード生成、分析 | Sonnet 4.5 | 品質とコストのバランスが最高 |
| 複雑な推論、研究 | Opus 4 | これにしかできない高度なタスク |
4. max_tokens を適切に設定する
すべてのリクエストに max_tokens を 4096 に設定しないでください。200 トークンの応答が期待される場合は、300 程度に設定します。請求は実際の出力トークンに対してのみ行われますが、max_tokens を低く設定することで、モデルがより簡潔な回答をするよう促すことができます。
5. 入力トークンを最小限に抑える
- コードから不要な空白を削除する。
- コードベース全体ではなく、関連するファイルのみを送信する。
- 長い文書はコンテキストとして送信する前に要約する。
- 冗長な散文ではなく、構造化された形式(JSON、箇条書き)を使用する。
6. レスポンスキャッシュを実装する
アプリケーション側で、同一または類似のクエリに対する Claude のレスポンスをキャッシュします。
import hashlib
import json
import redis
redis_client = redis.Redis()
def query_claude_cached(prompt, model="claude-sonnet-4-5-20250514"):
# プロンプトからキャッシュキーを作成
# Create a cache key from the prompt
cache_key = f"claude:{hashlib.sha256(prompt.encode()).hexdigest()}"
# まずキャッシュをチェック
# Check cache first
cached = redis_client.get(cache_key)
if cached:
return json.loads(cached)
# Claude API を呼び出し
# Call Claude API
response = client.messages.create(
model=model,
max_tokens=1024,
messages=[{"role": "user", "content": prompt}]
)
result = response.content[0].text
# 1時間キャッシュする
# Cache for 1 hour
redis_client.setex(cache_key, 3600, json.dumps(result))
return result
7. 監視とアラートの設定
Anthropic の使用状況ダッシュボードを確認し、支払いアラートを設定してください。
- console.anthropic.com/settings/billing にアクセス。
- 月額支出上限を設定。
- しきい値(50%、75%、90% など)ごとにメールアラートを設定。
よくある質問
Claude API に無料枠はありますか? Anthropic は新規アカウントに対して、30日間有効な5ドル分の無料クレジットを提供しています。それ以降はトークンごとの従量課金となります。
Claude API の料金は claude.ai Pro サービスと比較してどうですか? Pro サブスクリプション(月額 20ドル)では、1日あたり約100〜200メッセージ程度利用可能です。中程度の利用量(月間約1,500メッセージ以下)であれば、多くの場合 Pro の方が API より安価です。非常に少ない利用量、または大量の利用量の場合は、API の方がコスト効率が良くなる可能性があります。
支出のハードリミット(停止制限)は設定できますか? はい。Anthropic コンソールで月間の支出上限を設定できます。上限に達すると、追加料金が発生する代わりに API リクエストがエラーを返すようになります。
Extended thinking(拡張思考)機能には追加料金がかかりますか? Extended thinking のトークンは出力トークンとして課金されます。この機能は多くの推論トークンを生成するため、コストが大幅に増加する可能性があります。有効にする際は使用量を注意深く監視してください。
ボリュームディスカウントはありますか? Batch API を使用することで一律 50% の割引が受けられます。月間数百万ドル規模の非常に高ボリュームな利用については、Anthropic の営業チームにカスタム料金プランを相談してください。
まとめ
Claude API のコストは、Haiku 3.5 の入力 $0.80/100万トークンから、Opus 4 の出力 $75/100万トークンまで幅があります。ほとんどのアプリケーションにおいて、100万トークンあたり $3/$15 の Claude Sonnet 4.5 が品質とコストの最適なバランスを提供します。プロンプトキャッシュ、Batch API、スマートなモデルルーティングを活用して、請求額を 50% から 90% 削減しましょう。
Claude によるテキスト生成と並行して、手頃な価格の AI メディア生成 API が必要な場合は、Hypereal AI を無料でお試しください。35クレジット提供、クレジットカード不要です。画像、動画、アバター生成を、競争力のある利用単位ごとの価格で提供しています。
