20社のプロバイダーから1187モデルの料金を比較
| 比較 | プロバイダー | モデル | 入力料金 | 出力料金 |
|---|---|---|---|---|
| Anthropic | ¥128 | ¥639 | ||
| Anthropic | ¥160 | ¥799 | ||
| Anthropic | ¥2396 | ¥11981 | ||
| Anthropic | ¥2396 | ¥11981 | ||
| Anthropic | ¥799 | ¥3994 | ||
| Anthropic | ¥799 | ¥3994 | ||
| Anthropic | ¥799 | ¥3994 | ||
| Anthropic | ¥799 | ¥3994 | ||
| Anthropic | ¥479 | ¥2396 | ||
| Anthropic | ¥479 | ¥2396 | ||
| Anthropic | ¥479 | ¥2396 | ||
| AWS Bedrock | ¥48 | — | ||
| AWS Bedrock | ¥48 | — | ||
| AWS Bedrock | ¥200 | — | ||
| AWS Bedrock | ¥479 | — | ||
| AWS Bedrock | ¥48 | — | ||
| AWS Bedrock | ¥6/枚 | — | ||
| AWS Bedrock | ¥10 | — | ||
| AWS Bedrock | ¥6 | — | ||
| AWS Bedrock | ¥11 {priceOf!bedrock/bedrock!fWTU_nxHvSmnGvjH1erX6tTZZ— | — | ||
| AWS Bedrock | ¥22 {priceOf!bedrock/bedrock!Zfo8texvBEL9ZYfvvuztxH_ja— | — | ||
| AWS Bedrock | ¥399 | — | ||
| AWS Bedrock | ¥128 | — | ||
| AWS Bedrock | ¥160 | — | ||
| AWS Bedrock | ¥13/動画 | — | ||
| AWS Bedrock | ¥543 | — | ||
| AWS Bedrock | ¥0.8/枚 | — | ||
| AWS Bedrock | ¥1/枚 | — | ||
| AWS Bedrock | ¥1/枚 | — | ||
| AWS Bedrock | ¥0.03/枚 | — | ||
| AWS Bedrock | ¥16 | — | ||
| AWS Bedrock | ¥3 | — | ||
| AWS Bedrock | ¥32 | — | ||
| AWS Bedrock | ¥24 | — | ||
| AWS Bedrock | ¥80 | — | ||
| AWS Bedrock | ¥1278 | ¥3834 | ||
| AWS Bedrock | ¥1278 | ¥3834 | ||
| AWS Bedrock | ¥40 | ¥200 | ||
| AWS Bedrock | ¥2396 | ¥11981 | ||
| AWS Bedrock | ¥479 | ¥2396 | ||
| AWS Bedrock | ¥128 | ¥639 | ||
| AWS Bedrock | ¥479 | ¥2396 | ||
| AWS Bedrock | ¥959 | ¥4793 | ||
| AWS Bedrock | ¥479 | ¥2396 | ||
| AWS Bedrock | ¥959 | ¥4793 | ||
| AWS Bedrock | ¥479 | ¥2396 | ||
| AWS Bedrock | ¥176 | ¥879 | ||
| AWS Bedrock | ¥160 | ¥799 | ||
| AWS Bedrock | ¥128 | ¥383 | ||
| AWS Bedrock | ¥2396 | ¥11981 |
100万トークンあたり · 日本円 · 出典: 公式料金ページ
Mistral OCR (25.05)(Google Vertex AI)が現在、テキスト生成で100万トークンあたり$0.0005という最安の入力料金を提供しています。
Meta: Llama 4 Scout(OpenRouter)が、追跡中のモデルの中で最大の10Mのコンテキストウィンドウに対応しています。
ほとんどのLLM APIは、入力トークン(プロンプトと会話履歴)と出力トークン(モデルの応答)に対して別々に課金します。出力トークンは通常、入力トークンの2〜5倍の料金です。多くのプロバイダーは、割引されたバッチ料金、繰り返しのプレフィックスに対するプロンプトキャッシュ、ロングコンテキストリクエストへの追加料金も提供しています。
LLMRates.aiはAnthropic, Google, OpenAI, AWS Bedrock, Azure AI, Cohere, Cursor, DeepSeekなどのモデルを追跡しており、米国・中国両方のAIプロバイダーをカバーしています。
料金は公式プロバイダーの料金ページから直接スクレイピングし、毎日更新しています。大きな料金変更は通常24時間以内に反映されます。
プロンプトキャッシュは、システムプロンプトや大きなドキュメントなど、繰り返されるプロンプトのプレフィックスを保存し、モデルがリクエストごとに再処理しないようにします。AnthropicやGoogleなどのプロバイダーは、キャッシュされた入力トークンを標準入力料金から70〜90%割引で提供しており、本番アプリケーションにおける重要なコスト削減手段となります。
gpt-realtime-1.5(OpenAI)は、100万入力トークンあたり$32、100万出力トークンあたり$64です。
Claude Sonnet 4.6(Anthropic)は、100万入力トークンあたり$3、100万出力トークンあたり$15です。
Gemini 3.5 Flash(Google)は、100万入力トークンあたり$1.5、100万出力トークンあたり$9です。
入力料金(USD、標準ティア、100万トークンあたり)で最も手頃な人気モデル:
AIエージェントは複数ステップのループで動作し、各イテレーションで蓄積された会話履歴、ツール結果、計画を再送信するため、トークンコストが急速に膨らみます。入力料金が低く、ツール/関数呼び出しのサポートが強力なモデルを優先しましょう。プロンプトキャッシュ(Anthropic、Google)は、繰り返しのコンテキストでコストを70〜90%削減できます。ツールサポートが充実した手頃なモデル:
glm-4.5, glm-4.5-air, glm-4.6, glm-4.7などの推論モデルは、応答する前に内部で連鎖的思考(chain-of-thought)を行います。推論トークンのための追加計算により、標準モデルの5〜20倍の料金が設定されるのが一般的です。一部のプロバイダーは、推論プロセス中に生成される思考トークンに対して別料金を課します。