従量課金
モデル料金モデルごとの入力・出力 token 単価から始めます。
- 大きな前払い契約は不要
- 本番前に見積もれる
- OpenAI 互換リクエストで使える
従量課金
モデル料金モデルごとの入力・出力 token 単価から始めます。
クレジット
前払い残高実験や小規模チームの支出を予測しやすくします。
チーム
統制された利用本番チーム向けにプロジェクト、キー、予算、モデル方針を管理します。
BYOK
自分のキーを使う既存のプロバイダー契約を一つの比較・統制レイヤーにまとめます。
エンタープライズ
個別見積もり大規模トラフィックや強い統制が必要なワークロード向けの個別条件です。
計算機
本番前の概算として使い、最終請求はプロバイダー利用記録とプラットフォーム記録で照合します。
コスト = リクエスト数 x ((入力 token x 入力単価) + (出力 token x 出力単価)) / 1,000,000。
Doubao Seed 2.0 Mini の 100 万入力 + 100 万出力の既定見積もりは ¥2.20.
モデル価格、トークン数、リクエスト量から月間コストを見積もります。
AI API コストは、リクエスト数に入力 token と出力 token を掛け、各モデルの 100 万 token あたりの公開価格を当てて見積もります。本番ルーティング前に、低コスト候補、品質重視のフォールバック候補、想定月間リクエスト量をそろえて計算するのが基本です。
本番でキャッシュ方針を有効にする前に CacheSafety Bench を実行してください。重要なのは生の hit rate ではなく Bad Hit Rate です。
CacheSafety Bench を実行低コストの参考
価格だけでなく、コンテキスト長、能力、ソース表示、想定用途まで見てから本番投入を判断します。
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
計算機では、入力 token と出力 token に選択モデルの 100 万 token あたりの価格を掛け、さらにリクエスト数を掛けて概算します。
はい。入力 ¥0.20 と出力 ¥2.00 を足すと、この 100 万 + 100 万の単体見積もりでは ¥2.20 になります。
はい。BYOK は既存のプロバイダー契約を持つチームが、統一されたポリシーと利用レポートを維持するための構成です。
あります。トラフィック量、プロバイダー構成、リージョン、サポート要件、統制要件に合わせて個別調整できます。