リリース前に AI API コストをどう見積もればよいですか?
平均 input token 数に input 単価、平均 output token 数に output 単価を掛け、それを月間リクエスト数に掛けます。この計算機はそれを複数モデルで行い、cache と batch の補正も加えます。
Estimate monthly LLM API cost across input, output, batch, and cache assumptions.
AI API cost calculator は、月間リクエスト数、平均 input/output token 数、モデルごとの単価から、出荷前に月次 LLM コストを見積もります。prompt caching、batch 割引、streaming も織り込み、ざっくり計算ではなく実トラフィックに近い数字を出せるようにします。
入力はこのブラウザ内で処理されます。実際の API key は貼り付けないでください。
price_source_should_be_verified, model_not_marked_production
FAQ
平均 input token 数に input 単価、平均 output token 数に output 単価を掛け、それを月間リクエスト数に掛けます。この計算機はそれを複数モデルで行い、cache と batch の補正も加えます。
はい。繰り返し使われる input prefix は cache でき、input コストを削減できます。この計算機は保守的な cache 割引を適用し、hit rate に応じて調整できます。先に cacheability checker で安全性を確認するのがおすすめです。
output token、streaming の上乗せ、retry が主な原因です。請求データを export して AI API bill analyzer にかけると差分を追えます。
関連ツール