大模型成本计算器怎么用?
用平均输入 token × 输入单价、平均输出 token × 输出单价得到单次成本,再乘以月请求量,跨模型计算并加入缓存与批处理调整。
Estimate monthly LLM cost from token volume and per-model pricing before you ship.
大模型成本计算器根据请求量、平均输入/输出 token 和各模型单价,在上线前把月度大模型成本算清楚。它把提示词缓存、批处理折扣和流式开销纳入计算,让数字贴近真实流量。价格见 /pricing,接入方式见 /docs/openai-compatible。
輸入會在目前瀏覽器內處理;不要貼上真實 API key。
price_source_should_be_verified, model_not_marked_production
常見問題
用平均输入 token × 输入单价、平均输出 token × 输出单价得到单次成本,再乘以月请求量,跨模型计算并加入缓存与批处理调整。
在质量允许时路由更便宜的模型,缓存重复的输入前缀,并对非紧急任务做批处理。信任更低估算前先验证缓存假设。
通常是输出 token、流式开销和重试导致。导出账单用 AI API 账单分析器找出差距。
相關工具