/ pricing

按实际使用付费。

比较模型费率,估算 token 成本,选择按量付费或预付额度,并在用量增长时加入团队治理。

按量付费

模型费率

从每个模型的输入 / 输出 token 单价开始。

  • 无需大额预付合同
  • 上线前先估算
  • 兼容 OpenAI 请求格式
Start building

额度

预付余额

让实验阶段和小团队的花费更可预测。

  • 项目级预算
  • 便于导出用量
  • 适合试点和 QA
Start building

团队

治理型用量

为生产团队管理项目、密钥、预算和模型策略。

  • 按项目和密钥看花费
  • 预算控制
  • 团队报表
Start building

BYOK

使用你自己的密钥

把已有提供方账号接入统一的比较与治理层。

  • 提供方密钥由你掌控
  • 统一模型目录
  • 可接策略路由
查看认证文档

企业版

定制

为高流量或强治理负载提供定制商业条款。

  • 容量规划
  • 提供方组合设计
  • 支持与上线评审
查看计费文档

计算器

模型、输入 token、输出 token、请求次数和月度估算。

这个值适合做上线前估算。最终计费仍应以提供方用量和平台用量记录为准。

估算公式

成本 = 请求次数 x ((输入 token x 输入单价) + (输出 token x 输出单价)) / 1,000,000。

Doubao Seed 2.0 Mini 默认在 1M 输入 + 1M 输出时的估算为 ¥2.20

Price calculator

Estimate monthly spend from model price, tokens, and request volume.

Monthly estimate¥1.80Doubao Seed 2.0 Mini · input 0.2/1M · output 2/1M

想先估算 API 节省空间?

在生产启用缓存策略之前先运行 CacheSafety Bench。Bad Hit Rate 比单纯命中率更关键。

运行 CacheSafety Bench

低成本参考

正式导流前,先比较低成本模型候选。

价格只是一个维度。在生产使用前,还应结合上下文长度、能力、来源标签和目标场景一起判断。

ModelProviderInputOutputContextCapabilitiesBest forLatencyStatusSource
Doubao Seed 2.0 Minidoubao-seed-2-0-miniVolcengine¥0.2 / 1M tokens¥2 / 1M tokens128k
Tool callingVisionJSON modeLong context
Chinese Q&A, low-cost general chat900-2600msProductionPlatform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
Tool callingJSON modeLong contextReasoning
low-cost Chinese tasks, long-context summary800-2600msCatalogOpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
Tool callingJSON modeStreamingLow cost
translation, classification700-2300msCatalogOpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
Tool callingVisionJSON modeLong context
low-cost chat, image understanding800-2400msCatalogOpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON modeLong contextStreamingLow cost
open-model workflows, cost-sensitive long context950-2800msCatalogOpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
Tool callingVisionJSON modeLong context
long-document summarization, image Q&A900-2800msCatalogOpenRouter if available
DeepSeek: R1deepseek/deepseek-r1DeepSeek$0.7 / 1M tokens$2.50 / 1M tokens163.8k
JSON modeLong contextReasoningStreaming
Chinese reasoning, math1800-6000msCatalogOpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plusAlibaba Cloud / Qwen$0.65 / 1M tokens$3.25 / 1M tokens1M
Tool callingJSON modeLong contextStreaming
Chinese engineering workflows, code generation1200-3900msCatalogOpenRouter if available

FAQ

开发者团队常见定价问题

成本如何估算?

计算器会用输入 token 和输出 token 分别乘以模型的每百万 token 单价,再乘以请求次数。

Doubao Seed 2.0 Mini 的 1M 输入加 1M 输出还是 ¥2.20 吗?

是。¥0.20 输入加 ¥2.00 输出,等于该单次 1M + 1M 请求的估算总价 ¥2.20。

团队可以使用已有的提供方密钥吗?

可以。BYOK 方案就是为已有提供方账号、但需要统一策略和用量报表的团队设计的。

有企业价格方案吗?

企业方案可以围绕流量规模、提供方组合、区域、支持要求和治理需求单独协商。