按量付费
模型费率从每个模型的输入 / 输出 token 单价开始。
- 无需大额预付合同
- 上线前先估算
- 兼容 OpenAI 请求格式
按量付费
模型费率从每个模型的输入 / 输出 token 单价开始。
额度
预付余额让实验阶段和小团队的花费更可预测。
团队
治理型用量为生产团队管理项目、密钥、预算和模型策略。
BYOK
使用你自己的密钥把已有提供方账号接入统一的比较与治理层。
企业版
定制为高流量或强治理负载提供定制商业条款。
计算器
这个值适合做上线前估算。最终计费仍应以提供方用量和平台用量记录为准。
成本 = 请求次数 x ((输入 token x 输入单价) + (输出 token x 输出单价)) / 1,000,000。
Doubao Seed 2.0 Mini 默认在 1M 输入 + 1M 输出时的估算为 ¥2.20。
Estimate monthly spend from model price, tokens, and request volume.
低成本参考
价格只是一个维度。在生产使用前,还应结合上下文长度、能力、来源标签和目标场景一起判断。
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | Chinese Q&A, low-cost general chat | 900-2600ms | Production | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
计算器会用输入 token 和输出 token 分别乘以模型的每百万 token 单价,再乘以请求次数。
是。¥0.20 输入加 ¥2.00 输出,等于该单次 1M + 1M 请求的估算总价 ¥2.20。
可以。BYOK 方案就是为已有提供方账号、但需要统一策略和用量报表的团队设计的。
企业方案可以围绕流量规模、提供方组合、区域、支持要求和治理需求单独协商。