NextModel 价格 - 按量付费、额度、BYOK、团队预算与计算器

按量计费

模型费率

从每个模型的输入 / 输出 token 单价开始。

无需大额预付合同
上线前先估算
兼容 OpenAI 请求格式

开始上手

额度

预充值余额

让实验阶段和小团队的成本更可预测。

项目级预算
便于导出用量
适合试点和 QA

开始上手

团队

团队用量管理

为生产团队管理项目、密钥、预算和模型策略。

按项目和密钥看成本
预算控制
团队报表

开始上手

BYOK

使用你自己的密钥

把已有提供方账号接入统一的比较与治理层。

提供方密钥由你掌控
统一模型目录
可接策略路由

查看认证文档

企业版

定制

为高流量或强治理负载提供定制商业条款。

容量规划
提供方组合设计
支持与上线评审

查看计费文档

计算器

输入 token、输出 token、请求次数和月度估算。

这个值适合做上线前估算。最终计费仍应以提供方用量和平台用量记录为准。

估算公式

成本 = 请求次数 × ((输入 token × 输入单价) + (输出 token × 输出单价)) / 1,000,000。

Doubao Seed 2.0 Mini 在 1M 输入 + 1M 输出时，估算约为 $0.318。

价格计算器

根据模型价格、token 数量和请求量估算月度花费。

模型

输入 token

输出 token

每月请求数

月度估算$0.26Doubao Seed 2.0 Mini · 输入 token 0.02893518518518519/1M · 输出 token 0.28935185185185186/1M

怎么估算 AI API 成本？

AI API 成本通常按请求次数、输入 token、输出 token 和模型每百万 token 单价计算。团队在生产导流前，最好分别算一遍低成本候选、高质量兜底模型和预期月请求量。

想先看看能省多少？

在生产启用缓存策略之前先运行 CacheSafety Bench。Bad Hit Rate 比单纯命中率更关键。

运行 CacheSafety Bench

低成本参考

正式导流前，先比较低成本模型候选。

价格只是一个维度。在生产使用前，还应结合上下文长度、能力、来源标签和目标场景一起判断。

模型	提供方	输入	输出	上下文	能力	适用场景	延迟	状态	来源
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	$0.029 / 1M tokens	$0.289 / 1M tokens	128k	工具调用视觉JSON 模式长上下文	中文问答, 低成本通用对话	900-2600ms	生产可用	平台整理
DeepSeek V4 Flashdeepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	128k	工具调用JSON 模式长上下文推理	低成本中文任务, 长上下文摘要	700-2200ms	目录	OpenRouter（可用时）
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	翻译, 分类	700-2300ms	目录	OpenRouter（可用时）
DeepSeek V4 Flashdeepseek-v4-flash	DeepSeek	$0.145 / 1M tokens	$0.289 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	high-volume chat, lightweight agent steps	700-2200ms	生产可用	平台整理
Doubao Seed 2.0 Litedoubao-seed-2-0-lite	Volcengine	$0.087 / 1M tokens	$0.521 / 1M tokens	256k	工具调用JSON 模式长上下文流式输出	high-volume chat, 分类	800-2600ms	生产可用	平台整理
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	工具调用视觉JSON 模式长上下文	低成本聊天, 图像理解	800-2400ms	目录	OpenRouter（可用时）
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON 模式长上下文流式输出低成本	开源模型工作流, 成本敏感型长上下文	950-2800ms	目录	OpenRouter（可用时）
MiniMax M2.7minimax-m2-7	MiniMax	$0.243 / 1M tokens	$0.975 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	high-volume chat, agentic tool use	900-2800ms	生产可用	平台整理

常见问题

产品和平台团队常见定价问题

成本如何估算？

计算器会用输入 token 和输出 token 分别乘以模型的每百万 token 单价，再乘以请求次数。

Doubao Seed 2.0 Mini 跑一轮 1M 输入加 1M 输出大概多少钱？

约 $0.318。也就是 $0.029 输入加 $0.289 输出，按这一轮 1M + 1M 请求来估算。

团队可以使用已有的提供方密钥吗？

可以。BYOK 方案就是为已有提供方账号、但需要统一策略和用量报表的团队设计的。

有企业价格方案吗？

企业方案可以围绕流量规模、提供方组合、区域、支持要求和治理需求单独协商。

模型市场快速开始低价 LLM API 榜单

按真实用量付费。

输入 token、输出 token、请求次数和月度估算。

估算公式

价格计算器

怎么估算 AI API 成本？

想先看看能省多少？

正式导流前，先比较低成本模型候选。

产品和平台团队常见定价问题

成本如何估算？

Doubao Seed 2.0 Mini 跑一轮 1M 输入加 1M 输出大概多少钱？

团队可以使用已有的提供方密钥吗？

有企业价格方案吗？