模型短名单

适合成本敏感产品的低价 LLM API 模型

从输入价格、输出价格、上下文长度、能力、来源和生产适配度来比较低成本 LLM API 模型。

这个短名单适合什么决策？

挑选低价 LLM API 时，先看工作负载形状，而不是只看表面最低单价。对于分类、摘要、路由、客服草稿和批量转换等任务，更低成本的模型可以在不改变应用接口的情况下压低月度成本。对于最终回答、复杂推理或编码 Agent，团队应该把低价模型和更强的兜底模型一起做基准测试。NextModel 把价格、上下文、能力、提供方来源和代码示例放在同一处，方便开发者在上线前完成权衡。

来源基础：NextModel 精选目录、提供方公开定价，以及可用时的 OpenRouter 元数据。 · 更新于 2026-07-01

综合价格

按价格、提供方、上下文、能力和来源比较候选列表。

在收敛生产短名单、设计兜底策略或比较模型经济性时使用这张表。

模型	提供方	输入	输出	上下文	能力	适用场景	延迟	状态	来源
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	$0.029 / 1M tokens	$0.289 / 1M tokens	128k	工具调用视觉JSON 模式长上下文	中文问答, 低成本通用对话	900-2600ms	生产可用	平台整理
DeepSeek V4 Flashdeepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	128k	工具调用JSON 模式长上下文推理	低成本中文任务, 长上下文摘要	700-2200ms	目录	OpenRouter（可用时）
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	翻译, 分类	700-2300ms	目录	OpenRouter（可用时）
DeepSeek V4 Flashdeepseek-v4-flash	DeepSeek	$0.145 / 1M tokens	$0.289 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	high-volume chat, lightweight agent steps	700-2200ms	生产可用	平台整理
Doubao Seed 2.0 Litedoubao-seed-2-0-lite	Volcengine	$0.087 / 1M tokens	$0.521 / 1M tokens	256k	工具调用JSON 模式长上下文流式输出	high-volume chat, 分类	800-2600ms	生产可用	平台整理
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	工具调用视觉JSON 模式长上下文	低成本聊天, 图像理解	800-2400ms	目录	OpenRouter（可用时）
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON 模式长上下文流式输出低成本	开源模型工作流, 成本敏感型长上下文	950-2800ms	目录	OpenRouter（可用时）
MiniMax M2.7minimax-m2-7	MiniMax	$0.243 / 1M tokens	$0.975 / 1M tokens	128k	工具调用JSON 模式流式输出低成本	high-volume chat, agentic tool use	900-2800ms	生产可用	平台整理

常见问题

低价 LLM API 常见问题

目录里最便宜的模型是哪一个？

最便宜的选项取决于汇率和输出长度。Doubao Seed 2.0 Mini 是本目录中最低成本的 CNY 生产候选。

团队是否应该总是选最便宜的 LLM API？

不应该。低价模型适合可重复、低风险的工作；最终回答、复杂推理和编码 Agent 仍应与更强模型对比。

全部模型价格计算器查看 OpenAI 兼容快速开始

适合成本敏感产品的低价 LLM API 模型

这个短名单适合什么决策？

推荐的 低价 LLM API 候选

Doubao Seed 2.0 Mini

DeepSeek V4 Flash

Mistral: Mistral Small 3.2 24B

DeepSeek V4 Flash

按价格、提供方、上下文、能力和来源比较候选列表。

低价 LLM API 常见问题

目录里最便宜的模型是哪一个？

团队是否应该总是选最便宜的 LLM API？

推荐的低价 LLM API 候选