模型短名单

适合工具调用工作流的 Agent 模型 API

比较需要工具调用、JSON 模式、长上下文和预算策略的 Agent 工作流模型 API。

浏览模型成本估算

这个短名单适合什么决策？

Agent 工作流通常输出量更大，成本也可能迅速上升。团队应该先比较工具调用、JSON 支持、上下文长度、延迟和输出价格，再把 Agent 任务路由到某个模型。

来源基础：NextModel 的能力映射，以及可用时的支持参数元数据。 · 更新于 2026-07-01

匹配分

按价格、提供方、上下文、能力和来源比较候选列表。

在收敛生产短名单、设计兜底策略或比较模型经济性时使用这张表。

模型	提供方	输入	输出	上下文	能力	适用场景	延迟	状态	来源
Anthropic: Claude Opus 4.7anthropic/claude-opus-4.7	Anthropic	$5 / 1M tokens	$25 / 1M tokens	1M	工具调用JSON 模式长上下文推理	前沿推理, 大型代码库审查	2300-6800ms	目录	OpenRouter（可用时）
Anthropic: Claude Sonnet 4.5anthropic/claude-sonnet-4.5	Anthropic	$3 / 1M tokens	$15 / 1M tokens	1M	工具调用JSON 模式长上下文推理	编码 Agent, 代码审查	1600-4800ms	目录	OpenRouter（可用时）
Google: Gemini 2.5 Progoogle/gemini-2.5-pro	Google	$1.25 / 1M tokens	$10 / 1M tokens	1M	工具调用视觉JSON 模式长上下文	长上下文分析, 视觉工作流	1500-5000ms	目录	OpenRouter（可用时）
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	工具调用JSON 模式长上下文流式输出	中文工程工作流, 代码生成	1200-3900ms	目录	OpenRouter（可用时）
DeepSeek V4 Prodeepseek-v4-pro	DeepSeek	$1.74 / 1M tokens	$3.47 / 1M tokens	128k	工具调用JSON 模式流式输出推理	complex reasoning, agentic coding	1100-3400ms	生产可用	平台整理
Qwen: Qwen3 Maxqwen/qwen3-max	Alibaba Cloud / Qwen	$0.78 / 1M tokens	$3.90 / 1M tokens	262.1k	工具调用JSON 模式长上下文推理	中文 Agent 工作流, 商业分析	1300-4200ms	目录	OpenRouter（可用时）
Doubao Seed 2.0 Prodoubao-seed-2-0-pro	Volcengine	$0.463 / 1M tokens	$2.31 / 1M tokens	256k	工具调用视觉JSON 模式长上下文	general-purpose reasoning, multimodal analysis	1000-3200ms	生产可用	平台整理
Doubao Seed 2.0 Codedoubao-seed-2-0-code	Volcengine	$0.463 / 1M tokens	$2.31 / 1M tokens	256k	工具调用JSON 模式长上下文流式输出	agentic coding, repository-scale refactors	1000-3200ms	生产可用	平台整理

常见问题

Agent 模型常见问题

Agent 模型最重要的能力是什么？

工具调用、结构化 JSON 输出、长上下文和稳定的指令遵循最重要。

全部模型价格计算器查看 OpenAI 兼容快速开始

适合工具调用工作流的 Agent 模型 API

这个短名单适合什么决策？

推荐的 Agent 模型 候选

Anthropic: Claude Opus 4.7

Anthropic: Claude Sonnet 4.5

Google: Gemini 2.5 Pro

Qwen: Qwen3 Coder Plus

按价格、提供方、上下文、能力和来源比较候选列表。

Agent 模型 常见问题

Agent 模型最重要的能力是什么？

推荐的 Agent 模型候选

Agent 模型常见问题