Claude Opus 4.7 是高階推理與長上下文候選,適合把品質優先於最低 token 成本的團隊。
13 / 13 個模型
附帶來源標籤與可複製 OpenAI 相容呼叫的模型卡片。
你可以在這裡比較什麼?
NextModel 市集會比較模型提供方、輸入價格、輸出價格、上下文長度、延遲估算、能力、使用場景、可用性、路由狀態與來源標籤,方便香港團隊在接入生產流量前先篩選候選模型。
Claude Sonnet 4.5 是面向程式碼、Agent 工作流、長上下文分析與複雜指令跟隨的高品質選擇。
Gemini 2.5 Pro 是長上下文與多模態能力都很強的候選,適合同時比較品質、上下文長度與視覺能力的團隊。
DeepSeek R1 是偏推理的候選,常用於中文推理、數學、分析,以及對成本敏感但仍重視品質的工作流。
Doubao Seed 2.0 Mini 是目前透過 NextModel 公開閘道提供的最低成本生產模型。它很適合作為中文問答、分類、摘要與輕量多模態任務的預設選擇。
DeepSeek V4 Flash 是長上下文、低成本候選,適合需要中文能力與批量友善定價的團隊。
Qwen3 Coder Plus 是面向編碼的模型候選,適合需要中文工程工作流與長上下文程式碼輔助的團隊。
Gemini 2.5 Flash 是更低成本的長上下文與視覺候選,適合需要多模態覆蓋、但不想總是使用高價模型的團隊。
Qwen3 Max 是通用的高能力中文模型候選,適合在國內外提供方之間做比較的團隊。
GPT-4o mini 是成熟的低成本多模態選項,適合已經使用 OpenAI 相容 SDK、又需要兼顧價格與能力的團隊。
Kimi K2.6 是面向長上下文中文場景的模型候選,適合文件密集型團隊在成本、上下文長度與國內模型覆蓋之間做權衡。
Llama 4 Maverick 是低成本開源模型候選,適合想要長上下文與提供方選擇空間的團隊。
Mistral Small 3.2 是低成本多語言候選,適合分類、翻譯與短文本工作流。
決策表
一眼比較價格、上下文、能力、狀態與來源。
當你在縮小生產測試、成本估算或提供方策略決策的候選名單時,可以使用這張表。
| 模型 | 提供方 | 輸入 | 輸出 | 上下文 | 能力 | 適用場景 | 延遲 | 狀態 | 來源 |
|---|---|---|---|---|---|---|---|---|---|
| Anthropic: Claude Opus 4.7anthropic/claude-opus-4.7 | Anthropic | $5 / 1M tokens | $25 / 1M tokens | 1M | 工具呼叫JSON 模式長上下文推理 | 前沿推理, 大型程式碼庫審查 | 2300-6800ms | 目錄 | OpenRouter(可用時) |
| Anthropic: Claude Sonnet 4.5anthropic/claude-sonnet-4.5 | Anthropic | $3 / 1M tokens | $15 / 1M tokens | 1M | 工具呼叫JSON 模式長上下文推理 | 編碼 Agent, 程式碼審查 | 1600-4800ms | 目錄 | OpenRouter(可用時) |
| Google: Gemini 2.5 Progoogle/gemini-2.5-pro | $1.25 / 1M tokens | $10 / 1M tokens | 1M | 工具呼叫視覺JSON 模式長上下文 | 長上下文分析, 視覺工作流 | 1500-5000ms | 目錄 | OpenRouter(可用時) | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON 模式長上下文推理串流輸出 | 中文推理, 數學 | 1800-6000ms | 目錄 | OpenRouter(可用時) |
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | 串流輸出JSON 模式 | Coding | 900-2600ms | 目錄 | 平台整理 |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | 工具呼叫JSON 模式長上下文推理 | 低成本中文任務, 長上下文摘要 | 800-2600ms | 目錄 | OpenRouter(可用時) |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | 工具呼叫JSON 模式長上下文串流輸出 | 中文工程工作流, 程式碼生成 | 1200-3900ms | 目錄 | OpenRouter(可用時) |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | 工具呼叫視覺JSON 模式長上下文 | 長文件摘要, 圖像問答 | 900-2800ms | 目錄 | OpenRouter(可用時) | |
| Qwen: Qwen3 Maxqwen/qwen3-max | Alibaba Cloud / Qwen | $0.78 / 1M tokens | $3.90 / 1M tokens | 262.1k | 工具呼叫JSON 模式長上下文推理 | 中文 Agent 工作流, 商業分析 | 1300-4200ms | 目錄 | OpenRouter(可用時) |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | 工具呼叫視覺JSON 模式長上下文 | 低成本聊天, 圖像理解 | 800-2400ms | 目錄 | OpenRouter(可用時) |
| MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6 | Moonshot AI | $0.73 / 1M tokens | $3.49 / 1M tokens | 262.1k | JSON 模式長上下文串流輸出工具呼叫 | 長篇中文文件, 合約審查 | 1400-4400ms | 目錄 | OpenRouter(可用時) |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON 模式長上下文串流輸出低成本 | 開源模型工作流, 成本敏感型長上下文 | 950-2800ms | 目錄 | OpenRouter(可用時) |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | 工具呼叫JSON 模式串流輸出低成本 | 翻譯, 分類 | 700-2300ms | 目錄 | OpenRouter(可用時) |