Loading...Working on your request
模型市場

13 個模型,一個端點。

精選模型記錄已接入公開市場,並帶有價格、上下文、能力、路由狀態和來源標籤。先篩選工作負載,再把候選模型接入同一個 OpenAI 相容端點。

路由候選13/13
Claude Opus 4.7$5/1M
Claude Sonnet 4.5$3/1M
Gemini 2.5 Pro$1.25/1M
R1$0.7/1M
9提供方2來源標籤1M最長上下文¥0.2最低輸入價
重設

13 / 13 個模型

附帶來源標籤與可複製 OpenAI 相容呼叫的模型卡片。

你可以在這裡比較什麼?

NextModel 市集會比較模型提供方、輸入價格、輸出價格、上下文長度、延遲估算、能力、使用場景、可用性、路由狀態與來源標籤,方便香港團隊在接入生產流量前先篩選候選模型。

Anthropic目錄

Claude Opus 4.7 是高階推理與長上下文候選,適合把品質優先於最低 token 成本的團隊。

$5 / 1M tokens輸入$25 / 1M tokens輸出1M上下文
適用場景前沿推理, 大型程式碼庫審查, 策略分析
路由已設定
工具呼叫JSON 模式長上下文推理串流輸出視覺
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Anthropic目錄

Claude Sonnet 4.5 是面向程式碼、Agent 工作流、長上下文分析與複雜指令跟隨的高品質選擇。

$3 / 1M tokens輸入$15 / 1M tokens輸出1M上下文
適用場景編碼 Agent, 程式碼審查, 複雜寫作
路由已設定
工具呼叫JSON 模式長上下文推理串流輸出視覺
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Google目錄

Gemini 2.5 Pro 是長上下文與多模態能力都很強的候選,適合同時比較品質、上下文長度與視覺能力的團隊。

$1.25 / 1M tokens輸入$10 / 1M tokens輸出1M上下文
適用場景長上下文分析, 視覺工作流, 科學推理
路由已設定
工具呼叫視覺JSON 模式長上下文推理串流輸出
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
DeepSeek目錄

DeepSeek R1 是偏推理的候選,常用於中文推理、數學、分析,以及對成本敏感但仍重視品質的工作流。

$0.7 / 1M tokens輸入$2.50 / 1M tokens輸出163.8k上下文
適用場景中文推理, 數學, 分析
路由已設定
JSON 模式長上下文推理串流輸出工具呼叫
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Volcengine目錄

Doubao Seed 2.0 Mini 是目前透過 NextModel 公開閘道提供的最低成本生產模型。它很適合作為中文問答、分類、摘要與輕量多模態任務的預設選擇。

¥0.2 / 1M tokens輸入¥2 / 1M tokens輸出128k上下文
適用場景Coding
路由已設定
串流輸出JSON 模式
平台整理NextModel 管理端發布的目錄版本;僅公開中繼資料,即時路由由其他層管理。
查看詳情
DeepSeek目錄

DeepSeek V4 Flash 是長上下文、低成本候選,適合需要中文能力與批量友善定價的團隊。

$0.112 / 1M tokens輸入$0.224 / 1M tokens輸出1M上下文
適用場景低成本中文任務, 長上下文摘要, 批次程式碼輔助
路由已設定
工具呼叫JSON 模式長上下文推理低成本
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Alibaba Cloud / Qwen目錄

Qwen3 Coder Plus 是面向編碼的模型候選,適合需要中文工程工作流與長上下文程式碼輔助的團隊。

$0.65 / 1M tokens輸入$3.25 / 1M tokens輸出1M上下文
適用場景中文工程工作流, 程式碼生成, 程式碼庫問答
路由已設定
工具呼叫JSON 模式長上下文串流輸出
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Google目錄

Gemini 2.5 Flash 是更低成本的長上下文與視覺候選,適合需要多模態覆蓋、但不想總是使用高價模型的團隊。

$0.3 / 1M tokens輸入$2.50 / 1M tokens輸出1M上下文
適用場景長文件摘要, 圖像問答, 快速多模態路由
路由已設定
工具呼叫視覺JSON 模式長上下文串流輸出低成本
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Alibaba Cloud / Qwen目錄

Qwen3 Max 是通用的高能力中文模型候選,適合在國內外提供方之間做比較的團隊。

$0.78 / 1M tokens輸入$3.90 / 1M tokens輸出262.1k上下文
適用場景中文 Agent 工作流, 商業分析, 結構化輸出
路由已設定
工具呼叫JSON 模式長上下文推理串流輸出
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
OpenRouter目錄

GPT-4o mini 是成熟的低成本多模態選項,適合已經使用 OpenAI 相容 SDK、又需要兼顧價格與能力的團隊。

$0.15 / 1M tokens輸入$0.6 / 1M tokens輸出128k上下文
適用場景低成本聊天, 圖像理解, 分類
路由已設定
工具呼叫視覺JSON 模式長上下文串流輸出低成本
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Moonshot AI目錄

Kimi K2.6 是面向長上下文中文場景的模型候選,適合文件密集型團隊在成本、上下文長度與國內模型覆蓋之間做權衡。

$0.73 / 1M tokens輸入$3.49 / 1M tokens輸出262.1k上下文
適用場景長篇中文文件, 合約審查, 知識庫問答
路由已設定
JSON 模式長上下文串流輸出工具呼叫視覺
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Meta目錄

Llama 4 Maverick 是低成本開源模型候選,適合想要長上下文與提供方選擇空間的團隊。

$0.15 / 1M tokens輸入$0.6 / 1M tokens輸出1M上下文
適用場景開源模型工作流, 成本敏感型長上下文, 分類
路由已設定
JSON 模式長上下文串流輸出低成本工具呼叫視覺
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Mistral AI目錄

Mistral Small 3.2 是低成本多語言候選,適合分類、翻譯與短文本工作流。

$0.1 / 1M tokens輸入$0.3 / 1M tokens輸出128k上下文
適用場景翻譯, 分類, 短文摘要
路由已設定
工具呼叫JSON 模式串流輸出低成本視覺長上下文
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情

決策表

一眼比較價格、上下文、能力、狀態與來源。

當你在縮小生產測試、成本估算或提供方策略決策的候選名單時,可以使用這張表。

模型提供方輸入輸出上下文能力適用場景延遲狀態來源
Anthropic: Claude Opus 4.7anthropic/claude-opus-4.7Anthropic$5 / 1M tokens$25 / 1M tokens1M
工具呼叫JSON 模式長上下文推理
前沿推理, 大型程式碼庫審查2300-6800ms目錄OpenRouter(可用時)
Anthropic: Claude Sonnet 4.5anthropic/claude-sonnet-4.5Anthropic$3 / 1M tokens$15 / 1M tokens1M
工具呼叫JSON 模式長上下文推理
編碼 Agent, 程式碼審查1600-4800ms目錄OpenRouter(可用時)
Google: Gemini 2.5 Progoogle/gemini-2.5-proGoogle$1.25 / 1M tokens$10 / 1M tokens1M
工具呼叫視覺JSON 模式長上下文
長上下文分析, 視覺工作流1500-5000ms目錄OpenRouter(可用時)
DeepSeek: R1deepseek/deepseek-r1DeepSeek$0.7 / 1M tokens$2.50 / 1M tokens163.8k
JSON 模式長上下文推理串流輸出
中文推理, 數學1800-6000ms目錄OpenRouter(可用時)
Doubao Seed 2.0 Minidoubao-seed-2-0-miniVolcengine¥0.2 / 1M tokens¥2 / 1M tokens128k
串流輸出JSON 模式
Coding900-2600ms目錄平台整理
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
工具呼叫JSON 模式長上下文推理
低成本中文任務, 長上下文摘要800-2600ms目錄OpenRouter(可用時)
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plusAlibaba Cloud / Qwen$0.65 / 1M tokens$3.25 / 1M tokens1M
工具呼叫JSON 模式長上下文串流輸出
中文工程工作流, 程式碼生成1200-3900ms目錄OpenRouter(可用時)
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
工具呼叫視覺JSON 模式長上下文
長文件摘要, 圖像問答900-2800ms目錄OpenRouter(可用時)
Qwen: Qwen3 Maxqwen/qwen3-maxAlibaba Cloud / Qwen$0.78 / 1M tokens$3.90 / 1M tokens262.1k
工具呼叫JSON 模式長上下文推理
中文 Agent 工作流, 商業分析1300-4200ms目錄OpenRouter(可用時)
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
工具呼叫視覺JSON 模式長上下文
低成本聊天, 圖像理解800-2400ms目錄OpenRouter(可用時)
MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6Moonshot AI$0.73 / 1M tokens$3.49 / 1M tokens262.1k
JSON 模式長上下文串流輸出工具呼叫
長篇中文文件, 合約審查1400-4400ms目錄OpenRouter(可用時)
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON 模式長上下文串流輸出低成本
開源模型工作流, 成本敏感型長上下文950-2800ms目錄OpenRouter(可用時)
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
工具呼叫JSON 模式串流輸出低成本
翻譯, 分類700-2300ms目錄OpenRouter(可用時)