模型市場

13 個模型，一個端點。

精選模型記錄已接入公開市場，並帶有價格、上下文、能力、路由狀態和來源標籤。先篩選工作負載，再把候選模型接入同一個 OpenAI 相容端點。

模型 API 文件成本估算

路由候選13/13

Claude Opus 4.7$5/1M

Claude Sonnet 4.5$3/1M

Gemini 2.5 Pro$1.25/1M

R1$0.7/1M

9提供方2來源標籤1M最長上下文¥0.2最低輸入價

13 / 13 個模型

附帶來源標籤與可複製 OpenAI 相容呼叫的模型卡片。

你可以在這裡比較什麼？

NextModel 市集會比較模型提供方、輸入價格、輸出價格、上下文長度、延遲估算、能力、使用場景、可用性、路由狀態與來源標籤，方便香港團隊在接入生產流量前先篩選候選模型。

Anthropic目錄

Anthropic: Claude Opus 4.7

Claude Opus 4.7 是高階推理與長上下文候選，適合把品質優先於最低 token 成本的團隊。

$5 / 1M tokens輸入$25 / 1M tokens輸出1M上下文

適用場景前沿推理, 大型程式碼庫審查, 策略分析

路由已設定

工具呼叫JSON 模式長上下文推理串流輸出視覺

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Anthropic目錄

Anthropic: Claude Sonnet 4.5

Claude Sonnet 4.5 是面向程式碼、Agent 工作流、長上下文分析與複雜指令跟隨的高品質選擇。

$3 / 1M tokens輸入$15 / 1M tokens輸出1M上下文

適用場景編碼 Agent, 程式碼審查, 複雜寫作

路由已設定

工具呼叫JSON 模式長上下文推理串流輸出視覺

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Google目錄

Google: Gemini 2.5 Pro

Gemini 2.5 Pro 是長上下文與多模態能力都很強的候選，適合同時比較品質、上下文長度與視覺能力的團隊。

$1.25 / 1M tokens輸入$10 / 1M tokens輸出1M上下文

適用場景長上下文分析, 視覺工作流, 科學推理

路由已設定

工具呼叫視覺JSON 模式長上下文推理串流輸出

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

DeepSeek目錄

DeepSeek: R1

DeepSeek R1 是偏推理的候選，常用於中文推理、數學、分析，以及對成本敏感但仍重視品質的工作流。

$0.7 / 1M tokens輸入$2.50 / 1M tokens輸出163.8k上下文

適用場景中文推理, 數學, 分析

路由已設定

JSON 模式長上下文推理串流輸出工具呼叫

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Volcengine目錄

Doubao Seed 2.0 Mini

Doubao Seed 2.0 Mini 是目前透過 NextModel 公開閘道提供的最低成本生產模型。它很適合作為中文問答、分類、摘要與輕量多模態任務的預設選擇。

¥0.2 / 1M tokens輸入¥2 / 1M tokens輸出128k上下文

適用場景Coding

路由已設定

串流輸出JSON 模式

平台整理NextModel 管理端發布的目錄版本；僅公開中繼資料，即時路由由其他層管理。

查看詳情

DeepSeek目錄

DeepSeek: DeepSeek V4 Flash

DeepSeek V4 Flash 是長上下文、低成本候選，適合需要中文能力與批量友善定價的團隊。

$0.112 / 1M tokens輸入$0.224 / 1M tokens輸出1M上下文

適用場景低成本中文任務, 長上下文摘要, 批次程式碼輔助

路由已設定

工具呼叫JSON 模式長上下文推理低成本

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Alibaba Cloud / Qwen目錄

Qwen: Qwen3 Coder Plus

Qwen3 Coder Plus 是面向編碼的模型候選，適合需要中文工程工作流與長上下文程式碼輔助的團隊。

$0.65 / 1M tokens輸入$3.25 / 1M tokens輸出1M上下文

適用場景中文工程工作流, 程式碼生成, 程式碼庫問答

路由已設定

工具呼叫JSON 模式長上下文串流輸出

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Google目錄

Google: Gemini 2.5 Flash

Gemini 2.5 Flash 是更低成本的長上下文與視覺候選，適合需要多模態覆蓋、但不想總是使用高價模型的團隊。

$0.3 / 1M tokens輸入$2.50 / 1M tokens輸出1M上下文

適用場景長文件摘要, 圖像問答, 快速多模態路由

路由已設定

工具呼叫視覺JSON 模式長上下文串流輸出低成本

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Alibaba Cloud / Qwen目錄

Qwen: Qwen3 Max

Qwen3 Max 是通用的高能力中文模型候選，適合在國內外提供方之間做比較的團隊。

$0.78 / 1M tokens輸入$3.90 / 1M tokens輸出262.1k上下文

適用場景中文 Agent 工作流, 商業分析, 結構化輸出

路由已設定

工具呼叫JSON 模式長上下文推理串流輸出

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

OpenRouter目錄

OpenAI: GPT-4o-mini

GPT-4o mini 是成熟的低成本多模態選項，適合已經使用 OpenAI 相容 SDK、又需要兼顧價格與能力的團隊。

$0.15 / 1M tokens輸入$0.6 / 1M tokens輸出128k上下文

適用場景低成本聊天, 圖像理解, 分類

路由已設定

工具呼叫視覺JSON 模式長上下文串流輸出低成本

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Moonshot AI目錄

MoonshotAI: Kimi K2.6

Kimi K2.6 是面向長上下文中文場景的模型候選，適合文件密集型團隊在成本、上下文長度與國內模型覆蓋之間做權衡。

$0.73 / 1M tokens輸入$3.49 / 1M tokens輸出262.1k上下文

適用場景長篇中文文件, 合約審查, 知識庫問答

路由已設定

JSON 模式長上下文串流輸出工具呼叫視覺

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Meta目錄

Meta: Llama 4 Maverick

Llama 4 Maverick 是低成本開源模型候選，適合想要長上下文與提供方選擇空間的團隊。

$0.15 / 1M tokens輸入$0.6 / 1M tokens輸出1M上下文

適用場景開源模型工作流, 成本敏感型長上下文, 分類

路由已設定

JSON 模式長上下文串流輸出低成本工具呼叫視覺

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

Mistral AI目錄

Mistral: Mistral Small 3.2 24B

Mistral Small 3.2 是低成本多語言候選，適合分類、翻譯與短文本工作流。

$0.1 / 1M tokens輸入$0.3 / 1M tokens輸出128k上下文

適用場景翻譯, 分類, 短文摘要

路由已設定

工具呼叫JSON 模式串流輸出低成本視覺長上下文

OpenRouter（可用時）OpenRouter 公開 Models API 的即時中繼資料；公開價格來自註冊表定價規則。

查看詳情

決策表

一眼比較價格、上下文、能力、狀態與來源。

當你在縮小生產測試、成本估算或提供方策略決策的候選名單時，可以使用這張表。

模型	提供方	輸入	輸出	上下文	能力	適用場景	延遲	狀態	來源
Anthropic: Claude Opus 4.7anthropic/claude-opus-4.7	Anthropic	$5 / 1M tokens	$25 / 1M tokens	1M	工具呼叫JSON 模式長上下文推理	前沿推理, 大型程式碼庫審查	2300-6800ms	目錄	OpenRouter（可用時）
Anthropic: Claude Sonnet 4.5anthropic/claude-sonnet-4.5	Anthropic	$3 / 1M tokens	$15 / 1M tokens	1M	工具呼叫JSON 模式長上下文推理	編碼 Agent, 程式碼審查	1600-4800ms	目錄	OpenRouter（可用時）
Google: Gemini 2.5 Progoogle/gemini-2.5-pro	Google	$1.25 / 1M tokens	$10 / 1M tokens	1M	工具呼叫視覺JSON 模式長上下文	長上下文分析, 視覺工作流	1500-5000ms	目錄	OpenRouter（可用時）
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON 模式長上下文推理串流輸出	中文推理, 數學	1800-6000ms	目錄	OpenRouter（可用時）
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	串流輸出JSON 模式	Coding	900-2600ms	目錄	平台整理
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	工具呼叫JSON 模式長上下文推理	低成本中文任務, 長上下文摘要	800-2600ms	目錄	OpenRouter（可用時）
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	工具呼叫JSON 模式長上下文串流輸出	中文工程工作流, 程式碼生成	1200-3900ms	目錄	OpenRouter（可用時）
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	工具呼叫視覺JSON 模式長上下文	長文件摘要, 圖像問答	900-2800ms	目錄	OpenRouter（可用時）
Qwen: Qwen3 Maxqwen/qwen3-max	Alibaba Cloud / Qwen	$0.78 / 1M tokens	$3.90 / 1M tokens	262.1k	工具呼叫JSON 模式長上下文推理	中文 Agent 工作流, 商業分析	1300-4200ms	目錄	OpenRouter（可用時）
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	工具呼叫視覺JSON 模式長上下文	低成本聊天, 圖像理解	800-2400ms	目錄	OpenRouter（可用時）
MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6	Moonshot AI	$0.73 / 1M tokens	$3.49 / 1M tokens	262.1k	JSON 模式長上下文串流輸出工具呼叫	長篇中文文件, 合約審查	1400-4400ms	目錄	OpenRouter（可用時）
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON 模式長上下文串流輸出低成本	開源模型工作流, 成本敏感型長上下文	950-2800ms	目錄	OpenRouter（可用時）
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	工具呼叫JSON 模式串流輸出低成本	翻譯, 分類	700-2300ms	目錄	OpenRouter（可用時）