Loading...Working on your request
Google 模型 · 香港版

Gemini 2.5 Flash

香港團隊可用的 NextModel 目錄中的 Google 模型,常用於 長文件摘要、圖像問答、快速多模態路由 工作負載。當前展示價格為輸入 $0.3 / 1M tokens、輸出 $2.50 / 1M tokens 每 100 萬 token,上下文視窗為 1M token。

GoogleOpenRouter if available目錄
Tool callingVisionJSON modeLong contextStreamingLow cost
輸入價格$0.3 / 1M tokens
輸出價格$2.50 / 1M tokens
上下文長度1M token
最大輸出8.2k token

Gemini 2.5 Flash 在 NextModel 中是什麼?

香港團隊可用的 NextModel 目錄中的 Google 模型,常用於 長文件摘要、圖像問答、快速多模態路由 工作負載。當前展示價格為輸入 $0.3 / 1M tokens、輸出 $2.50 / 1M tokens 每 100 萬 token,上下文視窗為 1M token。

適用場景

  • 長文件摘要
  • 圖像問答
  • 快速多模態路由

OpenAI 相容呼叫範例

保持 OpenAI SDK 呼叫方式不變,把 base_url 改為 NextModel,並使用模型目錄 ID gemini-2-5-flash。

Python
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.nextmodel.app/v1"
)

resp = client.chat.completions.create(
    model="gemini-2-5-flash",
    messages=[{"role": "user", "content": "Hello from NextModel"}]
)

print(resp.choices[0].message.content)

相似替代項

OpenRouter目錄

GPT-4o mini 是成熟的低成本多模態選項,適合已經使用 OpenAI 相容 SDK、又需要兼顧價格與能力的團隊。

$0.15 / 1M tokens輸入$0.6 / 1M tokens輸出128k上下文
適用場景低成本聊天, 圖像理解, 分類
路由已設定
工具呼叫視覺JSON 模式長上下文
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Google目錄

Gemini 2.5 Pro 是長上下文與多模態能力都很強的候選,適合同時比較品質、上下文長度與視覺能力的團隊。

$1.25 / 1M tokens輸入$10 / 1M tokens輸出1M上下文
適用場景長上下文分析, 視覺工作流, 科學推理
路由已設定
工具呼叫視覺JSON 模式長上下文
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情
Moonshot AI目錄

Kimi K2.6 是面向長上下文中文場景的模型候選,適合文件密集型團隊在成本、上下文長度與國內模型覆蓋之間做權衡。

$0.73 / 1M tokens輸入$3.49 / 1M tokens輸出262.1k上下文
適用場景長篇中文文件, 合約審查, 知識庫問答
路由已設定
JSON 模式長上下文串流輸出工具呼叫
OpenRouter(可用時)OpenRouter 公開 Models API 的即時中繼資料;公開價格來自註冊表定價規則。
查看詳情

常見問題

Google: Gemini 2.5 Flash API 常見問題

Is Gemini 2.5 Flash a low-cost vision option?

Yes. It is categorized as a low-cost multimodal candidate with a large context window.