Google 模型

Gemini 2.5 Flash

Gemini 2.5 Flash 是更低成本的长上下文和视觉候选，适合需要多模态覆盖、但不希望总是使用高价模型的团队。

阅读快速开始成本估算

GoogleOpenRouter（可用时）目录

工具调用视觉JSON 模式长上下文流式输出低成本

输入价格$0.3 / 1M tokens

输出价格$2.50 / 1M tokens

上下文长度1M 令牌

最大输出8.2k 令牌

Google: Gemini 2.5 Flash 在 NextModel 中是什么？

Google: Gemini 2.5 Flash 是 NextModel 目录中的 Google 模型，常用于长文档摘要、图像问答、快速多模态路由工作负载。当前展示价格为输入 $0.3 / 1M tokens、输出 $2.50 / 1M tokens 每 100 万 token，上下文窗口为 1M token。

适用场景

长文档摘要
图像问答
快速多模态路由

OpenAI 兼容调用示例

保持 OpenAI SDK 调用方式不变，把 base_url 改为 NextModel，并使用模型目录 ID gemini-2-5-flash。

Python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.nextmodel.app/v1"
)

resp = client.chat.completions.create(
    model="gemini-2-5-flash",
    messages=[{"role": "user", "content": "Hello from NextModel"}]
)

print(resp.choices[0].message.content)

相似替代项

Volcengine生产可用

Doubao Seed 2.0 Mini

Doubao Seed 2.0 Mini 是目前通过 NextModel 公共网关暴露的最低成本生产模型。它适合作为中文问答、分类、摘要和轻量多模态任务的默认选择。

Starting at $0.029 / 1M tokens输入Starting at $0.289 / 1M tokens输出128k上下文

适用场景中文问答, 低成本通用对话, 多模态理解

路由已配置

工具调用视觉JSON 模式长上下文

平台整理NextModel 生产接入配置与 Volcengine 定价配置

查看详情

OpenRouter目录

OpenAI: GPT-4o-mini

GPT-4o mini 是一个成熟的低成本多模态选项，适合已经使用 OpenAI 兼容 SDK、并需要一个兼顾价格与能力的默认模型的团队。

$0.15 / 1M tokens输入$0.6 / 1M tokens输出128k上下文

适用场景低成本聊天, 图像理解, 分类

路由已配置

工具调用视觉JSON 模式长上下文

OpenRouter（可用时）OpenRouter 公开 Models API 的实时元数据；公开价格来自注册表价格规则。

查看详情

Google目录

Google: Gemini 2.5 Pro

Gemini 2.5 Pro 是长上下文和多模态能力都很强的候选，适合同时比较质量、上下文长度和视觉能力的团队。

$1.25 / 1M tokens输入$10 / 1M tokens输出1M上下文

适用场景长上下文分析, 视觉工作流, 科学推理

路由已配置

工具调用视觉JSON 模式长上下文

OpenRouter（可用时）OpenRouter 公开 Models API 的实时元数据；公开价格来自注册表价格规则。

查看详情

对比 Google: Gemini 2.5 Flash

Google: Gemini 2.5 Flash 对比 Doubao Seed 2.0 Mini Google: Gemini 2.5 Flash 对比 OpenAI: GPT-4o-mini Google: Gemini 2.5 Flash 对比 Google: Gemini 2.5 Pro Google: Gemini 2.5 Flash 对比 Meta: Llama 4 Maverick Google: Gemini 2.5 Flash 对比 Doubao Seed 2.0 Pro

常见问题

Google: Gemini 2.5 Flash API 常见问题

Gemini 2.5 Flash 是低成本视觉选项吗？

是。它被归类为低成本多模态候选，并且有很大的上下文窗口。