Meta 模型

Llama 4 Maverick

Llama 4 Maverick 是低成本开源模型候选，适合想要长上下文和提供方选择空间的团队。

阅读快速开始成本估算

MetaOpenRouter（可用时）目录

JSON 模式长上下文流式输出低成本工具调用视觉

输入价格$0.15 / 1M tokens

输出价格$0.6 / 1M tokens

上下文长度1M 令牌

最大输出8.2k 令牌

Meta: Llama 4 Maverick 在 NextModel 中是什么？

Meta: Llama 4 Maverick 是 NextModel 目录中的 Meta 模型，常用于开源模型工作流、成本敏感型长上下文、分类工作负载。当前展示价格为输入 $0.15 / 1M tokens、输出 $0.6 / 1M tokens 每 100 万 token，上下文窗口为 1M token。

适用场景

开源模型工作流
成本敏感型长上下文
分类

OpenAI 兼容调用示例

保持 OpenAI SDK 调用方式不变，把 base_url 改为 NextModel，并使用模型目录 ID llama-4-maverick。

Python

from openai import OpenAI

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.nextmodel.app/v1"
)

resp = client.chat.completions.create(
    model="llama-4-maverick",
    messages=[{"role": "user", "content": "Hello from NextModel"}]
)

print(resp.choices[0].message.content)

相似替代项

Google目录

Google: Gemini 2.5 Flash

Gemini 2.5 Flash 是更低成本的长上下文和视觉候选，适合需要多模态覆盖、但不希望总是使用高价模型的团队。

$0.3 / 1M tokens输入$2.50 / 1M tokens输出1M上下文

适用场景长文档摘要, 图像问答, 快速多模态路由

路由已配置

工具调用视觉JSON 模式长上下文

OpenRouter（可用时）OpenRouter 公开 Models API 的实时元数据；公开价格来自注册表价格规则。

查看详情

Mistral AI目录

Mistral: Mistral Small 3.2 24B

Mistral Small 3.2 是低成本多语言候选，适合分类、翻译和短文本工作流。

$0.1 / 1M tokens输入$0.3 / 1M tokens输出128k上下文

适用场景翻译, 分类, 短文摘要

路由已配置

工具调用JSON 模式流式输出低成本

OpenRouter（可用时）OpenRouter 公开 Models API 的实时元数据；公开价格来自注册表价格规则。

查看详情

OpenRouter目录

OpenAI: GPT-4o-mini

GPT-4o mini 是一个成熟的低成本多模态选项，适合已经使用 OpenAI 兼容 SDK、并需要一个兼顾价格与能力的默认模型的团队。

$0.15 / 1M tokens输入$0.6 / 1M tokens输出128k上下文

适用场景低成本聊天, 图像理解, 分类

路由已配置

工具调用视觉JSON 模式长上下文

OpenRouter（可用时）OpenRouter 公开 Models API 的实时元数据；公开价格来自注册表价格规则。

查看详情

对比 Meta: Llama 4 Maverick

Meta: Llama 4 Maverick 对比 Google: Gemini 2.5 Flash Meta: Llama 4 Maverick 对比 Mistral: Mistral Small 3.2 24B Meta: Llama 4 Maverick 对比 OpenAI: GPT-4o-mini Meta: Llama 4 Maverick 对比 DeepSeek V4 Flash Meta: Llama 4 Maverick 对比 Doubao Seed 2.0 Lite

常见问题

Meta: Llama 4 Maverick API 常见问题

为什么要把 Llama 4 Maverick 加进来？

它为团队提供了一个开源模型候选，便于在成本、上下文长度和提供方选择空间之间做比较。