Google: Gemini 2.5 Flash 和 Meta: Llama 4 Maverick 哪個更便宜?
Meta: Llama 4 Maverick 較便宜($0.15 / 1M tokens 輸入 / $0.6 / 1M tokens 輸出),Google: Gemini 2.5 Flash 為 $0.3 / 1M tokens 輸入 / $2.50 / 1M tokens 輸出。實際成本取決於你的輸入/輸出 token 比例,請用價格計算器按真實流量估算。
逐項對比
按價格、提供方、上下文、能力、延遲與來源基礎比較。
| 模型 | 提供方 | 輸入 | 輸出 | 上下文 | 能力 | 適用場景 | 延遲 | 狀態 | 來源 |
|---|---|---|---|---|---|---|---|---|---|
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | 工具呼叫視覺JSON 模式長上下文 | 長文件摘要, 圖像問答 | 900-2800ms | 目錄 | OpenRouter(可用時) | |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON 模式長上下文串流輸出低成本 | 開源模型工作流, 成本敏感型長上下文 | 950-2800ms | 目錄 | OpenRouter(可用時) |
常見問題
Meta: Llama 4 Maverick 較便宜($0.15 / 1M tokens 輸入 / $0.6 / 1M tokens 輸出),Google: Gemini 2.5 Flash 為 $0.3 / 1M tokens 輸入 / $2.50 / 1M tokens 輸出。實際成本取決於你的輸入/輸出 token 比例,請用價格計算器按真實流量估算。
兩者上下文視窗相同:1M tokens。
兩者都適用於低成本。若以成本為先,選 Meta: Llama 4 Maverick;若需要更長上下文,選 Google: Gemini 2.5 Flash。建議用真實提示詞各跑一遍再決定。