Loading...Working on your request
รายชื่อโมเดลตัวเลือก

โมเดล API LLM ราคาประหยัดที่ดีที่สุดสำหรับผลิตภัณฑ์ที่ไวต่อค่าใช้จ่าย

เปรียบเทียบโมเดล API LLM ต้นทุนต่ำตามราคา input, ราคา output, บริบท, capability, แหล่งที่มา และความเหมาะสมกับ production

รายชื่อนี้เหมาะกับการใช้งานแบบไหน?

การเลือก API LLM ราคาประหยัดควรเริ่มจากลักษณะ workload จริง ไม่ใช่ดูแค่เรตราคาต่ำสุดบนหน้าเว็บ สำหรับงานจัดหมวดหมู่ สรุปความ routing ร่างงาน support และงานแปลงแบบ batch โมเดลที่ถูกกว่าสามารถลดค่าใช้จ่ายรายเดือนโดยไม่ต้องเปลี่ยนอินเทอร์เฟซของแอปได้ ส่วนงานตอบสุดท้าย การให้เหตุผลซับซ้อน หรือ coding agent ควรเทียบโมเดลราคาประหยัดกับ fallback ที่แข็งแรงกว่า NextModel รวมราคา บริบท capability แหล่งที่มาของ provider และตัวอย่างโค้ดไว้ในที่เดียวเพื่อช่วยตัดสินใจก่อน production

พื้นฐานของแหล่งข้อมูล: แคตตาล็อกที่ NextModel คัดเลือก ราคา public ของ provider และ OpenRouter metadata เมื่อมีให้ใช้

Blended price

ตัวเลือกที่แนะนำ llm api ราคาประหยัด

เริ่มจากรายชื่อโมเดลตัวเลือก จากนั้นทดสอบด้วย prompt จริง และเปรียบเทียบค่าใช้จ่ายรายเดือนก่อนนำไปใช้กับ production routing

DeepSeekCatalog

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

$0.112 / 1M tokensInput$0.224 / 1M tokensOutput1MContext
Best forlow-cost Chinese tasks, long-context summary, batch code assistance
RoutingConfigured
Tool callingJSON modeLong contextReasoningLow cost
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
Mistral AICatalog

Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling. Compared to the 3.1 release, version 3.2 significantly improves accuracy on...

$0.1 / 1M tokensInput$0.3 / 1M tokensOutput128kContext
Best fortranslation, classification, short-form summarization
RoutingConfigured
Tool callingJSON modeStreamingLow costVisionLong context
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
OpenRouterCatalog

GPT-4o mini is OpenAI's newest model after [GPT-4 Omni](/models/openai/gpt-4o), supporting both text and image inputs with text outputs. As their most advanced small model, it is many multiples more affordable...

$0.15 / 1M tokensInput$0.6 / 1M tokensOutput128kContext
Best forlow-cost chat, image understanding, classification
RoutingConfigured
Tool callingVisionJSON modeLong contextStreamingLow cost
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
MetaCatalog

Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...

$0.15 / 1M tokensInput$0.6 / 1M tokensOutput1MContext
Best foropen-model workflows, cost-sensitive long context, classification
RoutingConfigured
JSON modeLong contextStreamingLow costTool callingVision
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details

ตารางเปรียบเทียบ

เปรียบเทียบรายชื่อโมเดลตามราคา ผู้ให้บริการ context ความสามารถ และแหล่งข้อมูล

ใช้มุมมองนี้เมื่อคุณกำลังคัด shortlist สำหรับ production สร้างนโยบาย fallback หรือเปรียบเทียบความคุ้มค่าของโมเดล

ModelProviderInputOutputContextCapabilitiesBest forLatencyStatusSource
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
Tool callingJSON modeLong contextReasoning
low-cost Chinese tasks, long-context summary800-2600msCatalogOpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
Tool callingJSON modeStreamingLow cost
translation, classification700-2300msCatalogOpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
Tool callingVisionJSON modeLong context
low-cost chat, image understanding800-2400msCatalogOpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON modeLong contextStreamingLow cost
open-model workflows, cost-sensitive long context950-2800msCatalogOpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
Tool callingVisionJSON modeLong context
long-document summarization, image Q&A900-2800msCatalogOpenRouter if available
MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6Moonshot AI$0.73 / 1M tokens$3.49 / 1M tokens262.1k
JSON modeLong contextStreamingTool calling
long Chinese documents, contract review1400-4400msCatalogOpenRouter if available

FAQ

LLM API ราคาประหยัด FAQ

โมเดลที่ถูกที่สุดในแคตตาล็อกนี้คืออะไร?

ขึ้นอยู่กับอัตราแลกเปลี่ยนและความยาวของ output โดย Doubao Seed 2.0 Mini ยังเป็นตัวเลือก production สกุล CNY ที่ประหยัดที่สุดในแคตตาล็อกนี้

ทีมควรเลือก LLM API ที่ถูกที่สุดเสมอหรือไม่?

ไม่เสมอไป โมเดลราคาถูกเหมาะกับงานซ้ำ ๆ และความเสี่ยงต่ำ แต่สำหรับคำตอบสุดท้าย การให้เหตุผลซับซ้อน และ coding agent ควรเทียบกับโมเดลที่แข็งแรงกว่า