DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
Model API LLM murah terbaik untuk produk yang sensitif terhadap biaya
Bandingkan model API LLM berbiaya rendah berdasarkan harga input, harga output, konteks, capability, sumber, dan kecocokan produksi.
Daftar pendek ini untuk apa?
Pemilihan API LLM murah harus dimulai dari bentuk workload, bukan hanya tarif terendah yang terlihat. Untuk klasifikasi, ringkasan, routing, draft dukungan, dan transformasi batch, model yang lebih murah dapat menurunkan pengeluaran bulanan tanpa mengubah antarmuka aplikasi. Untuk jawaban final, penalaran kompleks, atau agen coding, tim sebaiknya membandingkan model murah dengan fallback yang lebih kuat. NextModel menyatukan harga, konteks, capability, sumber provider, dan contoh kode agar keputusan ini bisa dibuat sebelum produksi.
Basis sumber: Katalog kurasi NextModel, harga publik provider, dan metadata OpenRouter saat tersedia.
Blended price
Kandidat rekomendasi api llm murah
Mulai dari daftar pendek, uji prompt nyata, lalu bandingkan biaya bulanan sebelum routing produksi.
Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling. Compared to the 3.1 release, version 3.2 significantly improves accuracy on...
GPT-4o mini is OpenAI's newest model after [GPT-4 Omni](/models/openai/gpt-4o), supporting both text and image inputs with text outputs. As their most advanced small model, it is many multiples more affordable...
Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...
Tabel perbandingan
Bandingkan daftar pendek berdasarkan harga, penyedia, konteks, kemampuan, dan sumber.
Gunakan tampilan ini untuk mempersempit shortlist produksi, membangun kebijakan fallback, atau membandingkan ekonomi model.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6 | Moonshot AI | $0.73 / 1M tokens | $3.49 / 1M tokens | 262.1k | JSON modeLong contextStreamingTool calling | long Chinese documents, contract review | 1400-4400ms | Catalog | OpenRouter if available |
FAQ
API LLM murah FAQ
Model termurah di katalog ini yang mana?
Itu tergantung kurs dan panjang output. Doubao Seed 2.0 Mini tetap menjadi opsi produksi CNY termurah di katalog ini.
Apakah tim harus selalu memilih API LLM termurah?
Tidak. Model murah cocok untuk pekerjaan berulang dan berisiko rendah; untuk jawaban final, penalaran kompleks, dan agen coding, model tersebut perlu dibandingkan dengan model yang lebih kuat.