DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...
Maliyete duyarli urunler icin en iyi ucuz LLM API modelleri
Dusuk maliyetli LLM API modellerini giris fiyati, cikis fiyati, baglam, capability, kaynak ve uretim uyumu acisindan karsilastirin.
Bu kısa liste ne için?
Ucuz bir LLM API secimi yalnizca en dusuk etiket fiyatindan degil, workload'un yapisindan baslamalidir. Siniflandirma, ozetleme, routing, destek taslaklari ve batch donusumlerde daha ucuz bir model, uygulama arayuzunu degistirmeden aylik harcamayi dusurebilir. Nihai yanitlar, karmasik reasoning veya coding agent'lar icin ekiplerin ucuz modeli daha guclu bir fallback ile karsilastirmasi gerekir. NextModel fiyat, baglam, capability, provider kaynagi ve kod orneklerini tek yerde toplar.
Kaynak temeli: NextModel tarafindan derlenen katalog, provider'larin acik fiyatlari ve varsa OpenRouter metadata.
Blended price
Önerilen adaylar ucuz llm api
Kısa listeyle başlayın, gerçek promptları test edin ve production routing öncesinde aylık maliyeti karşılaştırın.
Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling. Compared to the 3.1 release, version 3.2 significantly improves accuracy on...
GPT-4o mini is OpenAI's newest model after [GPT-4 Omni](/models/openai/gpt-4o), supporting both text and image inputs with text outputs. As their most advanced small model, it is many multiples more affordable...
Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...
Karşılaştırma tablosu
Kısa listeyi fiyat, sağlayıcı, bağlam, yetenek ve kaynağa göre karşılaştırın.
Production shortlistini daraltırken, fallback politikası kurarken veya model ekonomisini karşılaştırırken bu görünümü kullanın.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6 | Moonshot AI | $0.73 / 1M tokens | $3.49 / 1M tokens | 262.1k | JSON modeLong contextStreamingTool calling | long Chinese documents, contract review | 1400-4400ms | Catalog | OpenRouter if available |
FAQ
Ucuz LLM API FAQ
Bu katalogdaki en ucuz model hangisi?
Bu, doviz kuru ve output uzunluguna baglidir. Doubao Seed 2.0 Mini bu katalogdaki en dusuk maliyetli CNY uretim secenegi olmaya devam eder.
Ekipler her zaman en ucuz LLM API'yi mi secmeli?
Hayir. Ucuz modeller tekrar eden ve dusuk riskli islerde ise yarar; nihai yanitlar, karmasik reasoning ve coding agent'lar icin daha guclu modellerle karsilastirilmalidir.