Kullandikca ode
Model fiyatlariHer modelin giris ve cikis token fiyatlariyla baslayin.
- Buyuk bir pesin sozlesme yok
- Canliya almadan once tahmin
- OpenAI uyumlu istekler
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Kullandikca ode
Model fiyatlariHer modelin giris ve cikis token fiyatlariyla baslayin.
Krediler
On odemeli bakiyeDeneyler ve kucuk ekipler icin harcamayi daha ongorulebilir hale getirin.
Ekip
Yonetilen kullanimUretim ekipleri icin projeleri, anahtarlari, butceleri ve model politikalarini yonetin.
BYOK
Kendi anahtarlarini kullanMevcut saglayici hesaplarini tek bir karsilastirma ve yonetisim katmaninda birlestirin.
Enterprise
OzelYuksek hacimli veya sikı yonetisim gerektiren workload'lar icin ozel ticari kosullar.
Hesaplayici
Bunu uretim oncesi tahmin olarak kullanin. Nihai faturalandirma, saglayici kullanimi ve platform kayitlariyla mutabakatlandirilmalidir.
Maliyet = istekler x ((giris tokenlari x giris fiyati) + (cikis tokenlari x cikis fiyati)) / 1,000,000.
Doubao Seed 2.0 Mini icin 1M input ve 1M output varsayilan tahmini ¥2.20.
Model fiyati, token sayisi ve istek hacmine gore aylik harcamayi tahmin edin.
AI API maliyeti, istek sayisini giris ve cikis tokenlariyla carpip sonra her modelin 1M token icin yayinlanan fiyatini uygulayarak tahmin edilir. Uretim trafigini yonlendirmeden once ekip dusuk maliyetli bir model, kalite fallback'i ve beklenen aylik hacmi hesaplamalidir.
Uretimde cache politikasi acmadan once CacheSafety Bench calistirin. Bad Hit Rate, ham hit rate'den daha onemlidir.
CacheSafety Bench calistirDusuk maliyet referansi
Fiyat sadece bir boyuttur. Uretimden once baglam uzunlugu, yetenekler, kaynak etiketleri ve hedeflenen kullanim senaryolarini da inceleyin.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Hesaplayici, giris ve cikis tokenlarini secilen modelin 1M token basina fiyatiyla carpar ve ardindan istek sayisini uygular.
Evet. ¥0.20 input ile ¥2.00 output toplandiginda bu tekil 1M + 1M tahmini icin ¥2.20 eder.
Evet. BYOK plani, halihazirda saglayici hesabina sahip ekiplerin tutarli politika ve kullanim raporlarini surdurmesi icin tasarlanmistir.
Evet. Enterprise fiyatlandirma hacim, saglayici karmasi, bolge, destek gereksinimleri ve yonetisim ihtiyaclarina gore gorusulebilir.