Bayar ikut guna
Kadar modelMulakan dengan harga token input dan output bagi setiap model.
- Tiada kontrak awal besar
- Anggaran sebelum pelancaran
- Permintaan serasi OpenAI
Jika anda sedang membandingkan model untuk produk sebenar, gunakan kalkulator dahulu kemudian pilih pelan yang sepadan dengan corak perbelanjaan anda.
Bayar ikut guna
Kadar modelMulakan dengan harga token input dan output bagi setiap model.
Kredit
Baki prabayarJadikan perbelanjaan lebih mudah dijangka untuk eksperimen dan pasukan kecil.
Pasukan
Penggunaan terkawalUrus projek, kunci, bajet dan polisi model untuk pasukan produksi.
BYOK
Guna kunci andaBawa akaun penyedia sedia ada ke dalam satu lapisan perbandingan dan tadbir urus.
Enterprise
TersuaiTerma komersial peribadi untuk beban kerja berjumlah tinggi atau sangat terkawal.
Kalkulator
Gunakan ini sebagai anggaran sebelum produksi. Bil akhir perlu diselaraskan dengan penggunaan penyedia dan rekod penggunaan platform.
Kos = permintaan x ((token input x harga input) + (token output x harga output)) / 1,000,000.
Anggaran lalai Doubao Seed 2.0 Mini untuk 1M input dan 1M output ialah ¥2.20.
Anggarkan perbelanjaan bulanan berdasarkan harga model, token, dan jumlah permintaan.
Kos AI API dianggarkan dengan mendarab jumlah permintaan dengan token input dan output, kemudian menggunakan harga yang diterbitkan bagi setiap model untuk setiap 1M token. Sebelum menghala trafik produksi, pasukan perlu mengira model kos rendah, sandaran kualiti dan jangkaan volum bulanan.
Jalankan CacheSafety Bench sebelum mengaktifkan polisi cache dalam produksi. Kadar ralat cache yang merugikan lebih penting daripada kadar capaian cache mentah.
Jalankan CacheSafety BenchRujukan kos rendah
Harga hanyalah satu dimensi. Semak juga panjang konteks, keupayaan, label sumber dan kes penggunaan yang dirancang sebelum guna dalam produksi.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Kalkulator mendarab token input dan output dengan harga model yang dipilih bagi setiap 1M token, kemudian menggunakan jumlah permintaan.
Ya. Input ¥0.20 ditambah output ¥2.00 menjadi ¥2.20 untuk anggaran tunggal 1M + 1M ini.
Ya. Pelan BYOK direka untuk pasukan yang sudah mempunyai akaun penyedia dan mahu mengekalkan polisi serta laporan penggunaan yang konsisten.
Ya. Harga enterprise boleh dirunding mengikut volum, campuran penyedia, rantau, keperluan sokongan dan keperluan tadbir urus.