Betalen naar gebruik
ModeltarievenBegin met de prijs per input- en outputtoken van elk model.
- Geen groot vooraf contract
- Schatting voor livegang
- OpenAI-compatibele requests
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Betalen naar gebruik
ModeltarievenBegin met de prijs per input- en outputtoken van elk model.
Credits
Vooruitbetaald saldoHoud uitgaven voorspelbaar voor experimenten en kleine teams.
Team
Beheerd gebruikBeheer projecten, sleutels, budgetten en modelbeleid voor productieteams.
BYOK
Gebruik je eigen sleutelsBreng bestaande provideraccounts samen in een laag voor vergelijking en governance.
Enterprise
MaatwerkPrivate commerciële voorwaarden voor workloads met hoog volume of strakke governance.
Calculator
Gebruik dit als pre-productieschatting. De definitieve facturatie moet worden vergeleken met providergebruik en platformgebruik.
Kosten = requests x ((inputtokens x inputprijs) + (outputtokens x outputprijs)) / 1,000,000.
De standaardschatting voor Doubao Seed 2.0 Mini bij 1M input en 1M output is ¥2.20.
Schat de maandelijkse kosten op basis van modelprijs, tokens en aanvraagvolume.
AI API-kosten worden geschat door het aantal requests te vermenigvuldigen met input- en outputtokens en daarna de publieke prijs per model per 1M tokens toe te passen. Voor productieverkeer moeten teams een goedkoop model, een kwaliteitsfallback en het verwachte maandvolume doorrekenen.
Draai CacheSafety Bench voordat je een cachebeleid in productie activeert. Bad Hit Rate is belangrijker dan de ruwe hit rate.
Start CacheSafety BenchLow-cost referentie
Prijs is maar één dimensie. Bekijk ook contextlengte, mogelijkheden, bronlabels en beoogde use-cases voordat je productie kiest.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
De calculator vermenigvuldigt input- en outputtokens met de prijs van het gekozen model per 1M tokens en past daarna het aantal requests toe.
Ja. ¥0.20 input plus ¥2.00 output is ¥2.20 voor deze schatting van 1M + 1M.
Ja. Het BYOK-plan is bedoeld voor teams die al provideraccounts hebben en consistent beleid en gebruiksrapportage willen behouden.
Ja. Enterprise-pricing kan worden afgestemd op volume, providermix, regio, supportvereisten en governancebehoeften.