/ prijzen

Betaal voor wat je
gebruikt.

If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.

Calculator openen Modellen vergelijken

Betalen naar gebruik

Modeltarieven

Begin met de prijs per input- en outputtoken van elk model.

Geen groot vooraf contract
Schatting voor livegang
OpenAI-compatibele requests

Begin met bouwen

Credits

Vooruitbetaald saldo

Houd uitgaven voorspelbaar voor experimenten en kleine teams.

Budget per project
Gebruik eenvoudig exporteren
Geschikt voor pilots en QA

Begin met bouwen

Team

Beheerd gebruik

Beheer projecten, sleutels, budgetten en modelbeleid voor productieteams.

Uitgaven per project en sleutel
Budgetcontroles
Teamrapportage

Begin met bouwen

BYOK

Gebruik je eigen sleutels

Breng bestaande provideraccounts samen in een laag voor vergelijking en governance.

Providersleutels onder jouw controle
Uniform modelcatalogus
Routing klaar voor beleid

Lees auth-documentatie

Enterprise

Maatwerk

Private commerciële voorwaarden voor workloads met hoog volume of strakke governance.

Volumeplanning
Ontwerp van providermix
Support en rollout-review

Bekijk facturatie

Calculator

Model, inputtokens, outputtokens, requests en maandelijkse schatting.

Gebruik dit als pre-productieschatting. De definitieve facturatie moet worden vergeleken met providergebruik en platformgebruik.

Schattingformule

Kosten = requests x ((inputtokens x inputprijs) + (outputtokens x outputprijs)) / 1,000,000.

De standaardschatting voor Doubao Seed 2.0 Mini bij 1M input en 1M output is ¥2.20.

Prijscalculator

Schat de maandelijkse kosten op basis van modelprijs, tokens en aanvraagvolume.

Model

Inputtokens

Outputtokens

Verzoeken / maand

Maandelijkse schatting¥1.80Doubao Seed 2.0 Mini · inputtokens 0.2/1M · outputtokens 2/1M

Hoe schat je AI API-kosten?

AI API-kosten worden geschat door het aantal requests te vermenigvuldigen met input- en outputtokens en daarna de publieke prijs per model per 1M tokens toe te passen. Voor productieverkeer moeten teams een goedkoop model, een kwaliteitsfallback en het verwachte maandvolume doorrekenen.

Wil je eerst je API-besparing schatten?

Draai CacheSafety Bench voordat je een cachebeleid in productie activeert. Bad Hit Rate is belangrijker dan de ruwe hit rate.

Start CacheSafety Bench

Low-cost referentie

Vergelijk low-cost modelkandidaten voordat je verkeer toewijst.

Prijs is maar één dimensie. Bekijk ook contextlengte, mogelijkheden, bronlabels en beoogde use-cases voordat je productie kiest.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

Prijsvragen voor product- en platformteams

Hoe worden de kosten geschat?

De calculator vermenigvuldigt input- en outputtokens met de prijs van het gekozen model per 1M tokens en past daarna het aantal requests toe.

Kost Doubao Seed 2.0 Mini nog steeds ¥2.20 voor 1M input plus 1M output?

Ja. ¥0.20 input plus ¥2.00 output is ¥2.20 voor deze schatting van 1M + 1M.

Kunnen teams bestaande providersleutels gebruiken?

Ja. Het BYOK-plan is bedoeld voor teams die al provideraccounts hebben en consistent beleid en gebruiksrapportage willen behouden.

Is enterprise-pricing beschikbaar?

Ja. Enterprise-pricing kan worden afgestemd op volume, providermix, regio, supportvereisten en governancebehoeften.

Modelcatalogus Snelstart Ranking van goedkope LLM API's

Betaal voor wat jegebruikt.

Model, inputtokens, outputtokens, requests en maandelijkse schatting.

Schattingformule

Prijscalculator

Hoe schat je AI API-kosten?

Wil je eerst je API-besparing schatten?

Vergelijk low-cost modelkandidaten voordat je verkeer toewijst.

Prijsvragen voor product- en platformteams

Hoe worden de kosten geschat?

Kost Doubao Seed 2.0 Mini nog steeds ¥2.20 voor 1M input plus 1M output?

Kunnen teams bestaande providersleutels gebruiken?

Is enterprise-pricing beschikbaar?

Betaal voor wat je
gebruikt.