/ preturi

Plateste pentru ce
folosesti.

If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.

Deschide calculatorul Compara modelele

Plata la consum

Tarife model

Incepe cu pretul tokenurilor de intrare si iesire pentru fiecare model.

Fara contract mare in avans
Estimare inainte de lansare
Cereri compatibile OpenAI

Incepe

Credite

Sold preplatit

Pastreaza cheltuiala previzibila pentru experimente si echipe mici.

Buget pe proiect
Export usor al utilizarii
Potrivit pentru pilot si QA

Incepe

Echipa

Utilizare guvernata

Gestioneaza proiecte, chei, bugete si politici de model pentru echipele de productie.

Cheltuiala pe proiect si cheie
Controale de buget
Raportare pentru echipa

Incepe

BYOK

Foloseste cheile tale

Adu conturile existente ale furnizorilor intr-un singur strat de comparatie si guvernanta.

Cheile furnizorului raman sub controlul tau
Catalog unificat de modele
Rutare pregatita pentru politici

Citeste documentatia auth

Enterprise

Personalizat

Termeni comerciali privati pentru workload-uri cu volum mare sau guvernanta stricta.

Planificare de volum
Design pentru mixul de furnizori
Suport si revizie rollout

Verifica facturarea

Calculator

Model, tokenuri de intrare, tokenuri de iesire, cereri si estimare lunara.

Foloseste asta ca estimare inainte de productie. Facturarea finala trebuie reconciliata cu utilizarea furnizorului si a platformei.

Formula de estimare

Cost = cereri x ((tokenuri de intrare x pret intrare) + (tokenuri de iesire x pret iesire)) / 1,000,000.

Estimarea implicita Doubao Seed 2.0 Mini pentru 1M input si 1M output este ¥2.20.

Calculator de pret

Estimeaza costul lunar pe baza pretului modelului, a tokenilor si a volumului de cereri.

Model

Tokeni de intrare

Tokeni de iesire

Cereri / luna

Estimare lunara¥1.80Doubao Seed 2.0 Mini · tokeni de intrare 0.2/1M · tokeni de iesire 2/1M

Cum estimezi costul unui AI API

Costul unui AI API se estimeaza inmultind numarul de cereri cu tokenurile de intrare si iesire, apoi aplicand pretul public al fiecarui model pentru 1M tokenuri. Inainte de a trimite trafic de productie, echipa ar trebui sa calculeze un model low-cost, un fallback de calitate si volumul lunar asteptat.

Vrei sa estimezi mai intai economiile API?

Ruleaza CacheSafety Bench inainte de a activa o politica de cache in productie. Bad Hit Rate conteaza mai mult decat hit rate-ul brut.

Ruleaza CacheSafety Bench

Referinta low-cost

Compara candidatii low-cost inainte sa directionezi trafic.

Pretul este doar o dimensiune. Verifica si lungimea contextului, capabilitatile, etichetele de sursa si cazurile de utilizare planificate inainte de productie.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

Intrebari despre pret pentru echipele de produs si platforma

Cum este estimat costul?

Calculatorul inmulteste tokenurile de intrare si iesire cu pretul modelului selectat pentru 1M tokenuri, apoi aplica numarul de cereri.

Doubao Seed 2.0 Mini costa in continuare ¥2.20 pentru 1M input plus 1M output?

Da. ¥0.20 input plus ¥2.00 output inseamna ¥2.20 pentru aceasta estimare unica de 1M + 1M.

Pot echipele sa foloseasca chei existente ale furnizorilor?

Da. Planul BYOK este gandit pentru echipele care au deja conturi la furnizori si vor politici si rapoarte de utilizare consecvente.

Exista preturi enterprise?

Da. Preturile enterprise se pot negocia in functie de volum, mixul de furnizori, regiune, cerintele de suport si de guvernanta.

Catalog de modele Pornire rapida Clasament API LLM ieftine

Plateste pentru cefolosesti.

Model, tokenuri de intrare, tokenuri de iesire, cereri si estimare lunara.

Formula de estimare

Calculator de pret

Cum estimezi costul unui AI API

Vrei sa estimezi mai intai economiile API?

Compara candidatii low-cost inainte sa directionezi trafic.

Intrebari despre pret pentru echipele de produs si platforma

Cum este estimat costul?

Doubao Seed 2.0 Mini costa in continuare ¥2.20 pentru 1M input plus 1M output?

Pot echipele sa foloseasca chei existente ale furnizorilor?

Exista preturi enterprise?

Plateste pentru ce
folosesti.