Loading...Working on your request
/ preturi

Plateste pentru ce
folosesti.

If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.

Plata la consum

Tarife model

Incepe cu pretul tokenurilor de intrare si iesire pentru fiecare model.

  • Fara contract mare in avans
  • Estimare inainte de lansare
  • Cereri compatibile OpenAI
Incepe

Credite

Sold preplatit

Pastreaza cheltuiala previzibila pentru experimente si echipe mici.

  • Buget pe proiect
  • Export usor al utilizarii
  • Potrivit pentru pilot si QA
Incepe

Echipa

Utilizare guvernata

Gestioneaza proiecte, chei, bugete si politici de model pentru echipele de productie.

  • Cheltuiala pe proiect si cheie
  • Controale de buget
  • Raportare pentru echipa
Incepe

BYOK

Foloseste cheile tale

Adu conturile existente ale furnizorilor intr-un singur strat de comparatie si guvernanta.

  • Cheile furnizorului raman sub controlul tau
  • Catalog unificat de modele
  • Rutare pregatita pentru politici
Citeste documentatia auth

Enterprise

Personalizat

Termeni comerciali privati pentru workload-uri cu volum mare sau guvernanta stricta.

  • Planificare de volum
  • Design pentru mixul de furnizori
  • Suport si revizie rollout
Verifica facturarea

Calculator

Model, tokenuri de intrare, tokenuri de iesire, cereri si estimare lunara.

Foloseste asta ca estimare inainte de productie. Facturarea finala trebuie reconciliata cu utilizarea furnizorului si a platformei.

Formula de estimare

Cost = cereri x ((tokenuri de intrare x pret intrare) + (tokenuri de iesire x pret iesire)) / 1,000,000.

Estimarea implicita Doubao Seed 2.0 Mini pentru 1M input si 1M output este ¥2.20.

Calculator de pret

Estimeaza costul lunar pe baza pretului modelului, a tokenilor si a volumului de cereri.

Estimare lunara¥1.80Doubao Seed 2.0 Mini · tokeni de intrare 0.2/1M · tokeni de iesire 2/1M

Cum estimezi costul unui AI API

Costul unui AI API se estimeaza inmultind numarul de cereri cu tokenurile de intrare si iesire, apoi aplicand pretul public al fiecarui model pentru 1M tokenuri. Inainte de a trimite trafic de productie, echipa ar trebui sa calculeze un model low-cost, un fallback de calitate si volumul lunar asteptat.

Vrei sa estimezi mai intai economiile API?

Ruleaza CacheSafety Bench inainte de a activa o politica de cache in productie. Bad Hit Rate conteaza mai mult decat hit rate-ul brut.

Ruleaza CacheSafety Bench

Referinta low-cost

Compara candidatii low-cost inainte sa directionezi trafic.

Pretul este doar o dimensiune. Verifica si lungimea contextului, capabilitatile, etichetele de sursa si cazurile de utilizare planificate inainte de productie.

ModelProviderInputOutputContextCapabilitiesBest forLatencyStatusSource
Doubao Seed 2.0 Minidoubao-seed-2-0-miniVolcengine¥0.2 / 1M tokens¥2 / 1M tokens128k
StreamingJSON mode
Coding900-2600msCatalogPlatform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
Tool callingJSON modeLong contextReasoning
low-cost Chinese tasks, long-context summary800-2600msCatalogOpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
Tool callingJSON modeStreamingLow cost
translation, classification700-2300msCatalogOpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
Tool callingVisionJSON modeLong context
low-cost chat, image understanding800-2400msCatalogOpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON modeLong contextStreamingLow cost
open-model workflows, cost-sensitive long context950-2800msCatalogOpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
Tool callingVisionJSON modeLong context
long-document summarization, image Q&A900-2800msCatalogOpenRouter if available
DeepSeek: R1deepseek/deepseek-r1DeepSeek$0.7 / 1M tokens$2.50 / 1M tokens163.8k
JSON modeLong contextReasoningStreaming
Chinese reasoning, math1800-6000msCatalogOpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plusAlibaba Cloud / Qwen$0.65 / 1M tokens$3.25 / 1M tokens1M
Tool callingJSON modeLong contextStreaming
Chinese engineering workflows, code generation1200-3900msCatalogOpenRouter if available

FAQ

Intrebari despre pret pentru echipele de produs si platforma

Cum este estimat costul?

Calculatorul inmulteste tokenurile de intrare si iesire cu pretul modelului selectat pentru 1M tokenuri, apoi aplica numarul de cereri.

Doubao Seed 2.0 Mini costa in continuare ¥2.20 pentru 1M input plus 1M output?

Da. ¥0.20 input plus ¥2.00 output inseamna ¥2.20 pentru aceasta estimare unica de 1M + 1M.

Pot echipele sa foloseasca chei existente ale furnizorilor?

Da. Planul BYOK este gandit pentru echipele care au deja conturi la furnizori si vor politici si rapoarte de utilizare consecvente.

Exista preturi enterprise?

Da. Preturile enterprise se pot negocia in functie de volum, mixul de furnizori, regiune, cerintele de suport si de guvernanta.