Plata la consum
Tarife modelIncepe cu pretul tokenurilor de intrare si iesire pentru fiecare model.
- Fara contract mare in avans
- Estimare inainte de lansare
- Cereri compatibile OpenAI
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Plata la consum
Tarife modelIncepe cu pretul tokenurilor de intrare si iesire pentru fiecare model.
Credite
Sold preplatitPastreaza cheltuiala previzibila pentru experimente si echipe mici.
Echipa
Utilizare guvernataGestioneaza proiecte, chei, bugete si politici de model pentru echipele de productie.
BYOK
Foloseste cheile taleAdu conturile existente ale furnizorilor intr-un singur strat de comparatie si guvernanta.
Enterprise
PersonalizatTermeni comerciali privati pentru workload-uri cu volum mare sau guvernanta stricta.
Calculator
Foloseste asta ca estimare inainte de productie. Facturarea finala trebuie reconciliata cu utilizarea furnizorului si a platformei.
Cost = cereri x ((tokenuri de intrare x pret intrare) + (tokenuri de iesire x pret iesire)) / 1,000,000.
Estimarea implicita Doubao Seed 2.0 Mini pentru 1M input si 1M output este ¥2.20.
Estimeaza costul lunar pe baza pretului modelului, a tokenilor si a volumului de cereri.
Costul unui AI API se estimeaza inmultind numarul de cereri cu tokenurile de intrare si iesire, apoi aplicand pretul public al fiecarui model pentru 1M tokenuri. Inainte de a trimite trafic de productie, echipa ar trebui sa calculeze un model low-cost, un fallback de calitate si volumul lunar asteptat.
Ruleaza CacheSafety Bench inainte de a activa o politica de cache in productie. Bad Hit Rate conteaza mai mult decat hit rate-ul brut.
Ruleaza CacheSafety BenchReferinta low-cost
Pretul este doar o dimensiune. Verifica si lungimea contextului, capabilitatile, etichetele de sursa si cazurile de utilizare planificate inainte de productie.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Calculatorul inmulteste tokenurile de intrare si iesire cu pretul modelului selectat pentru 1M tokenuri, apoi aplica numarul de cereri.
Da. ¥0.20 input plus ¥2.00 output inseamna ¥2.20 pentru aceasta estimare unica de 1M + 1M.
Da. Planul BYOK este gandit pentru echipele care au deja conturi la furnizori si vor politici si rapoarte de utilizare consecvente.
Da. Preturile enterprise se pot negocia in functie de volum, mixul de furnizori, regiune, cerintele de suport si de guvernanta.