Pagamento a consumo
Tariffe modelloInizia dal prezzo dei token di input e output per ogni modello.
- Nessun grande contratto iniziale
- Stima prima del lancio
- Richieste compatibili con OpenAI
Se stai confrontando modelli per un prodotto live, usa prima il calcolatore e poi scegli il piano piu adatto al tuo profilo di spesa.
Pagamento a consumo
Tariffe modelloInizia dal prezzo dei token di input e output per ogni modello.
Crediti
Saldo prepagatoMantieni la spesa prevedibile per esperimenti e team piccoli.
Team
Uso governatoGestisci progetti, chiavi, budget e policy dei modelli per i team di produzione.
BYOK
Usa le tue chiaviPorta gli account provider esistenti in un unico livello di confronto e governance.
Enterprise
PersonalizzatoTermini commerciali privati per workload ad alto volume o con forte governance.
Calcolatore
Usalo come stima pre-produzione. La fatturazione finale va riconciliata con i dati di utilizzo del provider e della piattaforma.
Costo = richieste x ((token di input x prezzo input) + (token di output x prezzo output)) / 1,000,000.
La stima predefinita di Doubao Seed 2.0 Mini per 1M input e 1M output e ¥2.20.
Stima la spesa mensile in base al prezzo del modello, ai token e al volume di richieste.
Il costo di una API AI si stima moltiplicando il numero di richieste per i token di input e output, applicando poi il prezzo pubblico di ogni modello per 1M token. Prima di instradare traffico di produzione, il team dovrebbe calcolare un modello economico, un fallback di qualita e il volume mensile previsto.
Esegui CacheSafety Bench prima di attivare una policy di cache in produzione. Bad Hit Rate conta piu dell'hit rate grezzo.
Esegui CacheSafety BenchRiferimento low-cost
Il prezzo e solo una dimensione. Valuta anche lunghezza del contesto, capacita, etichette sorgente e casi d'uso previsti prima dell'uso in produzione.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Il calcolatore moltiplica i token di input e output per il prezzo del modello selezionato per 1M token, poi applica il numero di richieste.
Si. ¥0.20 di input piu ¥2.00 di output fanno ¥2.20 per questa stima singola da 1M + 1M.
Si. Il piano BYOK e pensato per i team che hanno gia account provider e vogliono mantenere policy e report di utilizzo coerenti.
Si. Il prezzo enterprise puo essere negoziato in base a volume, mix provider, regione, requisiti di supporto e governance.