/ prezzi

Paga per cio che
usi.

Se stai confrontando modelli per un prodotto live, usa prima il calcolatore e poi scegli il piano piu adatto al tuo profilo di spesa.

Apri calcolatore Confronta modelli

Pagamento a consumo

Tariffe modello

Inizia dal prezzo dei token di input e output per ogni modello.

Nessun grande contratto iniziale
Stima prima del lancio
Richieste compatibili con OpenAI

Inizia

Crediti

Saldo prepagato

Mantieni la spesa prevedibile per esperimenti e team piccoli.

Budget per progetto
Export utilizzo semplice
Adatto a pilot e QA

Inizia

Team

Uso governato

Gestisci progetti, chiavi, budget e policy dei modelli per i team di produzione.

Spesa per progetto e chiave
Controlli di budget
Report per il team

Inizia

BYOK

Usa le tue chiavi

Porta gli account provider esistenti in un unico livello di confronto e governance.

Chiavi provider sotto il tuo controllo
Catalogo modelli unificato
Routing pronto per le policy

Leggi la documentazione auth

Enterprise

Personalizzato

Termini commerciali privati per workload ad alto volume o con forte governance.

Pianificazione dei volumi
Design del mix provider
Supporto e review del rollout

Controlla la fatturazione

Calcolatore

Modello, token di input, token di output, richieste e stima mensile.

Usalo come stima pre-produzione. La fatturazione finale va riconciliata con i dati di utilizzo del provider e della piattaforma.

Formula di stima

Costo = richieste x ((token di input x prezzo input) + (token di output x prezzo output)) / 1,000,000.

La stima predefinita di Doubao Seed 2.0 Mini per 1M input e 1M output e ¥2.20.

Calcolatore prezzi

Stima la spesa mensile in base al prezzo del modello, ai token e al volume di richieste.

Modello

Token di input

Token di output

Richieste / mese

Stima mensile¥1.80Doubao Seed 2.0 Mini · token di input 0.2/1M · token di output 2/1M

Come stimare il costo di una API AI

Il costo di una API AI si stima moltiplicando il numero di richieste per i token di input e output, applicando poi il prezzo pubblico di ogni modello per 1M token. Prima di instradare traffico di produzione, il team dovrebbe calcolare un modello economico, un fallback di qualita e il volume mensile previsto.

Vuoi stimare prima il risparmio API?

Esegui CacheSafety Bench prima di attivare una policy di cache in produzione. Bad Hit Rate conta piu dell'hit rate grezzo.

Esegui CacheSafety Bench

Riferimento low-cost

Confronta i candidati low-cost prima di assegnare traffico.

Il prezzo e solo una dimensione. Valuta anche lunghezza del contesto, capacita, etichette sorgente e casi d'uso previsti prima dell'uso in produzione.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

Domande sui prezzi per team di prodotto e piattaforma

Come viene stimato il costo?

Il calcolatore moltiplica i token di input e output per il prezzo del modello selezionato per 1M token, poi applica il numero di richieste.

Doubao Seed 2.0 Mini costa ancora ¥2.20 per 1M input piu 1M output?

Si. ¥0.20 di input piu ¥2.00 di output fanno ¥2.20 per questa stima singola da 1M + 1M.

I team possono usare chiavi provider esistenti?

Si. Il piano BYOK e pensato per i team che hanno gia account provider e vogliono mantenere policy e report di utilizzo coerenti.

Esiste un prezzo enterprise?

Si. Il prezzo enterprise puo essere negoziato in base a volume, mix provider, regione, requisiti di supporto e governance.

Catalogo modelli Avvio rapido Ranking API LLM economiche

Paga per cio cheusi.

Modello, token di input, token di output, richieste e stima mensile.

Formula di stima

Calcolatore prezzi

Come stimare il costo di una API AI

Vuoi stimare prima il risparmio API?

Confronta i candidati low-cost prima di assegnare traffico.

Domande sui prezzi per team di prodotto e piattaforma

Come viene stimato il costo?

Doubao Seed 2.0 Mini costa ancora ¥2.20 per 1M input piu 1M output?

I team possono usare chiavi provider esistenti?

Esiste un prezzo enterprise?

Paga per cio che
usi.