Pague pelo uso
Precos dos modelosComece pelo preco dos tokens de entrada e saida de cada modelo.
- Sem grande contrato inicial
- Estimativa antes do lancamento
- Pedidos compativeis com OpenAI
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Pague pelo uso
Precos dos modelosComece pelo preco dos tokens de entrada e saida de cada modelo.
Creditos
Saldo pre-pagoMantem a despesa previsivel para experiencias e equipas pequenas.
Equipa
Uso governadoGira projetos, chaves, orcamentos e politicas de modelos para equipas em producao.
BYOK
Use as suas chavesTraga contas de fornecedores existentes para uma unica camada de comparacao e governanca.
Enterprise
PersonalizadoCondicoes comerciais privadas para workloads com grande volume ou forte governanca.
Calculadora
Use isto como estimativa antes da producao. A faturacao final deve ser conciliada com o uso do fornecedor e os registos de uso da plataforma.
Custo = pedidos x ((tokens de entrada x preco de entrada) + (tokens de saida x preco de saida)) / 1,000,000.
A estimativa predefinida do Doubao Seed 2.0 Mini para 1M de entrada e 1M de saida e ¥2.20.
Estime o gasto mensal a partir do preco do modelo, dos tokens e do volume de pedidos.
O custo de uma API de IA e estimado multiplicando o numero de pedidos pelos tokens de entrada e saida e aplicando depois o preco publicado de cada modelo por 1M de tokens. Antes de encaminhar trafego de producao, a equipa deve calcular um modelo de baixo custo, um fallback de qualidade e o volume mensal esperado.
Execute o CacheSafety Bench antes de ativar uma politica de cache em producao. O Bad Hit Rate importa mais do que a hit rate bruta.
Executar CacheSafety BenchReferencia de baixo custo
O preco e apenas uma dimensao. Reveja tambem contexto, capacidades, rotulos de origem e casos de uso previstos antes do uso em producao.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
A calculadora multiplica os tokens de entrada e saida pelo preco do modelo selecionado por 1M de tokens e depois aplica o numero de pedidos.
Sim. ¥0.20 de entrada mais ¥2.00 de saida resultam em ¥2.20 para esta estimativa unica de 1M + 1M.
Sim. O plano BYOK foi pensado para equipas que ja possuem contas em fornecedores e querem manter politicas e relatorios de uso consistentes.
Sim. O preco enterprise pode ser negociado conforme volume, mix de fornecedores, regiao, requisitos de suporte e necessidades de governanca.