Pago por uso
Tarifas del modeloEmpieza con el precio por token de entrada y salida de cada modelo.
- Sin contrato inicial grande
- Estimacion antes del lanzamiento
- Solicitudes compatibles con OpenAI
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Pago por uso
Tarifas del modeloEmpieza con el precio por token de entrada y salida de cada modelo.
Creditos
Saldo prepagadoMantiene el gasto mas predecible para experimentos y equipos pequenos.
Equipo
Uso gobernadoAdministra proyectos, llaves, presupuestos y politicas de modelos para equipos de produccion.
BYOK
Usa tus llavesIntegra cuentas de proveedores existentes en una sola capa de comparacion y gobernanza.
Enterprise
PersonalizadoCondiciones comerciales privadas para cargas de alto volumen o con gobernanza estricta.
Calculadora
Usa esto como una estimacion antes de produccion. La facturacion final debe reconciliarse con el uso del proveedor y los registros de la plataforma.
Costo = solicitudes x ((tokens de entrada x precio de entrada) + (tokens de salida x precio de salida)) / 1,000,000.
La estimacion por defecto de Doubao Seed 2.0 Mini para 1M de entrada y 1M de salida es ¥2.20.
Estima el gasto mensual segun el precio del modelo, los tokens y el volumen de solicitudes.
El costo de una API de IA se estima multiplicando el numero de solicitudes por los tokens de entrada y salida y aplicando el precio publicado de cada modelo por 1M de tokens. Antes de mandar trafico de produccion, conviene calcular un modelo economico, un respaldo de calidad y el volumen mensual esperado.
Ejecuta CacheSafety Bench antes de activar una politica de cache en produccion. El Bad Hit Rate importa mas que el hit rate bruto.
Ejecutar CacheSafety BenchReferencia de bajo costo
El precio es solo una dimension. Revisa tambien la longitud de contexto, capacidades, etiquetas de fuente y casos de uso previstos antes de usarlos en produccion.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
La calculadora multiplica los tokens de entrada y salida por el precio del modelo seleccionado por 1M de tokens y luego aplica el numero de solicitudes.
Si. ¥0.20 de entrada mas ¥2.00 de salida dan ¥2.20 para esta estimacion de 1M + 1M.
Si. El plan BYOK esta pensado para equipos que ya tienen cuentas de proveedor y quieren mantener politicas y reportes de uso consistentes.
Si. El precio enterprise puede negociarse segun volumen, mezcla de proveedores, region, requisitos de soporte y necesidades de gobernanza.