Pago por uso
Tarifas del modeloEmpieza con el precio por token de entrada y salida de cada modelo.
- Sin gran contrato inicial
- Estimacion antes del lanzamiento
- Solicitudes compatibles con OpenAI
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Pago por uso
Tarifas del modeloEmpieza con el precio por token de entrada y salida de cada modelo.
Creditos
Saldo prepagoMantiene el gasto previsible para experimentos y equipos pequenos.
Equipo
Uso gobernadoGestiona proyectos, claves, presupuestos y politicas de modelos para equipos en produccion.
BYOK
Usa tus clavesIntegra cuentas de proveedores existentes en una sola capa de comparacion y gobernanza.
Enterprise
PersonalizadoCondiciones comerciales privadas para cargas con alto volumen o fuerte gobernanza.
Calculadora
Usa esto como una estimacion previa a produccion. La facturacion final debe conciliarse con el uso del proveedor y los registros de uso de la plataforma.
Costo = solicitudes x ((tokens de entrada x precio de entrada) + (tokens de salida x precio de salida)) / 1,000,000.
La estimacion predeterminada de Doubao Seed 2.0 Mini para 1M de entrada y 1M de salida es ¥2.20.
Estima el gasto mensual segun el precio del modelo, los tokens y el volumen de solicitudes.
El costo de una API de IA se estima multiplicando el numero de solicitudes por los tokens de entrada y de salida, y aplicando despues el precio publicado por cada modelo por 1M de tokens. Antes de enrutar trafico de produccion, conviene calcular un modelo de bajo costo, un respaldo de calidad y el volumen mensual esperado.
Ejecuta CacheSafety Bench antes de activar una politica de cache en produccion. El Bad Hit Rate importa mas que el hit rate bruto.
Ejecutar CacheSafety BenchReferencia de bajo costo
El precio es solo una variable. Revisa tambien la longitud de contexto, capacidades, etiquetas de fuente y casos de uso previstos antes de usarlos en produccion.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
La calculadora multiplica los tokens de entrada y salida por el precio del modelo seleccionado por 1M de tokens y despues aplica el numero de solicitudes.
Si. ¥0.20 de entrada mas ¥2.00 de salida dan ¥2.20 para esta estimacion unica de 1M + 1M.
Si. El plan BYOK esta pensado para equipos que ya tienen cuentas de proveedor y quieren mantener politicas y reportes de uso consistentes.
Si. El precio enterprise puede negociarse segun volumen, mezcla de proveedores, region, requisitos de soporte y necesidades de gobernanza.