Paiement a l'usage
Tarifs des modelesCommencez par les prix des tokens d'entree et de sortie pour chaque modele.
- Pas de gros contrat initial
- Estimation avant lancement
- Requetes compatibles OpenAI
Si vous comparez des modeles pour un produit en production, commencez par le calculateur puis choisissez l'offre adaptee a votre depense.
Paiement a l'usage
Tarifs des modelesCommencez par les prix des tokens d'entree et de sortie pour chaque modele.
Credits
Solde prepayeGardez des depenses previsibles pour les essais et les petites equipes.
Equipe
Usage gouverneGerez projets, cles, budgets et politiques de modeles pour les equipes en production.
BYOK
Utilisez vos clesRassemblez vos comptes fournisseurs existants dans une meme couche de comparaison et de gouvernance.
Entreprise
Sur mesureConditions commerciales privees pour des charges a fort volume ou fortement gouvernees.
Calculateur
Utilisez ceci comme estimation avant mise en production. La facturation finale doit etre rapprochee des usages du fournisseur et des relevés de la plateforme.
Cout = requetes x ((tokens d'entree x prix d'entree) + (tokens de sortie x prix de sortie)) / 1,000,000.
L'estimation par defaut pour Doubao Seed 2.0 Mini avec 1M en entree et 1M en sortie est ¥2.20.
Estimez la depense mensuelle a partir du prix du modele, des tokens et du volume de requetes.
Le cout d'une API IA se calcule en multipliant le nombre de requetes par les tokens d'entree et de sortie, puis en appliquant le prix public de chaque modele par million de tokens. Avant d'acheminer du trafic de production, il faut chiffrer un modele economique, un modele de repli qualite et le volume mensuel attendu.
Lancez CacheSafety Bench avant d'activer une politique de cache en production. Le Bad Hit Rate compte plus que le simple hit rate.
Lancer CacheSafety BenchReference a bas cout
Le prix n'est qu'un critere. Verifiez aussi la longueur de contexte, les capacites, les labels de source et les cas d'usage prevus avant un usage en production.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Le calculateur multiplie les tokens d'entree et de sortie par le prix du modele selectionne par million de tokens, puis applique le nombre de requetes.
Oui. ¥0.20 en entree plus ¥2.00 en sortie donnent ¥2.20 pour cette estimation unique de 1M + 1M.
Oui. L'offre BYOK est faite pour les equipes qui ont deja des comptes fournisseurs et veulent une politique et un suivi d'usage coherents.
Oui. La tarification entreprise se negocie selon le volume, le mix fournisseurs, la region, les besoins de support et les exigences de gouvernance.