Jitna istemal utna bhugtan
मॉडल दरेंहर मॉडल की इनपुट और आउटपुट टोकन कीमत से शुरुआत करें।
- बड़ा अग्रिम अनुबंध नहीं
- लॉन्च से पहले अनुमान
- OpenAI-संगत रिक्वेस्ट
If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.
Jitna istemal utna bhugtan
मॉडल दरेंहर मॉडल की इनपुट और आउटपुट टोकन कीमत से शुरुआत करें।
क्रेडिट
प्रीपेड बैलेंसएक्सपेरिमेंट और छोटी टीमों के लिए खर्च को ज्यादा अनुमानित रखें।
टीम
नियंत्रित उपयोगप्रोडक्शन टीमों के लिए प्रोजेक्ट, की, बजट और मॉडल नीति प्रबंधित करें।
BYOK
अपनी की का उपयोग करेंमौजूदा प्रदाता खातों को एक ही तुलना और गवर्नेंस लेयर में लाइए।
Enterprise
कस्टमउच्च-वॉल्यूम या कड़े गवर्नेंस वाले वर्कलोड के लिए निजी व्यावसायिक शर्तें।
कैलकुलेटर
इसे प्री-प्रोडक्शन अनुमान के रूप में इस्तेमाल करें। अंतिम बिलिंग को प्रदाता उपयोग और प्लेटफॉर्म रिकॉर्ड के साथ मिलाना चाहिए।
लागत = रिक्वेस्ट x ((इनपुट टोकन x इनपुट कीमत) + (आउटपुट टोकन x आउटपुट कीमत)) / 1,000,000.
Doubao Seed 2.0 Mini का 1M इनपुट और 1M आउटपुट के लिए डिफॉल्ट अनुमान है ¥2.20.
मॉडल कीमत, टोकन और अनुरोध मात्रा के आधार पर मासिक खर्च का अनुमान लगाएं।
AI API लागत का अनुमान रिक्वेस्ट की संख्या को इनपुट टोकन और आउटपुट टोकन से गुणा करके, फिर हर मॉडल की सार्वजनिक कीमत प्रति 1M टोकन के अनुसार निकाला जाता है। प्रोडक्शन ट्रैफिक रूट करने से पहले टीम को कम-लागत मॉडल, बेहतर गुणवत्ता वाले बैकअप मॉडल और अपेक्षित मासिक वॉल्यूम की गणना करनी चाहिए।
प्रोडक्शन में कैश नीति सक्षम करने से पहले CacheSafety Bench चलाइए। Bad Hit Rate, साधारण hit rate से ज्यादा महत्वपूर्ण है।
CacheSafety Bench चलाइएकम-लागत संदर्भ
कीमत सिर्फ एक पहलू है। प्रोडक्शन उपयोग से पहले कॉन्टेक्स्ट लंबाई, क्षमताएं, स्रोत लेबल और लक्षित उपयोग मामलों की भी समीक्षा करें।
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
कैलकुलेटर इनपुट और आउटपुट टोकन को चुने गए मॉडल की कीमत प्रति 1M टोकन से गुणा करता है, फिर रिक्वेस्ट की संख्या लागू करता है।
हाँ। ¥0.20 इनपुट और ¥2.00 आउटपुट मिलकर इस एकल 1M + 1M अनुमान के लिए ¥2.20 बनाते हैं।
हाँ। BYOK योजना उन टीमों के लिए बनाई गई है जिनके पास पहले से प्रदाता खाते हैं और जो एकसमान नीति व उपयोग रिपोर्टिंग चाहती हैं।
हाँ। एंटरप्राइज़ प्राइसिंग पर वॉल्यूम, प्रदाता मिश्रण, क्षेत्र, सपोर्ट आवश्यकताओं और गवर्नेंस जरूरतों के आधार पर चर्चा की जा सकती है।