/ pricing

Jitna use karein
utna hibhugtan.

If you're comparing models for a live product, use the calculator first, then choose the plan that fits your spend pattern.

कैलकुलेटर खोलें मॉडल तुलना करें

Jitna istemal utna bhugtan

मॉडल दरें

हर मॉडल की इनपुट और आउटपुट टोकन कीमत से शुरुआत करें।

बड़ा अग्रिम अनुबंध नहीं
लॉन्च से पहले अनुमान
OpenAI-संगत रिक्वेस्ट

Shuru karein

क्रेडिट

प्रीपेड बैलेंस

एक्सपेरिमेंट और छोटी टीमों के लिए खर्च को ज्यादा अनुमानित रखें।

प्रोजेक्ट-स्तर बजट
उपयोग निर्यात आसान
पायलट और QA के लिए उपयुक्त

Shuru karein

टीम

नियंत्रित उपयोग

प्रोडक्शन टीमों के लिए प्रोजेक्ट, की, बजट और मॉडल नीति प्रबंधित करें।

प्रोजेक्ट और की के हिसाब से खर्च
बजट नियंत्रण
टीम रिपोर्टिंग

Shuru karein

BYOK

अपनी की का उपयोग करें

मौजूदा प्रदाता खातों को एक ही तुलना और गवर्नेंस लेयर में लाइए।

प्रदाता की आपके नियंत्रण में
एकीकृत मॉडल कैटलॉग
नीति-तैयार रूटिंग

प्रमाणीकरण दस्तावेज़ पढ़ें

Enterprise

कस्टम

उच्च-वॉल्यूम या कड़े गवर्नेंस वाले वर्कलोड के लिए निजी व्यावसायिक शर्तें।

वॉल्यूम योजना
प्रदाता मिश्रण डिज़ाइन
सपोर्ट और रोलआउट समीक्षा

बिलिंग देखें

कैलकुलेटर

मॉडल, इनपुट टोकन, आउटपुट टोकन, रिक्वेस्ट और मासिक अनुमान।

इसे प्री-प्रोडक्शन अनुमान के रूप में इस्तेमाल करें। अंतिम बिलिंग को प्रदाता उपयोग और प्लेटफॉर्म रिकॉर्ड के साथ मिलाना चाहिए।

अनुमान सूत्र

लागत = रिक्वेस्ट x ((इनपुट टोकन x इनपुट कीमत) + (आउटपुट टोकन x आउटपुट कीमत)) / 1,000,000.

Doubao Seed 2.0 Mini का 1M इनपुट और 1M आउटपुट के लिए डिफॉल्ट अनुमान है ¥2.20.

प्राइस कैलकुलेटर

मॉडल कीमत, टोकन और अनुरोध मात्रा के आधार पर मासिक खर्च का अनुमान लगाएं।

मॉडल

इनपुट टोकन

आउटपुट टोकन

अनुरोध / महीना

मासिक अनुमान¥1.80Doubao Seed 2.0 Mini · इनपुट टोकन 0.2/1M · आउटपुट टोकन 2/1M

AI API लागत का अनुमान कैसे लगाएं

AI API लागत का अनुमान रिक्वेस्ट की संख्या को इनपुट टोकन और आउटपुट टोकन से गुणा करके, फिर हर मॉडल की सार्वजनिक कीमत प्रति 1M टोकन के अनुसार निकाला जाता है। प्रोडक्शन ट्रैफिक रूट करने से पहले टीम को कम-लागत मॉडल, बेहतर गुणवत्ता वाले बैकअप मॉडल और अपेक्षित मासिक वॉल्यूम की गणना करनी चाहिए।

क्या पहले API बचत का अनुमान लगाना चाहते हैं?

प्रोडक्शन में कैश नीति सक्षम करने से पहले CacheSafety Bench चलाइए। Bad Hit Rate, साधारण hit rate से ज्यादा महत्वपूर्ण है।

CacheSafety Bench चलाइए

कम-लागत संदर्भ

ट्रैफिक भेजने से पहले कम-लागत मॉडल विकल्पों की तुलना करें।

कीमत सिर्फ एक पहलू है। प्रोडक्शन उपयोग से पहले कॉन्टेक्स्ट लंबाई, क्षमताएं, स्रोत लेबल और लक्षित उपयोग मामलों की भी समीक्षा करें।

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

प्रोडक्ट और प्लेटफॉर्म टीमों के लिए प्राइसिंग प्रश्न

लागत का अनुमान कैसे लगाया जाता है?

कैलकुलेटर इनपुट और आउटपुट टोकन को चुने गए मॉडल की कीमत प्रति 1M टोकन से गुणा करता है, फिर रिक्वेस्ट की संख्या लागू करता है।

क्या Doubao Seed 2.0 Mini अभी भी 1M इनपुट और 1M आउटपुट के लिए ¥2.20 है?

हाँ। ¥0.20 इनपुट और ¥2.00 आउटपुट मिलकर इस एकल 1M + 1M अनुमान के लिए ¥2.20 बनाते हैं।

क्या टीमें मौजूदा प्रदाता की का उपयोग कर सकती हैं?

हाँ। BYOK योजना उन टीमों के लिए बनाई गई है जिनके पास पहले से प्रदाता खाते हैं और जो एकसमान नीति व उपयोग रिपोर्टिंग चाहती हैं।

क्या एंटरप्राइज़ प्राइसिंग उपलब्ध है?

हाँ। एंटरप्राइज़ प्राइसिंग पर वॉल्यूम, प्रदाता मिश्रण, क्षेत्र, सपोर्ट आवश्यकताओं और गवर्नेंस जरूरतों के आधार पर चर्चा की जा सकती है।

मॉडल मार्केटप्लेस क्विकस्टार्ट कम-लागत LLM API रैंकिंग

Jitna use kareinutna hibhugtan.

मॉडल, इनपुट टोकन, आउटपुट टोकन, रिक्वेस्ट और मासिक अनुमान।

अनुमान सूत्र

प्राइस कैलकुलेटर

AI API लागत का अनुमान कैसे लगाएं

क्या पहले API बचत का अनुमान लगाना चाहते हैं?

ट्रैफिक भेजने से पहले कम-लागत मॉडल विकल्पों की तुलना करें।

प्रोडक्ट और प्लेटफॉर्म टीमों के लिए प्राइसिंग प्रश्न

लागत का अनुमान कैसे लगाया जाता है?

क्या Doubao Seed 2.0 Mini अभी भी 1M इनपुट और 1M आउटपुट के लिए ¥2.20 है?

क्या टीमें मौजूदा प्रदाता की का उपयोग कर सकती हैं?

क्या एंटरप्राइज़ प्राइसिंग उपलब्ध है?

Jitna use karein
utna hibhugtan.