الدفع حسب الاستخدام
سعر النموذجابدأ من تسعير الإدخال والإخراج لكل نموذج.
- من دون عقد مسبق كبير
- قدّر التكلفة قبل الإطلاق
- استخدم طلبات متوافقة مع OpenAI
إذا كنت تقارن النماذج لمنتج يعمل في السعودية، فابدأ بالحاسبة ثم اختر الخطة التي تناسب نمط الإنفاق ومتطلبات الحوكمة.
الدفع حسب الاستخدام
سعر النموذجابدأ من تسعير الإدخال والإخراج لكل نموذج.
الرصيد
رصيد مدفوع مسبقاًاجعل الإنفاق أكثر قابلية للتوقع للتجارب والفرق الصغيرة.
الفريق
استخدام خاضع للحوكمةأدر المشاريع والمفاتيح والميزانيات وسياسة النماذج لفرق الإنتاج.
BYOK
استخدم مفاتيحكاجمع حسابات المزوّدين الحالية داخل طبقة موحدة للمقارنة والحوكمة.
المؤسسات
مخصصشروط تجارية خاصة للأحمال ذات الحجم الكبير أو المتطلبات التنظيمية العالية.
الحاسبة
استخدمها كتقدير قبل الإنتاج، ثم طابق الفاتورة النهائية مع سجلات الاستخدام لدى المزوّد والمنصة.
التكلفة = عدد الطلبات x ((tokens الإدخال x سعر الإدخال) + (tokens الإخراج x سعر الإخراج)) / 1,000,000.
التقدير الافتراضي لـ Doubao Seed 2.0 Mini عند 1M إدخال و1M إخراج هو ¥2.20.
قدّر الانفاق الشهري استنادا الى سعر النموذج والرموز وحجم الطلبات لعمليات السعودية.
تُقدَّر تكلفة AI API عبر ضرب عدد الطلبات في tokens الإدخال وtokens الإخراج ثم تطبيق السعر المعلن لكل نموذج لكل 1M tokens. قبل توجيه حركة الإنتاج، من الأفضل حساب نموذج منخفض التكلفة، وخيار احتياطي أعلى جودة، وحجم الطلبات الشهري المتوقع.
شغّل CacheSafety Bench قبل تفعيل سياسة التخزين المؤقت في الإنتاج. Bad Hit Rate أهم من hit rate الخام.
شغّل CacheSafety Benchمرجع منخفض التكلفة
السعر ليس العامل الوحيد. راجع طول context والقدرات ووسوم المصدر وحالات الاستخدام قبل اعتماد النموذج في الإنتاج.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
تضرب الحاسبة tokens الإدخال وtokens الإخراج في سعر النموذج المختار لكل 1M tokens، ثم تضرب الناتج في عدد الطلبات.
نعم. ¥0.20 للإدخال + ¥2.00 للإخراج = ¥2.20 لهذا التقدير المفرد 1M + 1M.
نعم. تم تصميم BYOK للفرق التي لديها حسابات مزوّدين قائمة وتحتاج إلى سياسة موحدة وتقارير استخدام متسقة.
نعم. يمكن التفاوض عليها حسب الحجم ومزيج المزوّدين والمنطقة ومتطلبات الدعم والحوكمة.