الدفع حسب الاستخدام
سعر النموذجابدأ من تسعير الإدخال والإخراج لكل نموذج.
- من غير عقد مقدم كبير
- قدّر التكلفة قبل الإطلاق
- استخدم طلبات متوافقة مع OpenAI
إذا كنت تقارن النماذج لمنتج يعمل في مصر، فابدأ بالحاسبة ثم اختر الخطة التي تناسب نمط الإنفاق وحركة الاستخدام المتوقعة.
الدفع حسب الاستخدام
سعر النموذجابدأ من تسعير الإدخال والإخراج لكل نموذج.
الرصيد
رصيد مدفوع مقدمًاخلّي الإنفاق أوضح للتجارب والفرق الصغيرة.
الفريق
استخدام منظمأدر المشاريع والمفاتيح والميزانيات وسياسة النماذج لفرق الإنتاج.
BYOK
استخدم مفاتيحكاجمع حسابات المزوّدين الحالية في طبقة موحدة للمقارنة والحوكمة.
المؤسسات
مخصصشروط تجارية خاصة للأحمال الكبيرة أو المتطلبات التنظيمية العالية.
الحاسبة
استخدمها كتقدير قبل الإنتاج، ثم طابق الفاتورة النهائية مع سجلات الاستخدام لدى المزوّد والمنصة.
التكلفة = عدد الطلبات x ((tokens الإدخال x سعر الإدخال) + (tokens الإخراج x سعر الإخراج)) / 1,000,000.
التقدير الافتراضي لـ Doubao Seed 2.0 Mini عند 1M إدخال و1M إخراج هو ¥2.20.
قدّر الانفاق الشهري استنادا الى سعر النموذج والرموز وحجم الطلبات لعمليات مصر.
تقدير تكلفة AI API بيتم عن طريق ضرب عدد الطلبات في tokens الإدخال وtokens الإخراج ثم تطبيق السعر المعلن لكل نموذج لكل 1M tokens. قبل توجيه حركة الإنتاج، الأفضل تحسب نموذج منخفض التكلفة وخيار احتياطي أعلى جودة وحجم الطلبات الشهري المتوقع.
شغّل CacheSafety Bench قبل تفعيل سياسة التخزين المؤقت في الإنتاج. Bad Hit Rate أهم من hit rate الخام.
شغّل CacheSafety Benchمرجع منخفض التكلفة
السعر مش العامل الوحيد. راجع طول السياق والقدرات ووسوم المصدر وحالات الاستخدام قبل اعتماد النموذج في الإنتاج.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
الحاسبة بتضرب tokens الإدخال وtokens الإخراج في سعر النموذج المختار لكل 1M tokens، وبعدها بتضرب الناتج في عدد الطلبات.
أيوه. ¥0.20 للإدخال + ¥2.00 للإخراج = ¥2.20 للتقدير الفردي 1M + 1M.
أيوه. BYOK معمول للفرق اللي عندها حسابات مزوّدين بالفعل وعايزة سياسة موحدة وتقارير استخدام ثابتة.
أيوه. ممكن يتفاوض عليه حسب الحجم ومزيج المزوّدين والمنطقة ومتطلبات الدعم والحوكمة.