תשלום לפי שימוש
תעריפי מודליםהתחילו מתמחור ה-input וה-output של כל מודל.
- בלי חוזה גדול מראש
- הערכה לפני השקה
- בקשות תואמות OpenAI
אם אתם משווים מודלים עבור מוצר חי, התחילו עם המחשבון ואז בחרו בתוכנית שמתאימה לדפוס ההוצאה שלכם.
תשלום לפי שימוש
תעריפי מודליםהתחילו מתמחור ה-input וה-output של כל מודל.
קרדיטים
יתרה מראששמרו על הוצאה צפויה יותר לניסויים ולצוותים קטנים.
צוות
שימוש מנוהלנהלו פרויקטים, מפתחות, תקציבים ומדיניות מודלים עבור צוותי פרודקשן.
BYOK
השתמשו במפתחות שלכםאחדו חשבונות ספקים קיימים בשכבת השוואה וממשל אחת.
אנטרפרייז
מותאם אישיתתנאים מסחריים פרטיים לעומסים גדולים או דרישות ממשל מחמירות.
מחשבון
השתמשו בזה כהערכה לפני פרודקשן. את החיוב הסופי צריך ליישב מול רישומי השימוש של הספק והפלטפורמה.
עלות = מספר הבקשות x ((טוקני קלט x מחיר קלט) + (טוקני פלט x מחיר פלט)) / 1,000,000.
ההערכה ברירת המחדל של Doubao Seed 2.0 Mini עבור 1M קלט ו-1M פלט היא ¥2.20.
הערך את ההוצאה החודשית לפי מחיר המודל, הטוקנים ונפח הבקשות.
עלות של AI API מוערכת על ידי הכפלת מספר הבקשות בטוקני קלט ובטוקני פלט ואז החלת המחיר הציבורי של כל מודל לכל מיליון טוקנים. לפני ניתוב תעבורת פרודקשן, כדאי לצוות לחשב מודל בעלות נמוכה, מודל גיבוי לאיכות ונפח חודשי צפוי.
הריצו CacheSafety Bench לפני הפעלת מדיניות מטמון בפרודקשן. שיעור פגיעות מטמון שגויות חשוב יותר משיעור הפגיעות הגולמי.
הריצו CacheSafety Benchייחוס עלות נמוכה
מחיר הוא רק ממד אחד. בדקו גם אורך ההקשר, יכולות, תוויות מקור ומקרי שימוש מתוכננים לפני פרודקשן.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
המחשבון מכפיל טוקני קלט וטוקני פלט במחיר המודל הנבחר לכל מיליון טוקנים, ואז מחיל את מספר הבקשות.
כן. ¥0.20 לקלט ועוד ¥2.00 לפלט נותנים ¥2.20 עבור הערכת 1M + 1M הזאת.
כן. תוכנית BYOK מיועדת לצוותים שכבר יש להם חשבונות ספקים ורוצים מדיניות ודוחות שימוש עקביים.
כן. אפשר לתאם אותו לפי נפח, תמהיל ספקים, אזור, דרישות תמיכה וצרכי ממשל.