איך מעריכים את עלות AI API לפני השקה?
כופלים את ממוצע טוקני הקלט במחיר הקלט ואת ממוצע טוקני הפלט במחיר הפלט לכל request, ואז מכפילים בנפח החודשי. המחשבון הזה עושה זאת על פני כמה מודלים ומוסיף התאמות של cache ו-batch.
Estimate monthly LLM API cost across input, output, batch, and cache assumptions.
מחשבון עלות AI API מעריך את ההוצאה החודשית על LLM לפי נפח ה-requestים, ממוצע טוקני הקלט והפלט, והמחיר לכל מודל לפני שמעבירים טראפיק לפרודקשן. הוא לוקח בחשבון גם prompt caching, הנחות batch ו-streaming כדי להתקרב יותר לטראפיק האמיתי.
הקלטים מעובדים בתוך הדפדפן הזה; אל תדביקו מפתחות API אמיתיים.
price_source_should_be_verified, model_not_marked_production
FAQ
כופלים את ממוצע טוקני הקלט במחיר הקלט ואת ממוצע טוקני הפלט במחיר הפלט לכל request, ואז מכפילים בנפח החודשי. המחשבון הזה עושה זאת על פני כמה מודלים ומוסיף התאמות של cache ו-batch.
כן. אפשר לשמור ב-cache קידומות קלט שחוזרות על עצמן וכך להוריד את עלות הקלט. המחשבון מיישם הנחת cache שמרנית שניתן לכוונן לפי hit rate; עדיף לאמת זאת קודם עם cacheability checker.
בדרך כלל הסיבות הן טוקני פלט, overhead של streaming ו-retry. יצאו את החשבון ונתחו אותו עם AI API bill analyzer כדי למצוא את הפער.
כלים קשורים
השלב הבא
העתק את כתובת הבסיס של ה-API, השווה פרטי מודלים או צור מפתח כשאתה מוכן לבדיקת תאימות אמיתית.