الجواب المباشر

تشرح هذه الصفحة كيف تستخدم الفرق بوابة NextModel المتوافقة مع OpenAI. تعرّف إلى طريقة قياس إعادة استخدام ردود LLM الآمنة قبل تفعيل التخزين المؤقت في الإنتاج. وتضيف الخطوات العملية، وملاحظات الإعداد، والأسئلة الشائعة.

لماذا أُنشئ هذا المعيار؟

معظم معايير التخزين المؤقت لا تفعل أكثر من تحسين معدل الضربات. أما CacheSafety Bench فيطرح سؤالاً أدق: هل يمكن لإجابة قديمة أن تُجيب بأمان عن طلب جديد من دون إنشاء hit خاطئ يلاحظه المستخدم؟

معدل الضربات الآمنة (Safe Hit Rate)ردود قابلة لإعادة الاستخدام من دون أن يلاحظ المستخدم أنها مخزنة
معدل الضربات الخاطئة (Bad Hit Rate)ردود معاد استخدامها بشكل غير آمن
التكلفة الموفّرة / 1K طلبتوفير تقديري ضمن شرط السلامة
معدل فشل الفخ الدلاليعدد المرات التي تفشل فيها المطالبات المتشابهة في إعادة الاستخدام

النسخة المستضافة والنسخة المحلية

النسخة المحلية من المعيار مفتوحة المصدر ولا ترتبط بنقطة نهاية محددة. أما التشغيل المستضاف في NextModel فيناسب مهام إعادة التشغيل الأكبر ونماذج التقييم والتقارير القابلة للمشاركة.

نقطة نهاية متوافقة مع OpenAI
export OPENAI_API_KEY=...
export OPENAI_BASE_URL=https://api.nextmodel.app/v1

من أين تبدأ؟

ابدأ بصفحة المعيار العامة، ثم انتقل إلى مفاتيح API أو الفوترة فقط عندما تكون مستعداً لتشغيل تقييمات مستضافة أكبر.

الصفحة الرئيسية/benchmarks/cache-safety
مفاتيح API/dashboard/api-keys
الفوترة/dashboard/billing