सीधा उत्तर

यह पेज बताता है कि टीमें NextModel के OpenAI-संगत गेटवे का उपयोग कैसे करती हैं। लाइव कैशिंग चालू करने से पहले सुरक्षित LLM response पुनः-उपयोग को कैसे मापें, यह समझें। यहां सेटअप के व्यावहारिक चरण, कॉन्फ़िगरेशन नोट्स, और सामान्य प्रश्न जोड़े गए हैं।

यह परीक्षण क्यों है

अधिकतर cache परीक्षण सिर्फ hit rate optimize करते हैं। CacheSafety Bench इससे कड़ा सवाल पूछता है: क्या पुराना answer नए अनुरोध का सुरक्षित जवाब दे सकता है, बिना ऐसे bad hit के जिसे user देख सके?

सुरक्षित हिट रेटऐसे जवाब जिन्हें user कैश किया हुआ समझकर न पहचान सके
खराब हिट रेटअसुरक्षित रूप से पुनः-उपयोग किए गए जवाब
प्रति 1K अनुरोध बचतसुरक्षा शर्तों के तहत अनुमानित बचत
सिमैंटिक ट्रैप विफलता दरसमान दिखने वाले निर्देश कितनी बार पुनः-उपयोग में असफल होते हैं

दूरस्थ और स्थानीय स्थिति

स्थानीय मूल्यांकन open source है और किसी खास एंडपॉइंट पर निर्भर नहीं है। बड़े पुनः-चालन कार्य, मूल्यांकन मॉडल, और साझा की जा सकने वाली रिपोर्टों के लिए NextModel पर चलने वाले runs बेहतर हैं।

OpenAI-संगत एंडपॉइंट
export OPENAI_API_KEY=...
export OPENAI_BASE_URL=https://api.nextmodel.app/v1

कहाँ से शुरू करें

सार्वजनिक परीक्षण पृष्ठ से शुरू करें, फिर जब बड़े NextModel evaluations चलाने हों तभी API कुंजियों या बिलिंग पर जाएँ।

लैंडिंग पेज/benchmarks/cache-safety
API keys/dashboard/api-keys
बिलिंग/dashboard/billing