Loading...Working on your request
Onbellek benchmark

CacheSafety Bench

Uretim onbellegini acmadan once LLM yanitlarinin guvenli yeniden kullanimini olcun.

Cogu cache benchmarki yalnizca hit rate'i optimize eder. CacheSafety Bench Safe Hit Rate, Bad Hit Rate ve API maliyet tasarrufunu da olcer.

Docs oku

Problem

Tek basina hit rate yetmez.

Semantic caching maliyeti dusurebilir, ancak tek bir bad hit bile modeli yanlis gosterebilir. CacheSafety Bench iki prompt benziyor mu diye degil, yeniden kullanim guvenli mi diye olcer.

Ana metrikler

Olcegi olcmeden once guvenligi olcun.

SH
GuvenlikSafe Hit Rate

Kullanicinin fark etmeyecegi yeniden kullanimi sayin.

BH
GuardrailBad Hit Rate

Bu, production cache oncesindeki sert guvenlik cizgisidir.

$/K
EkonomiCost Saved / 1K Requests

Tasarrufu ancak guvenli yeniden kullanim dogrulandiktan sonra hesaplayin.

TR
Tuzak testiSemantic Trap Failure Rate

Benzer promptlarin hala yeniden kullanimi bozup bozmadigini gosterir.

Nasil calisir

Onbellege guvenmeden once uc adim.

P1
ReplayRequest ciftlerini yeniden oynatin

old_request, old_answer ve new_request degerlerini muhafazakar bir benchmark runnerdan gecirin.

P2
DegerlendirGuvenli yeniden kullanimi degerlendirin

Eski cevabin yeni requesti gizli ihlal olmadan gercekten karsilayip karsilamadigini kontrol edin.

P3
PolitikaGuvenli tasarrufu tahmin edin

Production rollout oncesinde bir rapor ve ihtiyatli politika onerisi disa aktarın.

Rapor onizlemesi

Statik ornek rapor

Iyi bir cache politikasi, kullanici cevaplarin yeniden kullanildigini fark etmeden maliyet dusurur.

Toplam cift2,000
Safe Hit Rate18.4%
Bad Hit Rate0.0%
Cost Saved / 1K Requests$0.42
Onerilen politikaExact + Canonical
Semantic cacheNot recommended yet

Hosted run

Yerel benchmark ucretsiz ve open source'tur. Hosted runs istege baglidir.

NextModel hosted benchmark daha buyuk replayler, judge models ve paylasilabilir raporlar icin kredi kullanir. Yerel runlar open source ve endpoint-neutral kalir.

Guvenli tasarruf production cache'ten once olculmelidir. Hosted runs daha buyuk degerlendirmeler icindir, benchmarkin on kosulu degildir.

Developer entegrasyonu

OpenAI uyumlu istemcilerle calisir.

CacheSafety Bench open source ve endpoint-neutral kalir. NextModel yalnizca istege bagli bir hosted endpoint ve production gateway'dir.

OpenAI uyumlu ornek
export OPENAI_API_KEY=...
export OPENAI_BASE_URL=https://api.nextmodel.app/v1

SSS

Sik sorulan sorular

Bu bir semantic cache mi?

Hayir. CacheSafety Bench, LLM yanitlarinin guvenli yeniden kullanimini olcen bir benchmarktir; semantic cache'in varsayilan olarak acilmasi gerektigine dair bir vaat degildir.

NextModel kullanmam gerekir mi?

Hayir. Yerel benchmark calismalari open source ve endpoint-neutraldir. NextModel uzerindeki hosted runs istege baglidir.

Bad hit nedir?

Bad hit, yeni request icin donmemesi gereken; cunku gercekleri, kisitlari, zamani, formati veya kullanici beklentisini ihlal eden yeniden kullanilmis bir cevaptir.

Bunu yerelde calistirabilir miyim?

Evet. Benchmark once sizin kontrol ettiginiz toy, sentetik veya ozel datasetlerle yerelde calisacak sekilde tasarlanmistir.

Simdi baslayin

Production oncesinde guvenli LLM yanit reuse'unu olcun.

Once acik benchmarki yerelde calistirin; daha buyuk replay jobs ve paylasilabilir raporlar gerektiginde hosted workflow'u kullanin.