منتشرشده در 2026-05-27 · پژوهش NextModel

پاسخ مستقیم

چرا Safe Hit Rate و Bad Hit Rate هنگام ارزیابی استفاده مجدد از پاسخ‌های LLM مهم‌تر از hit rate خام هستند. این راهنما برای تیم‌های محصول و پلتفرم نوشته شده که کیفیت مدل، هزینه، سیاست مسیریابی و ریسک انتشار را مقایسه می‌کنند.

چرا hit rate گمراه‌کننده است؟

یک cache ممکن است روی کاغذ کارآمد به نظر برسد، اما در عمل مدل را اشتباه نشان دهد. Bad Hit Rate شکست‌هایی را ثبت می‌کند که کاربر واقعاً متوجه می‌شود: facts قدیمی، format خراب، quantity اشتباه و semantic trapها.

به‌جای آن چه چیزهایی را باید اندازه گرفت؟

تیم‌ها باید پیش از عبور دادن ترافیک تولید از لایه بازاستفاده، Safe Hit Rate، Bad Hit Rate، صرفه‌جویی هزینه به‌ازای هر 1K درخواست و نرخ شکست تله‌های معنایی را اندازه بگیرند.

  • Safe Hit Rate استفاده مجدد نامرئی را اندازه می‌گیرد.
  • Bad Hit Rate خط ایمنی را اندازه می‌گیرد.
  • Semantic trapها نشان می‌دهند آیا درخواست‌های مشابه هنوز به پاسخ تازه نیاز دارند یا نه.

CacheSafety Bench چگونه جا می‌افتد

CacheSafety Bench یک آزمون متن‌باز برای اندازه‌گیری استفاده مجدد ایمن از پاسخ‌های LLM است که ابتدا به‌صورت محلی اجرا می‌شود و برای کارهای بازپخش بزرگ‌تر، ارزیابی میزبانی‌شده اختیاری در NextModel دارد.