핵심

이 페이지는 NextModel의 OpenAI 호환 게이트웨이를 어떻게 쓰는지 설명합니다. 운영 캐시를 켜기 전에 안전한 LLM 응답 재사용을 어떻게 측정하는지 보여줍니다. 실제 접속 단계, 설정 포인트, 자주 묻는 질문을 덧붙입니다.

이 벤치마크가 필요한 이유

대부분의 캐시 벤치마크는 히트율만 최적화합니다. CacheSafety Bench는 오래된 답변이 새 요청에 안전하게 답할 수 있는지, 사용자에게 보일 만큼 나쁜 히트를 만들지 않는지를 더 엄격하게 묻습니다.

로컬 벤치마크는 오픈소스이며 엔드포인트에 독립적입니다. NextModel 호스트 실행은 대규모 리플레이 작업, 판정 모델, 공유 가능한 리포트에 더 적합합니다.

OpenAI 호환 엔드포인트

export OPENAI_API_KEY=...
export OPENAI_BASE_URL=https://api.nextmodel.app/v1

공개 벤치마크 페이지부터 시작하고, 더 큰 호스팅 평가를 돌릴 준비가 되었을 때만 API 키나 청구 페이지로 넘어가세요.