prompt caching でどれくらい節約できますか?
節約額は繰り返し率に比例します。この estimator は安全に cache できる繰り返し request にだけ保守的な割引をかけるため、本番でも現実的な予測になります。
Estimate safe savings from repeated request hashes.
繰り返し request hash から安全な節約額を見積もります。request の要約を貼り付けると、exact・structured・semantic の繰り返し率と、危険な hit を過大評価しない保守的なキャッシュ節約額を確認できます。
入力はこのブラウザ内で処理されます。実際の API key は貼り付けないでください。
FAQ
節約額は繰り返し率に比例します。この estimator は安全に cache できる繰り返し request にだけ保守的な割引をかけるため、本番でも現実的な予測になります。
model、prompt hash、token 数を含む request summary が必要です。hash により prompt 本文を見ずに繰り返しを検出できます。
すべての繰り返しが安全に cache できるわけではないためです。estimator は鮮度と semantic リスクを織り込んで節約額を控えめにします。