Loading...Working on your request
/ tools / jp / cache-savings-estimator

Cache Savings Estimator

Estimate safe savings from repeated request hashes.

繰り返し request hash から安全な節約額を見積もります。request の要約を貼り付けると、exact・structured・semantic の繰り返し率と、危険な hit を過大評価しない保守的なキャッシュ節約額を確認できます。

  • request hash から exact と structured の繰り返し率を測る
  • 安全性を織り込んだ保守的な cache savings を見積もる
  • cache すべきでない行を特定する

Cache Savings

入力はこのブラウザ内で処理されます。実際の API key は貼り付けないでください。

診断レポート

rowCount
2
exactRepeatRate
0.5
structuredRepeatRate
1
semanticRepeatRate
0.3
safeSavings
0.000483
notRecommendedCount
0
API key を作成

FAQ

Cache Savings Estimator FAQ

prompt caching でどれくらい節約できますか?

節約額は繰り返し率に比例します。この estimator は安全に cache できる繰り返し request にだけ保守的な割引をかけるため、本番でも現実的な予測になります。

どんなデータが必要ですか?

model、prompt hash、token 数を含む request summary が必要です。hash により prompt 本文を見ずに繰り返しを検出できます。

なぜ見積もりが保守的なのですか?

すべての繰り返しが安全に cache できるわけではないためです。estimator は鮮度と semantic リスクを織り込んで節約額を控えめにします。

次のステップ

このレポートを次の統合判断に使います。

base URL をコピーし、モデル詳細を比較するか、実際の互換性テストを始める準備ができたらキーを作成します。