/ ferramentas / pt / cache-savings-estimator

Cache Savings Estimator

Estimate safe savings from repeated request hashes.

Estime poupancas seguras a partir de hashes de pedidos repetidos. Cole um resumo de pedidos e veja taxas de repeticao exata, estruturada e semantica, alem da poupanca conservadora que a cache pode captar sem exagerar hits arriscados.

Medir taxas de repeticao exata e estruturada a partir de hashes de pedidos
Estimar poupancas de cache conservadoras e ajustadas por seguranca
Identificar linhas que nao deveriam ser colocadas em cache

Cache Savings

As entradas sao processadas neste navegador; nao cole chaves API reais.

JSON de resumo do pedido

Relatorio de diagnostico

rowCount: 2
exactRepeatRate: 0.5
structuredRepeatRate: 1
semanticRepeatRate: 0.3
safeSavings: 0.000483
notRecommendedCount: 0

Criar API key

FAQ

Cache Savings Estimator FAQ

Quanto pode poupar o prompt caching?

Depende da sua taxa de repeticao. Este estimador aplica um desconto conservador apenas a pedidos repetidos e seguros para cache, para que a projecao se sustente em producao.

Que dados preciso?

Precisa de um resumo de pedidos com modelo, hash do prompt e contagem de tokens. Os hashes permitem detetar repeticoes sem expor o conteudo do prompt.

Porque e que a estimativa e conservadora?

Nem toda a repeticao e segura para ser servida a partir da cache. O estimador reduz a poupanca para refletir frescura e risco semantico.

Ferramentas relacionadas

Continuar a otimizar custos

Prompt Cacheability Checker AI API Bill Analyzer BYOK Savings Calculator

Passo seguinte

Use o relatorio para decidir a proxima integracao.

Copie a base URL, compare detalhes dos modelos ou crie uma chave quando estiver pronto para um teste real de compatibilidade.

Criar chave API Modelos Comparar modelos Inicio rapido