Nutzungspreis
ModellpreiseStarten Sie mit den Eingabe- und Ausgabe-Tokenpreisen pro Modell.
- Kein grosser Vorabvertrag
- Vor dem Launch schatzen
- OpenAI-kompatible Requests nutzen
Wenn Sie Modelle fur ein Live-Produkt vergleichen, nutzen Sie zuerst den Rechner und wahlen Sie dann das passende Modell fur Ihr Ausgabenmuster.
Nutzungspreis
ModellpreiseStarten Sie mit den Eingabe- und Ausgabe-Tokenpreisen pro Modell.
Credits
Vorausbezahltes GuthabenHalten Sie Ausgaben fur Experimente und kleine Teams planbar.
Team
Gesteuerte NutzungVerwalten Sie Projekte, Schlussel, Budgets und Modellrichtlinien fur Produktionsteams.
BYOK
Eigene Schlussel nutzenBringen Sie bestehende Provider-Konten in eine gemeinsame Vergleichs- und Governance-Schicht.
Enterprise
IndividuellPrivate Konditionen fur Workloads mit hohem Volumen oder strenger Governance.
Rechner
Nutzen Sie dies als Schätzung vor dem Produktivstart. Die endgültige Abrechnung sollte mit Provider-Nutzung und Plattform-Nutzungsdaten abgeglichen werden.
Kosten = Requests x ((Eingabe-Tokens x Eingabepreis) + (Ausgabe-Tokens x Ausgabepreis)) / 1,000,000.
Die Standard-Schätzung für Doubao Seed 2.0 Mini mit 1M Input und 1M Output beträgt ¥2.20.
Schatzen Sie die monatlichen Kosten anhand von Modellpreis, Tokens und Anfragevolumen.
KI-API-Kosten werden geschätzt, indem Request-Zahl, Eingabe-Tokens und Ausgabe-Tokens mit dem veröffentlichten Preis je Modell pro 1M Tokens multipliziert werden. Vor Produktivtraffic sollten Teams ein günstiges Modell, ein Qualitäts-Fallback und das erwartete Monatsvolumen kalkulieren.
Führen Sie CacheSafety Bench aus, bevor Sie eine Cache-Richtlinie in Produktion aktivieren. Die Bad Hit Rate ist wichtiger als die rohe Hit Rate.
CacheSafety Bench startenGünstige Referenz
Preis ist nur ein Kriterium. Prüfen Sie auch Kontextlänge, Fähigkeiten, Quellenkennzeichnung und Zielanwendung, bevor Sie in Produktion gehen.
| Model | Provider | Input | Output | Context | Capabilities | Best for | Latency | Status | Source |
|---|---|---|---|---|---|---|---|---|---|
| Doubao Seed 2.0 Minidoubao-seed-2-0-mini | Volcengine | ¥0.2 / 1M tokens | ¥2 / 1M tokens | 128k | StreamingJSON mode | Coding | 900-2600ms | Catalog | Platform curated |
| DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash | DeepSeek | $0.112 / 1M tokens | $0.224 / 1M tokens | 1M | Tool callingJSON modeLong contextReasoning | low-cost Chinese tasks, long-context summary | 800-2600ms | Catalog | OpenRouter if available |
| Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct | Mistral AI | $0.1 / 1M tokens | $0.3 / 1M tokens | 128k | Tool callingJSON modeStreamingLow cost | translation, classification | 700-2300ms | Catalog | OpenRouter if available |
| OpenAI: GPT-4o-miniopenai/gpt-4o-mini | OpenRouter | $0.15 / 1M tokens | $0.6 / 1M tokens | 128k | Tool callingVisionJSON modeLong context | low-cost chat, image understanding | 800-2400ms | Catalog | OpenRouter if available |
| Meta: Llama 4 Maverickmeta-llama/llama-4-maverick | Meta | $0.15 / 1M tokens | $0.6 / 1M tokens | 1M | JSON modeLong contextStreamingLow cost | open-model workflows, cost-sensitive long context | 950-2800ms | Catalog | OpenRouter if available |
| Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash | $0.3 / 1M tokens | $2.50 / 1M tokens | 1M | Tool callingVisionJSON modeLong context | long-document summarization, image Q&A | 900-2800ms | Catalog | OpenRouter if available | |
| DeepSeek: R1deepseek/deepseek-r1 | DeepSeek | $0.7 / 1M tokens | $2.50 / 1M tokens | 163.8k | JSON modeLong contextReasoningStreaming | Chinese reasoning, math | 1800-6000ms | Catalog | OpenRouter if available |
| Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus | Alibaba Cloud / Qwen | $0.65 / 1M tokens | $3.25 / 1M tokens | 1M | Tool callingJSON modeLong contextStreaming | Chinese engineering workflows, code generation | 1200-3900ms | Catalog | OpenRouter if available |
FAQ
Der Rechner multipliziert Eingabe- und Ausgabe-Tokens mit dem Preis des gewählten Modells pro 1M Tokens und anschließend mit der Anzahl der Requests.
Ja. ¥0.20 Input plus ¥2.00 Output ergeben ¥2.20 für diese einzelne 1M + 1M Schätzung.
Ja. Der BYOK-Plan richtet sich an Teams mit bestehenden Provider-Konten, die konsistente Richtlinien und Nutzungsberichte brauchen.
Ja. Enterprise-Preise können nach Volumen, Providermix, Region, Supportanforderungen und Governance-Bedarf verhandelt werden.