Loading...Working on your request
/ preise

Zahlen Sie fur das,
was Sienutzen.

Wenn Sie Modelle fur ein Live-Produkt vergleichen, nutzen Sie zuerst den Rechner und wahlen Sie dann das passende Modell fur Ihr Ausgabenmuster.

Nutzungspreis

Modellpreise

Starten Sie mit den Eingabe- und Ausgabe-Tokenpreisen pro Modell.

  • Kein grosser Vorabvertrag
  • Vor dem Launch schatzen
  • OpenAI-kompatible Requests nutzen
Jetzt starten

Credits

Vorausbezahltes Guthaben

Halten Sie Ausgaben fur Experimente und kleine Teams planbar.

  • Budget je Projekt
  • Gut fur Usage-Exporte
  • Passend fur Piloten und QA
Jetzt starten

Team

Gesteuerte Nutzung

Verwalten Sie Projekte, Schlussel, Budgets und Modellrichtlinien fur Produktionsteams.

  • Ausgaben nach Projekt und Schlussel
  • Budgetkontrollen
  • Team-Reporting
Jetzt starten

BYOK

Eigene Schlussel nutzen

Bringen Sie bestehende Provider-Konten in eine gemeinsame Vergleichs- und Governance-Schicht.

  • Provider-Schlussel bleiben bei Ihnen
  • Einheitlicher Modellkatalog
  • Richtlinienfahiges Routing
Auth-Doku lesen

Enterprise

Individuell

Private Konditionen fur Workloads mit hohem Volumen oder strenger Governance.

  • Volumenplanung
  • Design des Providermix
  • Support und Rollout-Review
Abrechnung ansehen

Rechner

Modell, Eingabe-Tokens, Ausgabe-Tokens, Requests und Monatsprognose.

Nutzen Sie dies als Schätzung vor dem Produktivstart. Die endgültige Abrechnung sollte mit Provider-Nutzung und Plattform-Nutzungsdaten abgeglichen werden.

Schätzformel

Kosten = Requests x ((Eingabe-Tokens x Eingabepreis) + (Ausgabe-Tokens x Ausgabepreis)) / 1,000,000.

Die Standard-Schätzung für Doubao Seed 2.0 Mini mit 1M Input und 1M Output beträgt ¥2.20.

Preisrechner

Schatzen Sie die monatlichen Kosten anhand von Modellpreis, Tokens und Anfragevolumen.

Monatliche Schatzung¥1.80Doubao Seed 2.0 Mini · Eingabe-Tokens 0.2/1M · Ausgabe-Tokens 2/1M

Wie schätzt man KI-API-Kosten?

KI-API-Kosten werden geschätzt, indem Request-Zahl, Eingabe-Tokens und Ausgabe-Tokens mit dem veröffentlichten Preis je Modell pro 1M Tokens multipliziert werden. Vor Produktivtraffic sollten Teams ein günstiges Modell, ein Qualitäts-Fallback und das erwartete Monatsvolumen kalkulieren.

Möchten Sie zuerst Ihre API-Einsparungen schätzen?

Führen Sie CacheSafety Bench aus, bevor Sie eine Cache-Richtlinie in Produktion aktivieren. Die Bad Hit Rate ist wichtiger als die rohe Hit Rate.

CacheSafety Bench starten

Günstige Referenz

Vergleichen Sie günstige Modellkandidaten, bevor Sie Traffic zuweisen.

Preis ist nur ein Kriterium. Prüfen Sie auch Kontextlänge, Fähigkeiten, Quellenkennzeichnung und Zielanwendung, bevor Sie in Produktion gehen.

ModelProviderInputOutputContextCapabilitiesBest forLatencyStatusSource
Doubao Seed 2.0 Minidoubao-seed-2-0-miniVolcengine¥0.2 / 1M tokens¥2 / 1M tokens128k
StreamingJSON mode
Coding900-2600msCatalogPlatform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
Tool callingJSON modeLong contextReasoning
low-cost Chinese tasks, long-context summary800-2600msCatalogOpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
Tool callingJSON modeStreamingLow cost
translation, classification700-2300msCatalogOpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
Tool callingVisionJSON modeLong context
low-cost chat, image understanding800-2400msCatalogOpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON modeLong contextStreamingLow cost
open-model workflows, cost-sensitive long context950-2800msCatalogOpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
Tool callingVisionJSON modeLong context
long-document summarization, image Q&A900-2800msCatalogOpenRouter if available
DeepSeek: R1deepseek/deepseek-r1DeepSeek$0.7 / 1M tokens$2.50 / 1M tokens163.8k
JSON modeLong contextReasoningStreaming
Chinese reasoning, math1800-6000msCatalogOpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plusAlibaba Cloud / Qwen$0.65 / 1M tokens$3.25 / 1M tokens1M
Tool callingJSON modeLong contextStreaming
Chinese engineering workflows, code generation1200-3900msCatalogOpenRouter if available

FAQ

Preisfragen für Produkt- und Plattformteams

Wie werden die Kosten geschätzt?

Der Rechner multipliziert Eingabe- und Ausgabe-Tokens mit dem Preis des gewählten Modells pro 1M Tokens und anschließend mit der Anzahl der Requests.

Liegt Doubao Seed 2.0 Mini weiterhin bei ¥2.20 für 1M Input plus 1M Output?

Ja. ¥0.20 Input plus ¥2.00 Output ergeben ¥2.20 für diese einzelne 1M + 1M Schätzung.

Können Teams bestehende Provider-Schlüssel verwenden?

Ja. Der BYOK-Plan richtet sich an Teams mit bestehenden Provider-Konten, die konsistente Richtlinien und Nutzungsberichte brauchen.

Gibt es Enterprise-Preise?

Ja. Enterprise-Preise können nach Volumen, Providermix, Region, Supportanforderungen und Governance-Bedarf verhandelt werden.