/ preise

Zahlen Sie fur das,
was Sienutzen.

Wenn Sie Modelle fur ein Live-Produkt vergleichen, nutzen Sie zuerst den Rechner und wahlen Sie dann das passende Modell fur Ihr Ausgabenmuster.

Rechner offnen Modelle vergleichen

Nutzungspreis

Modellpreise

Starten Sie mit den Eingabe- und Ausgabe-Tokenpreisen pro Modell.

Kein grosser Vorabvertrag
Vor dem Launch schatzen
OpenAI-kompatible Requests nutzen

Jetzt starten

Credits

Vorausbezahltes Guthaben

Halten Sie Ausgaben fur Experimente und kleine Teams planbar.

Budget je Projekt
Gut fur Usage-Exporte
Passend fur Piloten und QA

Jetzt starten

Team

Gesteuerte Nutzung

Verwalten Sie Projekte, Schlussel, Budgets und Modellrichtlinien fur Produktionsteams.

Ausgaben nach Projekt und Schlussel
Budgetkontrollen
Team-Reporting

Jetzt starten

BYOK

Eigene Schlussel nutzen

Bringen Sie bestehende Provider-Konten in eine gemeinsame Vergleichs- und Governance-Schicht.

Provider-Schlussel bleiben bei Ihnen
Einheitlicher Modellkatalog
Richtlinienfahiges Routing

Auth-Doku lesen

Enterprise

Individuell

Private Konditionen fur Workloads mit hohem Volumen oder strenger Governance.

Volumenplanung
Design des Providermix
Support und Rollout-Review

Abrechnung ansehen

Rechner

Modell, Eingabe-Tokens, Ausgabe-Tokens, Requests und Monatsprognose.

Nutzen Sie dies als Schätzung vor dem Produktivstart. Die endgültige Abrechnung sollte mit Provider-Nutzung und Plattform-Nutzungsdaten abgeglichen werden.

Schätzformel

Kosten = Requests x ((Eingabe-Tokens x Eingabepreis) + (Ausgabe-Tokens x Ausgabepreis)) / 1,000,000.

Die Standard-Schätzung für Doubao Seed 2.0 Mini mit 1M Input und 1M Output beträgt ¥2.20.

Preisrechner

Schatzen Sie die monatlichen Kosten anhand von Modellpreis, Tokens und Anfragevolumen.

Modell

Eingabe-Tokens

Ausgabe-Tokens

Anfragen / Monat

Monatliche Schatzung¥1.80Doubao Seed 2.0 Mini · Eingabe-Tokens 0.2/1M · Ausgabe-Tokens 2/1M

Wie schätzt man KI-API-Kosten?

KI-API-Kosten werden geschätzt, indem Request-Zahl, Eingabe-Tokens und Ausgabe-Tokens mit dem veröffentlichten Preis je Modell pro 1M Tokens multipliziert werden. Vor Produktivtraffic sollten Teams ein günstiges Modell, ein Qualitäts-Fallback und das erwartete Monatsvolumen kalkulieren.

Möchten Sie zuerst Ihre API-Einsparungen schätzen?

Führen Sie CacheSafety Bench aus, bevor Sie eine Cache-Richtlinie in Produktion aktivieren. Die Bad Hit Rate ist wichtiger als die rohe Hit Rate.

CacheSafety Bench starten

Günstige Referenz

Vergleichen Sie günstige Modellkandidaten, bevor Sie Traffic zuweisen.

Preis ist nur ein Kriterium. Prüfen Sie auch Kontextlänge, Fähigkeiten, Quellenkennzeichnung und Zielanwendung, bevor Sie in Produktion gehen.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

Preisfragen für Produkt- und Plattformteams

Wie werden die Kosten geschätzt?

Der Rechner multipliziert Eingabe- und Ausgabe-Tokens mit dem Preis des gewählten Modells pro 1M Tokens und anschließend mit der Anzahl der Requests.

Liegt Doubao Seed 2.0 Mini weiterhin bei ¥2.20 für 1M Input plus 1M Output?

Ja. ¥0.20 Input plus ¥2.00 Output ergeben ¥2.20 für diese einzelne 1M + 1M Schätzung.

Können Teams bestehende Provider-Schlüssel verwenden?

Ja. Der BYOK-Plan richtet sich an Teams mit bestehenden Provider-Konten, die konsistente Richtlinien und Nutzungsberichte brauchen.

Gibt es Enterprise-Preise?

Ja. Enterprise-Preise können nach Volumen, Providermix, Region, Supportanforderungen und Governance-Bedarf verhandelt werden.

Modellkatalog Schnellstart Ranking gunstiger LLM-APIs

Zahlen Sie fur das,was Sienutzen.

Modell, Eingabe-Tokens, Ausgabe-Tokens, Requests und Monatsprognose.

Schätzformel

Preisrechner

Wie schätzt man KI-API-Kosten?

Möchten Sie zuerst Ihre API-Einsparungen schätzen?

Vergleichen Sie günstige Modellkandidaten, bevor Sie Traffic zuweisen.

Preisfragen für Produkt- und Plattformteams

Wie werden die Kosten geschätzt?

Liegt Doubao Seed 2.0 Mini weiterhin bei ¥2.20 für 1M Input plus 1M Output?

Können Teams bestehende Provider-Schlüssel verwenden?

Gibt es Enterprise-Preise?

Zahlen Sie fur das,
was Sienutzen.