/ 요금

쓴 만큼만
지불.

운영 제품용 모델을 비교 중이라면 먼저 계산기로 비용을 추정한 뒤 지출 패턴에 맞는 플랜을 선택하세요.

계산기 열기 모델 비교

종량제

모델 요금

모델별 입력 token과 출력 token 단가부터 시작하세요.

큰 선결제 계약 불필요
출시 전 비용 추정
OpenAI 호환 요청 사용 가능

바로 시작

크레딧

선불 잔액

실험과 소규모 팀의 지출을 더 예측 가능하게 만듭니다.

프로젝트별 예산
사용량 내보내기 편리
파일럿과 QA에 적합

바로 시작

팀

거버넌스 적용 사용량

운영 팀을 위해 프로젝트, 키, 예산, 모델 정책을 관리합니다.

프로젝트와 키별 지출
예산 통제
팀 리포트

바로 시작

BYOK

내 키 사용

기존 공급자 계정을 하나의 비교 및 거버넌스 계층으로 가져옵니다.

공급자 키 직접 관리
통합 모델 카탈로그
정책 대응 라우팅

인증 문서 보기

엔터프라이즈

맞춤형

대규모 트래픽이나 강한 통제가 필요한 워크로드를 위한 비공개 상업 조건입니다.

용량 계획
공급자 조합 설계
지원 및 롤아웃 검토

청구 보기

계산기

모델, 입력 token, 출력 token, 요청 수, 월간 추정 비용.

운영 전 추정치로 사용하세요. 최종 청구는 공급자 사용량과 플랫폼 사용 기록에 맞춰 대조해야 합니다.

추정 공식

비용 = 요청 수 x ((입력 token x 입력 단가) + (출력 token x 출력 단가)) / 1,000,000.

Doubao Seed 2.0 Mini의 100만 입력 + 100만 출력 기본 추정치는 ¥2.20.

가격 계산기

모델 가격, 토큰 수, 요청량을 기준으로 월간 비용을 추정합니다.

모델

입력 토큰

출력 토큰

요청 / 월

월간 추정¥1.80Doubao Seed 2.0 Mini · 입력 토큰 0.2/1M · 출력 토큰 2/1M

AI API 비용은 어떻게 추정하나요?

AI API 비용은 요청 수에 입력 token과 출력 token을 곱한 뒤 각 모델의 100만 token당 공개 가격을 적용해 추정합니다. 운영 트래픽을 보내기 전에 저비용 모델, 품질용 대체 모델, 예상 월간 요청량을 함께 계산해야 합니다.

먼저 API 절감액을 추정해 보고 싶나요?

운영 환경에서 캐시 정책을 켜기 전에 CacheSafety Bench를 실행하세요. 단순 hit rate보다 Bad Hit Rate가 더 중요합니다.

CacheSafety Bench 실행

저비용 참고

트래픽을 보내기 전에 저비용 모델 후보를 비교하세요.

가격만 보지 말고 컨텍스트 길이, 기능, 소스 라벨, 예상 사용 사례까지 함께 검토한 뒤 운영 반영을 결정하세요.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
Doubao Seed 2.0 Minidoubao-seed-2-0-mini	Volcengine	¥0.2 / 1M tokens	¥2 / 1M tokens	128k	StreamingJSON mode	Coding	900-2600ms	Catalog	Platform curated
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
DeepSeek: R1deepseek/deepseek-r1	DeepSeek	$0.7 / 1M tokens	$2.50 / 1M tokens	163.8k	JSON modeLong contextReasoningStreaming	Chinese reasoning, math	1800-6000ms	Catalog	OpenRouter if available
Qwen: Qwen3 Coder Plusqwen/qwen3-coder-plus	Alibaba Cloud / Qwen	$0.65 / 1M tokens	$3.25 / 1M tokens	1M	Tool callingJSON modeLong contextStreaming	Chinese engineering workflows, code generation	1200-3900ms	Catalog	OpenRouter if available

FAQ

요금 관련 질문

비용은 어떻게 계산하나요?

계산기는 입력 token과 출력 token에 선택한 모델의 100만 token당 가격을 곱한 뒤 요청 수를 적용해 추정합니다.

Doubao Seed 2.0 Mini는 지금도 100만 입력 + 100만 출력에 ¥2.20인가요?

예. 입력 ¥0.20과 출력 ¥2.00을 더하면 이 100만 + 100만 추정치는 ¥2.20입니다.

기존 공급자 키를 그대로 사용할 수 있나요?

예. BYOK 플랜은 기존 공급자 계정을 가진 팀이 일관된 정책과 사용량 보고를 유지하도록 설계됐습니다.

엔터프라이즈 요금이 있나요?

있습니다. 트래픽 규모, 공급자 조합, 리전, 지원 요구 사항, 거버넌스 요구 사항에 따라 협의할 수 있습니다.

모델 카탈로그 빠른 시작 저가 LLM API 랭킹

쓴 만큼만지불.

모델, 입력 token, 출력 token, 요청 수, 월간 추정 비용.

추정 공식

가격 계산기

AI API 비용은 어떻게 추정하나요?

먼저 API 절감액을 추정해 보고 싶나요?

트래픽을 보내기 전에 저비용 모델 후보를 비교하세요.

요금 관련 질문

비용은 어떻게 계산하나요?

Doubao Seed 2.0 Mini는 지금도 100만 입력 + 100만 출력에 ¥2.20인가요?

기존 공급자 키를 그대로 사용할 수 있나요?

엔터프라이즈 요금이 있나요?

쓴 만큼만
지불.