Loading...Working on your request
모델 후보 목록

비용 민감한 제품을 위한 저가 LLM API 모델

입력 가격, 출력 가격, 컨텍스트 길이, 기능, 출처, 운영 적합성 기준으로 저비용 LLM API 모델을 비교합니다.

이 후보 목록은 어디에 쓰나?

저가 LLM API 선택은 가장 낮은 표시 가격만 보지 말고 workload 형태에서 시작해야 합니다. 분류, 요약, 라우팅, 지원 초안, 배치 변환 같은 작업에서는 더 저렴한 모델이 애플리케이션 인터페이스를 바꾸지 않고도 월간 비용을 줄일 수 있습니다. 반면 최종 답변, 복잡한 추론, 코딩 Agent 에서는 저가 모델을 더 강한 fallback 과 함께 벤치마크해야 합니다. NextModel 은 가격, 컨텍스트, 기능, 공급자 출처, 코드 예제를 한곳에 모아 배포 전에 판단할 수 있게 합니다.

출처 기준: NextModel 큐레이션 카탈로그, 공급자 공개 가격, 그리고 가능한 경우 OpenRouter 메타데이터.

Blended price

추천 후보 저가 llm api

먼저 후보 목록으로 시작한 다음 실제 프롬프트로 테스트하고 운영 라우팅 전에 월간 비용을 비교합니다.

DeepSeekCatalog

DeepSeek V4 Flash is an efficiency-optimized Mixture-of-Experts model from DeepSeek with 284B total parameters and 13B activated parameters, supporting a 1M-token context window. It is designed for fast inference and...

$0.112 / 1M tokensInput$0.224 / 1M tokensOutput1MContext
Best forlow-cost Chinese tasks, long-context summary, batch code assistance
RoutingConfigured
Tool callingJSON modeLong contextReasoningLow cost
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
Mistral AICatalog

Mistral-Small-3.2-24B-Instruct-2506 is an updated 24B parameter model from Mistral optimized for instruction following, repetition reduction, and improved function calling. Compared to the 3.1 release, version 3.2 significantly improves accuracy on...

$0.1 / 1M tokensInput$0.3 / 1M tokensOutput128kContext
Best fortranslation, classification, short-form summarization
RoutingConfigured
Tool callingJSON modeStreamingLow costVisionLong context
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
OpenRouterCatalog

GPT-4o mini is OpenAI's newest model after [GPT-4 Omni](/models/openai/gpt-4o), supporting both text and image inputs with text outputs. As their most advanced small model, it is many multiples more affordable...

$0.15 / 1M tokensInput$0.6 / 1M tokensOutput128kContext
Best forlow-cost chat, image understanding, classification
RoutingConfigured
Tool callingVisionJSON modeLong contextStreamingLow cost
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details
MetaCatalog

Llama 4 Maverick 17B Instruct (128E) is a high-capacity multimodal language model from Meta, built on a mixture-of-experts (MoE) architecture with 128 experts and 17 billion active parameters per forward...

$0.15 / 1M tokensInput$0.6 / 1M tokensOutput1MContext
Best foropen-model workflows, cost-sensitive long context, classification
RoutingConfigured
JSON modeLong contextStreamingLow costTool callingVision
OpenRouter if availableOpenRouter public Models API live metadata; public price comes from the registry pricing rule
View details

비교표

가격, 공급자, 컨텍스트, 기능, 출처 기준으로 후보를 비교합니다.

운영 후보를 좁히거나 폴백 정책을 만들거나 모델 경제성을 비교할 때 사용합니다.

ModelProviderInputOutputContextCapabilitiesBest forLatencyStatusSource
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flashDeepSeek$0.112 / 1M tokens$0.224 / 1M tokens1M
Tool callingJSON modeLong contextReasoning
low-cost Chinese tasks, long-context summary800-2600msCatalogOpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instructMistral AI$0.1 / 1M tokens$0.3 / 1M tokens128k
Tool callingJSON modeStreamingLow cost
translation, classification700-2300msCatalogOpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-miniOpenRouter$0.15 / 1M tokens$0.6 / 1M tokens128k
Tool callingVisionJSON modeLong context
low-cost chat, image understanding800-2400msCatalogOpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverickMeta$0.15 / 1M tokens$0.6 / 1M tokens1M
JSON modeLong contextStreamingLow cost
open-model workflows, cost-sensitive long context950-2800msCatalogOpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flashGoogle$0.3 / 1M tokens$2.50 / 1M tokens1M
Tool callingVisionJSON modeLong context
long-document summarization, image Q&A900-2800msCatalogOpenRouter if available
MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6Moonshot AI$0.73 / 1M tokens$3.49 / 1M tokens262.1k
JSON modeLong contextStreamingTool calling
long Chinese documents, contract review1400-4400msCatalogOpenRouter if available

FAQ

저가 LLM API FAQ

이 카탈로그에서 가장 저렴한 모델은 무엇인가요?

가장 저렴한 선택은 환율과 출력 길이에 따라 달라집니다. Doubao Seed 2.0 Mini 는 이 카탈로그에서 가장 저렴한 CNY 운영 후보입니다.

항상 가장 싼 LLM API 를 골라야 하나요?

아니요. 저가 모델은 반복적이고 저위험인 작업에 적합하지만, 최종 답변, 복잡한 추론, 코딩 Agent 는 더 강한 모델과 비교해야 합니다.