모델 후보 목록

비용 민감한 제품을 위한 저가 LLM API 모델

입력 가격, 출력 가격, 컨텍스트 길이, 기능, 출처, 운영 적합성 기준으로 저비용 LLM API 모델을 비교합니다.

이 후보 목록은 어디에 쓰나?

저가 LLM API 선택은 가장 낮은 표시 가격만 보지 말고 workload 형태에서 시작해야 합니다. 분류, 요약, 라우팅, 지원 초안, 배치 변환 같은 작업에서는 더 저렴한 모델이 애플리케이션 인터페이스를 바꾸지 않고도 월간 비용을 줄일 수 있습니다. 반면 최종 답변, 복잡한 추론, 코딩 Agent 에서는 저가 모델을 더 강한 fallback 과 함께 벤치마크해야 합니다. NextModel 은 가격, 컨텍스트, 기능, 공급자 출처, 코드 예제를 한곳에 모아 배포 전에 판단할 수 있게 합니다.

출처 기준: NextModel 큐레이션 카탈로그, 공급자 공개 가격, 그리고 가능한 경우 OpenRouter 메타데이터.

Blended price

가격, 공급자, 컨텍스트, 기능, 출처 기준으로 후보를 비교합니다.

운영 후보를 좁히거나 폴백 정책을 만들거나 모델 경제성을 비교할 때 사용합니다.

Model	Provider	Input	Output	Context	Capabilities	Best for	Latency	Status	Source
DeepSeek: DeepSeek V4 Flashdeepseek/deepseek-v4-flash	DeepSeek	$0.112 / 1M tokens	$0.224 / 1M tokens	1M	Tool callingJSON modeLong contextReasoning	low-cost Chinese tasks, long-context summary	800-2600ms	Catalog	OpenRouter if available
Mistral: Mistral Small 3.2 24Bmistralai/mistral-small-3.2-24b-instruct	Mistral AI	$0.1 / 1M tokens	$0.3 / 1M tokens	128k	Tool callingJSON modeStreamingLow cost	translation, classification	700-2300ms	Catalog	OpenRouter if available
OpenAI: GPT-4o-miniopenai/gpt-4o-mini	OpenRouter	$0.15 / 1M tokens	$0.6 / 1M tokens	128k	Tool callingVisionJSON modeLong context	low-cost chat, image understanding	800-2400ms	Catalog	OpenRouter if available
Meta: Llama 4 Maverickmeta-llama/llama-4-maverick	Meta	$0.15 / 1M tokens	$0.6 / 1M tokens	1M	JSON modeLong contextStreamingLow cost	open-model workflows, cost-sensitive long context	950-2800ms	Catalog	OpenRouter if available
Google: Gemini 2.5 Flashgoogle/gemini-2.5-flash	Google	$0.3 / 1M tokens	$2.50 / 1M tokens	1M	Tool callingVisionJSON modeLong context	long-document summarization, image Q&A	900-2800ms	Catalog	OpenRouter if available
MoonshotAI: Kimi K2.6moonshotai/kimi-k2.6	Moonshot AI	$0.73 / 1M tokens	$3.49 / 1M tokens	262.1k	JSON modeLong contextStreamingTool calling	long Chinese documents, contract review	1400-4400ms	Catalog	OpenRouter if available

FAQ

저가 LLM API FAQ

이 카탈로그에서 가장 저렴한 모델은 무엇인가요?

가장 저렴한 선택은 환율과 출력 길이에 따라 달라집니다. Doubao Seed 2.0 Mini 는 이 카탈로그에서 가장 저렴한 CNY 운영 후보입니다.

항상 가장 싼 LLM API 를 골라야 하나요?

아니요. 저가 모델은 반복적이고 저위험인 작업에 적합하지만, 최종 답변, 복잡한 추론, 코딩 Agent 는 더 강한 모델과 비교해야 합니다.

전체 모델 요금 계산기 OpenAI 호환 빠른 시작

비용 민감한 제품을 위한 저가 LLM API 모델

이 후보 목록은 어디에 쓰나?

추천 후보 저가 llm api

DeepSeek: DeepSeek V4 Flash

Mistral: Mistral Small 3.2 24B

OpenAI: GPT-4o-mini

Meta: Llama 4 Maverick

가격, 공급자, 컨텍스트, 기능, 출처 기준으로 후보를 비교합니다.

저가 LLM API FAQ

이 카탈로그에서 가장 저렴한 모델은 무엇인가요?

항상 가장 싼 LLM API 를 골라야 하나요?