OpenCode 리뷰(3) — 무료·저가 LLM 모델 활용 (갓대희)

Key Insight

OpenCode + oh-my-opencode에서 Claude 없이 무료·저가 모델로 코딩 에이전트를 운영하는 실전 설정 가이드. Ollama(로컬), DeepSeek(Claude 50배 저렴), GLM-4.7($3/월 200K), MiniMax M2.1(Claude 8% 가격)의 4가지 선택지를 다룬다.

출처: https://goddaehee.tistory.com/488 타입: 블로그 (갓대희) 작성자: 갓대희 유효일: 2026-01-09 시리즈: OpenCode 시리즈 Part 3 (Part 1 | Part 2 | Part 4)

핵심 Takeaway

ollama: 로컬 무료 LLM 플랫폼 — OpenCode에서 /connect, /models에 자동 표시 안 됨. 반드시 opencode.json에 custom provider로 직접 설정 필요
MacBook RAM별 모델 추천 (valid_as_of 2026-01-09): 8GB→Qwen2.5-Coder:1.5b-3b / 16GB→Qwen2.5-Coder:7b / 24-36GB→Qwen2.5-Coder:14b or deepseek-coder-v2:16b / 48GB+→Qwen3-Coder:30b
DeepSeek API: Claude 대비 약 50배 저렴. deepseek-chat(V3.2) + deepseek-reasoner(R1 추론) — OpenCode 기본 지원, 환경변수 DEEPSEEK_API_KEY만 설정하면 됨
GLM-4.7 Z.AI Coding Plan: $3/월, 200K 컨텍스트. Coding Plan 구독자는 전용 endpoint 필수 (https://api.z.ai/api/coding/paas/v4). 일반 endpoint 사용 시 “Authorization Failure” 에러
MiniMax M2.1: 229B 파라미터(활성 10B MoE), Multi-SWE-Bench 49.4% (Claude Sonnet 4.5 44.3% 상회), Claude 가격의 8% ( $0.30/ M in p u t,$ 1.20/M output)

상세 요약

4.1 Ollama — 로컬 무료 LLM

# 설치 (macOS)
brew install ollama
brew services start ollama
 
# 코딩 모델 다운로드
ollama pull qwen3-coder:30b   # 48GB+ RAM
ollama pull qwen3:8b          # 16GB RAM

OpenCode 설정 주의: Ollama는 OpenCode 내장 provider가 아니므로 opencode.json에 custom provider 직접 추가 필요.

{
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Ollama (local)",
      "options": { "baseURL": "http://localhost:11434/v1" },
      "models": {
        "qwen3:8b": { "name": "Qwen3 8B" },
        "qwen3-coder:30b": { "name": "Qwen3 Coder 30B" }
      }
    }
  }
}

MacBook RAM별 추천 코딩 모델

Dated Claim

2026-01 기준. 모델 업데이트 빠름 — 공식 Ollama 라이브러리 확인 권장.

RAM	추천 모델	크기	컨텍스트
8GB	qwen2.5-coder:1.5b / 3b	986MB / 1.9GB	32K
16GB	qwen2.5-coder:7b	4.7GB	32K
24-36GB	qwen2.5-coder:14b / deepseek-coder-v2:16b	9GB / 8.9GB	32K / 160K
48GB+	qwen3-coder:30b	19GB	256K

메모리 팁: 실제 구동 시 모델 파일 크기의 1.5–2배 RAM 소모.

Qwen2.5-Coder vs Qwen3-Coder

항목	Qwen2.5-Coder	Qwen3-Coder
최소 크기	0.5B (8GB RAM)	30B (48GB RAM)
HumanEval	84–88% (7B)	SWE-Bench 상위권
컨텍스트	32K	256K
실용 추천	8–16GB MacBook	32GB+ MacBook

4.2 DeepSeek API

Claude 대비 약 50배 저렴. OpenCode 기본 지원 — 환경변수 설정 후 바로 사용.

export DEEPSEEK_API_KEY="your-key"

에이전트별 추천: Sisyphus → deepseek-chat, Oracle(코드 리뷰) → deepseek-reasoner

4.3 GLM-4.7 (Z.AI Coding Plan)

가격: $3/월 (Lite), 200K 컨텍스트 윈도우
고급 기능: Context Caching(최대 82% 절감), Preserved Thinking(추론 맥락 유지)
무료 모델: glm-4.5-flash(텍스트), glm-4.6v-flash(비전) — 일반 endpoint 사용

Coding Plan 전용 Endpoint

Coding Plan 구독자는 반드시 https://api.z.ai/api/coding/paas/v4 사용. 일반 endpoint 사용 시 “Authorization Failure” 또는 “Insufficient Balance” 오류.

4.4 MiniMax M2.1

항목	수치
파라미터	229B (활성 10B, MoE)
Multi-SWE-Bench	49.4% (vs Claude Sonnet 4.5 44.3%)
SWE-Bench Verified	74.0% (vs Claude Sonnet 4.5 77.2%)
가격	$0.30/ M in p u t,$ 1.20/M output (Claude의 약 8%)

Dated Claim

벤치마크 수치 — 2026-01 기준

OpenCode 설정: baseURL: https://api.minimax.io/anthropic/v1

연결되는 노트

OpenCode — 설정 대상 플랫폼
Oh-My-OpenAgent — 에이전트별 모델 매핑 (oh-my-opencode.json)
ollama — 로컬 LLM 런타임
DeepSeek — 저가 클라우드 API
MiniMax — 고성능 저가 모델
qwen — Qwen 코딩 모델 시리즈

JYP Garden

탐색기

Open Code 리뷰(3) : 오픈소스, 무료 및 저가 LLM 모델 활용 해보기

OpenCode 리뷰(3) — 무료·저가 LLM 모델 활용 (갓대희)

핵심 Takeaway

상세 요약

4.1 Ollama — 로컬 무료 LLM

MacBook RAM별 추천 코딩 모델

Qwen2.5-Coder vs Qwen3-Coder

4.2 DeepSeek API

4.3 GLM-4.7 (Z.AI Coding Plan)

4.4 MiniMax M2.1

연결되는 노트

그래프 뷰

목차