OpenCode 리뷰(3) — 무료·저가 LLM 모델 활용 (갓대희)
Key Insight
OpenCode + oh-my-opencode에서 Claude 없이 무료·저가 모델로 코딩 에이전트를 운영하는 실전 설정 가이드. Ollama(로컬), DeepSeek(Claude 50배 저렴), GLM-4.7($3/월 200K), MiniMax M2.1(Claude 8% 가격)의 4가지 선택지를 다룬다.
출처: https://goddaehee.tistory.com/488 타입: 블로그 (갓대희) 작성자: 갓대희 유효일: 2026-01-09 시리즈: OpenCode 시리즈 Part 3 (Part 1 | Part 2 | Part 4)
핵심 Takeaway
- ollama: 로컬 무료 LLM 플랫폼 — OpenCode에서
/connect,/models에 자동 표시 안 됨. 반드시opencode.json에 custom provider로 직접 설정 필요 - MacBook RAM별 모델 추천 (valid_as_of 2026-01-09): 8GB→Qwen2.5-Coder:1.5b-3b / 16GB→Qwen2.5-Coder:7b / 24-36GB→Qwen2.5-Coder:14b or deepseek-coder-v2:16b / 48GB+→Qwen3-Coder:30b
- DeepSeek API: Claude 대비 약 50배 저렴. deepseek-chat(V3.2) + deepseek-reasoner(R1 추론) — OpenCode 기본 지원, 환경변수
DEEPSEEK_API_KEY만 설정하면 됨 - GLM-4.7 Z.AI Coding Plan: $3/월, 200K 컨텍스트. Coding Plan 구독자는 전용 endpoint 필수 (
https://api.z.ai/api/coding/paas/v4). 일반 endpoint 사용 시 “Authorization Failure” 에러 - MiniMax M2.1: 229B 파라미터(활성 10B MoE), Multi-SWE-Bench 49.4% (Claude Sonnet 4.5 44.3% 상회), Claude 가격의 8% (1.20/M output)
상세 요약
4.1 Ollama — 로컬 무료 LLM
# 설치 (macOS)
brew install ollama
brew services start ollama
# 코딩 모델 다운로드
ollama pull qwen3-coder:30b # 48GB+ RAM
ollama pull qwen3:8b # 16GB RAMOpenCode 설정 주의: Ollama는 OpenCode 내장 provider가 아니므로 opencode.json에 custom provider 직접 추가 필요.
{
"provider": {
"ollama": {
"npm": "@ai-sdk/openai-compatible",
"name": "Ollama (local)",
"options": { "baseURL": "http://localhost:11434/v1" },
"models": {
"qwen3:8b": { "name": "Qwen3 8B" },
"qwen3-coder:30b": { "name": "Qwen3 Coder 30B" }
}
}
}
}MacBook RAM별 추천 코딩 모델
Dated Claim
2026-01 기준. 모델 업데이트 빠름 — 공식 Ollama 라이브러리 확인 권장.
| RAM | 추천 모델 | 크기 | 컨텍스트 |
|---|---|---|---|
| 8GB | qwen2.5-coder:1.5b / 3b | 986MB / 1.9GB | 32K |
| 16GB | qwen2.5-coder:7b | 4.7GB | 32K |
| 24-36GB | qwen2.5-coder:14b / deepseek-coder-v2:16b | 9GB / 8.9GB | 32K / 160K |
| 48GB+ | qwen3-coder:30b | 19GB | 256K |
메모리 팁: 실제 구동 시 모델 파일 크기의 1.5–2배 RAM 소모.
Qwen2.5-Coder vs Qwen3-Coder
| 항목 | Qwen2.5-Coder | Qwen3-Coder |
|---|---|---|
| 최소 크기 | 0.5B (8GB RAM) | 30B (48GB RAM) |
| HumanEval | 84–88% (7B) | SWE-Bench 상위권 |
| 컨텍스트 | 32K | 256K |
| 실용 추천 | 8–16GB MacBook | 32GB+ MacBook |
4.2 DeepSeek API
Claude 대비 약 50배 저렴. OpenCode 기본 지원 — 환경변수 설정 후 바로 사용.
export DEEPSEEK_API_KEY="your-key"에이전트별 추천: Sisyphus → deepseek-chat, Oracle(코드 리뷰) → deepseek-reasoner
4.3 GLM-4.7 (Z.AI Coding Plan)
- 가격: $3/월 (Lite), 200K 컨텍스트 윈도우
- 고급 기능: Context Caching(최대 82% 절감), Preserved Thinking(추론 맥락 유지)
- 무료 모델:
glm-4.5-flash(텍스트),glm-4.6v-flash(비전) — 일반 endpoint 사용
Coding Plan 전용 Endpoint
Coding Plan 구독자는 반드시
https://api.z.ai/api/coding/paas/v4사용. 일반 endpoint 사용 시 “Authorization Failure” 또는 “Insufficient Balance” 오류.
4.4 MiniMax M2.1
| 항목 | 수치 |
|---|---|
| 파라미터 | 229B (활성 10B, MoE) |
| Multi-SWE-Bench | 49.4% (vs Claude Sonnet 4.5 44.3%) |
| SWE-Bench Verified | 74.0% (vs Claude Sonnet 4.5 77.2%) |
| 가격 | 1.20/M output (Claude의 약 8%) |
Dated Claim
벤치마크 수치 — 2026-01 기준
OpenCode 설정: baseURL: https://api.minimax.io/anthropic/v1