OpenCode 리뷰(3) — 무료·저가 LLM 모델 활용 (갓대희)

Key Insight

OpenCode + oh-my-opencode에서 Claude 없이 무료·저가 모델로 코딩 에이전트를 운영하는 실전 설정 가이드. Ollama(로컬), DeepSeek(Claude 50배 저렴), GLM-4.7($3/월 200K), MiniMax M2.1(Claude 8% 가격)의 4가지 선택지를 다룬다.

출처: https://goddaehee.tistory.com/488 타입: 블로그 (갓대희) 작성자: 갓대희 유효일: 2026-01-09 시리즈: OpenCode 시리즈 Part 3 (Part 1 | Part 2 | Part 4)

핵심 Takeaway

  • ollama: 로컬 무료 LLM 플랫폼 — OpenCode에서 /connect, /models에 자동 표시 안 됨. 반드시 opencode.json에 custom provider로 직접 설정 필요
  • MacBook RAM별 모델 추천 (valid_as_of 2026-01-09): 8GB→Qwen2.5-Coder:1.5b-3b / 16GB→Qwen2.5-Coder:7b / 24-36GB→Qwen2.5-Coder:14b or deepseek-coder-v2:16b / 48GB+→Qwen3-Coder:30b
  • DeepSeek API: Claude 대비 약 50배 저렴. deepseek-chat(V3.2) + deepseek-reasoner(R1 추론) — OpenCode 기본 지원, 환경변수 DEEPSEEK_API_KEY만 설정하면 됨
  • GLM-4.7 Z.AI Coding Plan: $3/월, 200K 컨텍스트. Coding Plan 구독자는 전용 endpoint 필수 (https://api.z.ai/api/coding/paas/v4). 일반 endpoint 사용 시 “Authorization Failure” 에러
  • MiniMax M2.1: 229B 파라미터(활성 10B MoE), Multi-SWE-Bench 49.4% (Claude Sonnet 4.5 44.3% 상회), Claude 가격의 8% (1.20/M output)

상세 요약

4.1 Ollama — 로컬 무료 LLM

# 설치 (macOS)
brew install ollama
brew services start ollama
 
# 코딩 모델 다운로드
ollama pull qwen3-coder:30b   # 48GB+ RAM
ollama pull qwen3:8b          # 16GB RAM

OpenCode 설정 주의: Ollama는 OpenCode 내장 provider가 아니므로 opencode.json에 custom provider 직접 추가 필요.

{
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Ollama (local)",
      "options": { "baseURL": "http://localhost:11434/v1" },
      "models": {
        "qwen3:8b": { "name": "Qwen3 8B" },
        "qwen3-coder:30b": { "name": "Qwen3 Coder 30B" }
      }
    }
  }
}

MacBook RAM별 추천 코딩 모델

Dated Claim

2026-01 기준. 모델 업데이트 빠름 — 공식 Ollama 라이브러리 확인 권장.

RAM추천 모델크기컨텍스트
8GBqwen2.5-coder:1.5b / 3b986MB / 1.9GB32K
16GBqwen2.5-coder:7b4.7GB32K
24-36GBqwen2.5-coder:14b / deepseek-coder-v2:16b9GB / 8.9GB32K / 160K
48GB+qwen3-coder:30b19GB256K

메모리 팁: 실제 구동 시 모델 파일 크기의 1.5–2배 RAM 소모.

Qwen2.5-Coder vs Qwen3-Coder

항목Qwen2.5-CoderQwen3-Coder
최소 크기0.5B (8GB RAM)30B (48GB RAM)
HumanEval84–88% (7B)SWE-Bench 상위권
컨텍스트32K256K
실용 추천8–16GB MacBook32GB+ MacBook

4.2 DeepSeek API

Claude 대비 약 50배 저렴. OpenCode 기본 지원 — 환경변수 설정 후 바로 사용.

export DEEPSEEK_API_KEY="your-key"

에이전트별 추천: Sisyphus → deepseek-chat, Oracle(코드 리뷰) → deepseek-reasoner

4.3 GLM-4.7 (Z.AI Coding Plan)

  • 가격: $3/월 (Lite), 200K 컨텍스트 윈도우
  • 고급 기능: Context Caching(최대 82% 절감), Preserved Thinking(추론 맥락 유지)
  • 무료 모델: glm-4.5-flash(텍스트), glm-4.6v-flash(비전) — 일반 endpoint 사용

Coding Plan 전용 Endpoint

Coding Plan 구독자는 반드시 https://api.z.ai/api/coding/paas/v4 사용. 일반 endpoint 사용 시 “Authorization Failure” 또는 “Insufficient Balance” 오류.

4.4 MiniMax M2.1

항목수치
파라미터229B (활성 10B, MoE)
Multi-SWE-Bench49.4% (vs Claude Sonnet 4.5 44.3%)
SWE-Bench Verified74.0% (vs Claude Sonnet 4.5 77.2%)
가격1.20/M output (Claude의 약 8%)

Dated Claim

벤치마크 수치 — 2026-01 기준

OpenCode 설정: baseURL: https://api.minimax.io/anthropic/v1

연결되는 노트

  • OpenCode — 설정 대상 플랫폼
  • Oh-My-OpenAgent — 에이전트별 모델 매핑 (oh-my-opencode.json)
  • ollama — 로컬 LLM 런타임
  • DeepSeek — 저가 클라우드 API
  • MiniMax — 고성능 저가 모델
  • qwen — Qwen 코딩 모델 시리즈