OpenCode 리뷰(4) — Z.AI GLM 연동 실전 가이드 (갓대희)

Key Insight

Z.AI GLM-4.7을 Claude Code·OpenCode·VS Code(Cline/Kilo)에 연동하는 실전 설정 가이드. GLM-4.7은 Tool-calling 90.6%, SWE-bench 73.8%로 Claude 수준 성능을 Claude 가격의 ~10%에 제공. Coding Plan 전용 endpoint 혼동이 가장 흔한 오류.

출처: https://goddaehee.tistory.com/492 타입: 블로그 (갓대희) 작성자: 갓대희 유효일: 2026-01-09 시리즈: OpenCode 시리즈 Part 4 (Part 1 | Part 2 | Part 3)

핵심 Takeaway

  • Claude Code + Z.AI GLM 연동: settings.jsonANTHROPIC_AUTH_TOKEN=ZAI_API_KEY + ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic 설정 → Claude Code가 GLM-4.7을 Claude처럼 사용
  • 3가지 endpoint 반드시 구분 (혼동 시 “Authorization Failure”): 일반 API paas/v4 / Coding Plan coding/paas/v4 / Anthropic 호환 api/anthropic
  • GLM-4.7 Thinking Mode 3종: Interleaved(매 응답 전 추론) / Preserved(멀티턴 추론 보존) / Turn-level(턴별 활성화) — Claude Extended Thinking과 유사
  • OMO 3.0 Categories 비용 최적화: deep-thinking(Opus) + balanced(GLM-4.7) + quick(GLM-4.5-Flash) 조합 → 전체 Claude 대비 월 70–80% 절감
  • GLM-4.7 벤치마크 (valid_as_of 2026-01): SWE-bench 73.8%, AIME 95.7%, GPQA-Diamond 85.7%, Tool-calling 90.6% (Claude 5 Sonnet에 근접)

상세 요약

Claude Code 연동 방법

Claude Code settings.json에 환경변수 주입으로 GLM-4.7을 Claude처럼 사용:

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "API_TIMEOUT_MS": "3000000",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
  }
}

요구사항: Claude Code 2.0.14 이상 필요

Z.AI Endpoint 3종 구분

용도Endpoint
일반 API (종량제)https://api.z.ai/api/paas/v4
Coding Plan 전용https://api.z.ai/api/coding/paas/v4
Anthropic 호환 (Claude Code용)https://api.z.ai/api/anthropic

흔한 오류

Coding Plan 구독자가 일반 endpoint 사용 시 “Authorization Failure” 또는 “Insufficient Balance” 에러. 반드시 Coding Plan 전용 endpoint 사용.

OpenCode 연동 (opencode.json)

{
  "provider": {
    "zai-coding": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Z.AI Coding Plan",
      "options": {
        "baseURL": "https://api.z.ai/api/coding/paas/v4",
        "apiKey": "{env:ZAI_API_KEY}"
      },
      "models": {
        "glm-4.7": { "name": "GLM-4.7", "limit": { "context": 200000, "output": 16384 } }
      }
    }
  }
}

oh-my-opencode 에이전트 매핑 권장:

  • Sisyphus, oracle → zai-coding/glm-4.7
  • librarian → zai/glm-4.5-flash (무료)
  • explore → zai/glm-4.5-air (무료)

OMO 3.0 Categories 비용 최적화

Category용도권장 모델가격
deep-thinking복잡한 아키텍처·계획Claude Opus 4.575 per M
balanced일반 코딩GLM-4.72.2 per M
quick빠른 수정·간단 질문GLM-4.5-Flash무료

→ 전체 Claude 대비 월 70–80% 비용 절감

실전 팁: /plan(Prometheus + Opus 기획) → /start-work(GLM-4.7 구현) 분리 전략.

GLM-4.7 고급 기능

Context Caching (valid_as_of 2026-01-09):

모델일반 입력캐시된 입력절감률
GLM-4.7$0.60/1M$0.11/1M~82%
GLM-4.5-Air$0.20/1M$0.03/1M~85%

캐시 저장 비용 현재 무료 (베타).

Thinking Mode 3종:

  • Interleaved: 모든 응답·도구 호출 전 추론 → 환각 감소
  • Preserved: 멀티턴 추론 맥락 보존 → 장기 복잡 작업
  • Turn-level: 턴별 추론 on/off 제어 → 비용 최적화
{ "thinking": { "type": "enabled", "budget_tokens": 8192 } }

GLM-4.7 벤치마크 (valid_as_of 2026-01-09)

벤치마크GLM-4.7참고
SWE-bench Verified73.8%Claude 5 Sonnet 수준
AIME 202595.7%고난도 수학
GPQA-Diamond85.7%박사급 과학
Tool-calling90.6%Claude 5 Sonnet에 근접
τ²-Bench87.4오픈소스 최고

커뮤니티 평가: “Claude의 약 80% 수준” (Hacker News)

VS Code 연동 (Cline / Kilo)

API Provider → “OpenAI Compatible” 선택 후:

  • Base URL: Coding Plan https://api.z.ai/api/coding/paas/v4
  • Model ID: glm-4.7 또는 glm-4.5-flash

연결되는 노트