Z.AI (Zhipu AI) / GLM-4.7

Summary

중국 AI 기업 Zhipu AI(智谱AI)의 코딩 특화 모델 서비스. GLM-4.7 모델은 SWE-bench 73.8%, AIME 95.7%로 Claude 5 Sonnet에 근접하는 성능을 Claude 가격의 약 10%에 제공. Coding Plan $3/월로 200K 컨텍스트 + Thinking Mode 포함.

중국 AI 기업 Zhipu AI(智谱AI)의 코딩 특화 모델 서비스. GLM-4.7 모델은 SWE-bench 73.8%, AIME 95.7%로 Claude 5 Sonnet에 근접하는 성능을 Claude 가격의 약 10%에 제공. Coding Plan $3/월로 200K 컨텍스트 + Thinking Mode 포함.

개요

Zhipu AI가 운영하는 코딩 에이전트 특화 플랫폼. 일반 API, Coding Plan 구독, Anthropic 호환 endpoint 세 가지 접근 방식을 제공한다. Claude Code, OpenCode, oh-my-opencode, Cline, Kilo Code 등 주요 AI 코딩 도구와 호환된다.

GLM-4.7 주요 사실 (valid_as_of 2026-01-09)

  • 가격: 2.20/1M output
  • 컨텍스트: 200K 토큰
  • Coding Plan: 10/월(Standard) — 5시간당 120 프롬프트
  • 무료 모델: glm-4.5-flash(텍스트), glm-4.5-air(경량), glm-4.6v-flash(비전)

벤치마크 (valid_as_of 2026-01-09)

벤치마크GLM-4.7비고
SWE-bench Verified73.8%Claude 5 Sonnet 수준
AIME 202595.7%GPT-5.1(94.0%) 상회
GPQA-Diamond85.7%박사급 과학
Tool-calling90.6%Claude 5 Sonnet에 근접
τ²-Bench87.4오픈소스 최고

커뮤니티: “Claude의 약 80% 수준” (Hacker News)

3가지 Endpoint (반드시 구분)

용도URL
일반 APIhttps://api.z.ai/api/paas/v4
Coding Plan 전용https://api.z.ai/api/coding/paas/v4
Anthropic 호환 (Claude Code용)https://api.z.ai/api/anthropic

혼동 주의

Coding Plan 구독자가 일반 endpoint 사용 시 “Authorization Failure” / “Insufficient Balance” 오류.

Claude Code 연동

settings.json 환경변수로 GLM-4.7을 Claude처럼 사용:

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
  }
}

Context Caching

모델일반캐시절감
GLM-4.7$0.60/1M$0.11/1M~82%
GLM-4.5-Air$0.20/1M$0.03/1M~85%

캐시 저장 비용 현재 무료 (베타).

Thinking Mode

Interleaved / Preserved / Turn-level 3종. Claude Extended Thinking과 유사한 구조.

{ "thinking": { "type": "enabled", "budget_tokens": 8192 } }

관련 엔티티

소스