Z.AI (Zhipu AI) / GLM-4.7

Summary

중국 AI 기업 Zhipu AI(智谱AI)의 코딩 특화 모델 서비스. GLM-4.7 모델은 SWE-bench 73.8%, AIME 95.7%로 Claude 5 Sonnet에 근접하는 성능을 Claude 가격의 약 10%에 제공. Coding Plan $3/월로 200K 컨텍스트 + Thinking Mode 포함.

개요

Zhipu AI가 운영하는 코딩 에이전트 특화 플랫폼. 일반 API, Coding Plan 구독, Anthropic 호환 endpoint 세 가지 접근 방식을 제공한다. Claude Code, OpenCode, oh-my-opencode, Cline, Kilo Code 등 주요 AI 코딩 도구와 호환된다.

GLM-4.7 주요 사실 (valid_as_of 2026-01-09)

가격: $0.60/1 M in p u t,$ 2.20/1M output
컨텍스트: 200K 토큰
Coding Plan: $3/ 월 (L i t e) /$ 10/월(Standard) — 5시간당 120 프롬프트
무료 모델: glm-4.5-flash(텍스트), glm-4.5-air(경량), glm-4.6v-flash(비전)

벤치마크 (valid_as_of 2026-01-09)

벤치마크	GLM-4.7	비고
SWE-bench Verified	73.8%	Claude 5 Sonnet 수준
AIME 2025	95.7%	GPT-5.1(94.0%) 상회
GPQA-Diamond	85.7%	박사급 과학
Tool-calling	90.6%	Claude 5 Sonnet에 근접
τ²-Bench	87.4	오픈소스 최고

커뮤니티: “Claude의 약 80% 수준” (Hacker News)

3가지 Endpoint (반드시 구분)

용도	URL
일반 API	`https://api.z.ai/api/paas/v4`
Coding Plan 전용	`https://api.z.ai/api/coding/paas/v4`
Anthropic 호환 (Claude Code용)	`https://api.z.ai/api/anthropic`

혼동 주의

Coding Plan 구독자가 일반 endpoint 사용 시 “Authorization Failure” / “Insufficient Balance” 오류.

Claude Code 연동

settings.json 환경변수로 GLM-4.7을 Claude처럼 사용:

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
    "ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-4.7"
  }
}

Context Caching

모델	일반	캐시	절감
GLM-4.7	$0.60/1M	$0.11/1M	~82%
GLM-4.5-Air	$0.20/1M	$0.03/1M	~85%

캐시 저장 비용 현재 무료 (베타).

Thinking Mode

Interleaved / Preserved / Turn-level 3종. Claude Extended Thinking과 유사한 구조.

{ "thinking": { "type": "enabled", "budget_tokens": 8192 } }

JYP Garden

탐색기

Z.AI (Zhipu AI) / GLM-4.7

Z.AI (Zhipu AI) / GLM-4.7

Summary

개요

GLM-4.7 주요 사실 (valid_as_of 2026-01-09)

벤치마크 (valid_as_of 2026-01-09)

3가지 Endpoint (반드시 구분)

Claude Code 연동

Context Caching

Thinking Mode

관련 엔티티

소스

그래프 뷰

목차