Qwen3.6-35B-A3B on my laptop drew a better pelican than Claude Opus 4.7

Source: raw/articles/2026-04-16-simon-willison-qwen-beats-opus.md Type: article By: Simon Willison (simonwillison.net) Valid as of: 2026-04-16

핵심 Takeaway

  • Qwen3.6-35B-A3B (21GB 양자화, 로컬 MacBook Pro M5) > Claude Opus 4.7 (클라우드), pelican 벤치마크 기준 (2026-04-16)
  • Qwen 3.6 SWE-Bench 73.4% — 오픈 웨이트 모델로 최고 수준
  • “pelican benchmark” = Simon Willison의 비공식 크리에이티브 벤치마크 (SVG 자전거 타는 펠리컨)
  • 벤치마크 취지: “모델 비교 작업의 불합리함을 보여주는 것” — 하지만 펠리컨 품질과 범용 모델 유용성 간 상관관계 역사적으로 존재

연결되는 위키 페이지