Project Glasswing
Anthropic이 자체 “미토스급” 강력 모델을 글로벌 기업들에 배포해 소프트웨어 보안 취약점을 사전 발견·패치하도록 한 프로그램.
배경
- 현재 글로벌 소프트웨어 보안 수준이 충분치 않다는 Anthropic 판단
- 미토스 모델이 공개될 경우, 동일 능력이 공격자 손에 들어가면 심각한 해킹 위험 발생
- 따라서 모델을 선별된 글로벌 기업에만 배포해 자사 코드베이스 취약점을 조기 패치하도록 게이트키핑
결과 (발표 시점)
- 1만 건 이상의 심각도 높음 / 매우 심각 취약점 발견
- 사이버 시큐리티 강화의 사전 단계 (Public 릴리스 전)
관련 모델
- “미토스급” 모델은 일반 공개되지 않을 가능성이 크고, 적절히 능력 제어된 “미터스급” 변형이 일반 고객에게 제공될 예정 (Claude-Opus-4-8 출시 시점에서 몇 주 안)
유사 프로그램
- OpenAI Trusted Access (TAC) — GPT-5.4-Cyber 모델을 Google Form 신청 기반으로 신뢰 기업에만 배포 (참고: simon-willison-trusted-access-openai)
의의
- 모델 회사들이 이중 트랙 배포 전략(공개 vs. 신뢰 게이트키핑)을 채택하는 신호
- 보안·공격 모두 강화되는 AI 전환기에서 모델 회사가 위협 평가 + 사전 방어까지 책임지는 새로운 책임 모델 형태
관련 노트
- Anthropic — 운영 주체
- Claude-Opus-4-8 — 출시 시점 동반 언급
- simon-willison-trusted-access-openai — 유사 OpenAI 프로그램 비교
- yt-nDTkqvtZY5c-Opus-4-8-실전테스트-성공지식백과 — 발화 출처