Project Glasswing

Anthropic이 자체 “미토스급” 강력 모델을 글로벌 기업들에 배포해 소프트웨어 보안 취약점을 사전 발견·패치하도록 한 프로그램.

배경

  • 현재 글로벌 소프트웨어 보안 수준이 충분치 않다는 Anthropic 판단
  • 미토스 모델이 공개될 경우, 동일 능력이 공격자 손에 들어가면 심각한 해킹 위험 발생
  • 따라서 모델을 선별된 글로벌 기업에만 배포해 자사 코드베이스 취약점을 조기 패치하도록 게이트키핑

결과 (발표 시점)

  • 1만 건 이상의 심각도 높음 / 매우 심각 취약점 발견
  • 사이버 시큐리티 강화의 사전 단계 (Public 릴리스 전)

관련 모델

  • “미토스급” 모델은 일반 공개되지 않을 가능성이 크고, 적절히 능력 제어된 “미터스급” 변형이 일반 고객에게 제공될 예정 (Claude-Opus-4-8 출시 시점에서 몇 주 안)

유사 프로그램

의의

  • 모델 회사들이 이중 트랙 배포 전략(공개 vs. 신뢰 게이트키핑)을 채택하는 신호
  • 보안·공격 모두 강화되는 AI 전환기에서 모델 회사가 위협 평가 + 사전 방어까지 책임지는 새로운 책임 모델 형태

관련 노트