---
title: "Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다"
published: 2026-05-22T19:31:45.000Z
canonical: https://jeff.news/article/3126
---
# Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다

Anthropic이 Project Glasswing 첫 달 성과를 공개했어. Claude Mythos Preview와 약 50개 파트너가 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾았고, 이제 병목은 취약점 발견이 아니라 검증·공개·패치 쪽으로 옮겨갔다는 게 핵심이야.

## AI가 취약점을 ‘찾는’ 단계는 이미 넘어간 듯

- Anthropic이 Project Glasswing 첫 달 업데이트를 공개했는데, 숫자가 꽤 세다.
  - Claude Mythos Preview와 약 50개 파트너가 전 세계 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냈다고 함.
  - Anthropic의 표현을 빌리면, 예전 병목은 “새 취약점을 얼마나 빨리 찾느냐”였는데 이제는 “AI가 찾은 걸 사람이 얼마나 빨리 검증하고, 공개하고, 패치하느냐”로 바뀐 셈.

- 공개 가능한 디테일이 아직 제한적인 이유도 있음.
  - 업계 관행상 새 취약점은 보통 발견 후 90일 뒤, 패치가 먼저 나오면 패치 후 약 45일 뒤 공개하는 식으로 조율됨.
  - 그래서 Anthropic은 지금 단계에서 개별 취약점 상세 PoC를 풀기보다는, 예시와 집계 수치 중심으로 공개하고 있음.

> [!IMPORTANT]
> 이번 뉴스의 핵심은 “AI가 취약점을 잘 찾음”이 아니라 “취약점 발견 비용이 너무 낮아져서 보안 생태계의 병목이 패치와 운영으로 이동함”이야.

## 파트너 쪽 성과가 이미 현실 배포 코드에서 나옴

- 파트너 대부분이 한 달 만에 각자 수백 개의 고위험·치명 취약점을 찾았다고 함.
  - 전체 합산은 1만 개 이상.
  - 몇몇 파트너는 버그 발견 속도가 10배 이상 빨라졌다고 Anthropic에 전함.

- Cloudflare 사례가 특히 눈에 띔.
  - 핵심 경로 시스템에서 버그 2,000개를 찾았고, 이 중 400개가 고위험 또는 치명 등급.
  - Cloudflare 팀은 오탐률이 인간 테스터보다 낫다고 평가했다고 함. 이건 꽤 무서운 칭찬임.

- 외부 평가에서도 Mythos Preview는 꽤 강하게 나옴.
  - 영국 AI Security Institute는 Mythos Preview가 두 개의 사이버 레인지, 즉 다단계 공격 시뮬레이션을 처음으로 끝까지 해결한 모델이라고 보고함.
  - Mozilla는 Firefox 150 테스트 중 취약점 271개를 찾아 고쳤고, Firefox 148에서 Claude Opus 4.6으로 찾은 것보다 10배 이상 많았다고 함.
  - XBOW는 웹 익스플로잇 벤치마크에서 기존 모델 대비 “상당한 도약”이고, 토큰 대비 정밀도가 전례 없다고 평가함.
  - ExploitBench와 ExploitGym에서도 Mythos Preview가 가장 강한 성능을 보였다고 함.

## 오픈소스 쪽은 더 복잡함

- Anthropic은 지난 몇 달 동안 Mythos Preview로 1,000개 이상의 오픈소스 프로젝트를 스캔함.
  - 이 프로젝트들은 인터넷과 Anthropic 내부 인프라의 기반이 되는 코드라고 설명됨.
  - 모델은 전체 23,019개 취약점을 찾았고, 그중 6,202개를 고위험 또는 치명으로 추정함.

- 검증된 표본의 정확도도 낮지 않음.
  - 고위험·치명 추정 취약점 1,752개를 독립 보안 리서치 회사 6곳 또는 Anthropic이 정밀 검토함.
  - 이 중 90.6%인 1,587개가 실제 취약점으로 확인됨.
  - 62.4%인 1,094개는 실제로도 고위험 또는 치명 등급으로 확인됨.
  - 이 비율대로면 추가 발견이 없어도 오픈소스 코드에서 약 3,900개의 고위험·치명 취약점을 드러낸 셈이 된다고 Anthropic은 계산함.

- wolfSSL 사례는 임팩트가 크다.
  - wolfSSL은 전 세계 수십억 대 기기에서 쓰이는 오픈소스 암호화 라이브러리.
  - Mythos Preview는 공격자가 인증서를 위조할 수 있는 익스플로잇을 구성했고, 이론상 은행이나 이메일 제공자처럼 보이는 가짜 사이트를 만들 수 있는 취약점이었다고 함.
  - 해당 취약점은 CVE-2026-5194로 지정됐고, 이미 패치됨.

```mermaid
sequenceDiagram
    participant 모델 as Claude Mythos Preview
    participant 검증팀 as 보안 검증팀
    participant 유지보수자 as 오픈소스 유지보수자
    participant 사용자 as 최종 사용자
    모델->>검증팀: 취약점 후보와 익스플로잇 근거 제출
    검증팀->>검증팀: 재현 및 심각도 재평가
    검증팀->>유지보수자: 상세 보고서 전달
    유지보수자->>유지보수자: 패치 설계와 릴리스 준비
    유지보수자->>사용자: 보안 업데이트 배포
    사용자->>사용자: 패치 적용 전까지 노출 지속
```

## 진짜 문제는 유지보수자의 처리량

- Anthropic의 공개 절차는 꽤 무겁다.
  - 먼저 외부 보안 회사나 Anthropic이 Mythos가 찾은 이슈를 재현함.
  - 실제 취약점인지 확인하고 심각도를 다시 매김.
  - 이미 패치가 있는지 확인한 뒤, 유지보수자에게 상세 보고서를 씀.

- 이 과정이 느린 이유는 오픈소스 유지보수자들이 이미 과부하 상태이기 때문임.
  - 요즘 유지보수자들은 저품질 AI 생성 버그 리포트 폭탄도 같이 맞고 있음.
  - 몇몇 유지보수자는 Anthropic에 공개 속도를 늦춰 달라고 요청했다고 함.
  - Mythos Preview가 찾은 고위험·치명 버그는 평균적으로 패치까지 2주가 걸림.

- 숫자로 보면 병목이 더 선명함.
  - Anthropic은 현재까지 고위험·치명 취약점 530개를 유지보수자에게 공개했다고 추정함.
  - 그중 패치된 건 75개, 공개 보안 권고문까지 나온 건 65개.
  - 아직 공개를 목표로 대기 중인 확인 취약점도 827개 있음.

> [!WARNING]
> 취약점 발견 속도가 패치 속도를 압도하면, 방어자에게 좋은 도구가 동시에 공격자에게도 시간차 리스크를 만든다. 패치 윈도우가 길수록 그 틈이 커짐.

## 방어자에게 필요한 건 더 짧은 패치 루프

- Anthropic은 Mythos급 모델이 곧 여러 AI 회사에서 나올 거라고 보고 있음.
  - 문제는 이런 모델을 악용하지 못하게 막을 만큼 강한 안전장치가 아직 없다는 점.
  - 그래서 Anthropic도 Mythos급 모델을 일반 공개하지 않고 있음.

- 개발자와 운영팀에게 던지는 메시지는 단순함.
  - 보안 패치 사이클을 줄여야 함.
  - 사용자가 업데이트를 쉽게 설치하게 만들어야 함.
  - 알려진 취약점이 있는 버전을 계속 쓰는 사용자에게는 더 적극적으로 업데이트를 유도해야 함.

- 네트워크 방어자도 패치 테스트와 배포 시간을 줄여야 함.
  - 기본 설정 하드닝, 다중 인증, 포괄적 로그 수집 같은 기본 통제가 더 중요해짐.
  - 특정 패치 하나가 제때 안 나와도 버틸 수 있는 방어층이 필요하다는 얘기.

## Anthropic은 공개 모델 대신 방어자용 도구부터 풀고 있음

- Claude Enterprise 고객을 대상으로 Claude Security 공개 베타를 시작함.
  - 코드베이스를 스캔해 취약점을 찾고, 수정안까지 생성하는 도구.
  - 출시 후 3주 동안 Claude Opus 4.7로 2,100개 이상의 취약점이 패치됐다고 함.

- 합법적 보안 작업을 위한 Cyber Verification Program도 시작함.
  - 취약점 연구, 침투 테스트, 레드팀 같은 목적이라면 일부 사이버 오용 방지 제한을 완화해 주는 프로그램.

- Mythos Preview와 함께 쓰던 도구도 일부 적격 고객 보안팀에 요청 기반으로 제공함.
  - 반복 작업용 스킬, 코드베이스 매핑과 스캔 서브에이전트 실행을 돕는 하네스, 위협 모델 빌더가 포함됨.
  - Cisco는 자체 평가 시스템을 만들 때 쓰는 Foundry Security Spec도 오픈소스로 공개함.

---

## 기술 맥락

- 여기서 가장 큰 변화는 취약점 탐지의 단가가 내려갔다는 점이에요. 예전에는 숙련된 리서처가 긴 시간 코드를 파고들어야 했는데, Mythos Preview 같은 모델은 후보를 대량으로 뽑아내고 익스플로잇 가능성까지 같이 제시하거든요.

- Anthropic이 모델을 바로 공개하지 않는 이유도 여기에 있어요. 방어자에게는 엄청난 생산성 도구지만, 같은 능력이 공격자에게 가면 아직 패치되지 않은 코드의 공격 비용도 같이 내려가요.

- 오픈소스에서 특히 힘든 건 기술 문제가 아니라 운영 문제예요. 취약점 후보를 재현하고, 심각도를 다시 매기고, 유지보수자와 조율하고, 패치가 실제 사용자에게 깔리는 데까지 사람이 계속 필요하거든요.

- 그래서 앞으로 보안팀의 경쟁력은 “취약점을 찾는 능력”만이 아니라 “찾은 취약점을 얼마나 빨리 triage하고 배포까지 끝내느냐”로 옮겨갈 가능성이 커요. CI, 릴리스, 의존성 업데이트, 로그 기반 탐지까지 한 덩어리로 봐야 하는 이유가 여기 있어요.

## 핵심 포인트

- Claude Mythos Preview가 파트너 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냄
- 오픈소스 1,000개 이상을 스캔해 고위험·치명 추정 취약점 6,202개를 발견함
- 검증된 표본 1,752개 중 90.6%가 실제 취약점으로 확인됨
- wolfSSL에서는 인증서 위조로 이어질 수 있는 CVE-2026-5194를 찾아 패치까지 진행됨
- Anthropic은 Mythos급 모델을 아직 공개하지 않고, 방어자용 도구와 검증 프로그램부터 확대 중임

## 인사이트

이건 ‘AI가 보안 취약점을 잘 찾는다’ 수준의 뉴스가 아니라, 보안 운영 모델 자체가 바뀌고 있다는 신호야. 발견 비용이 급락하면 패치 속도, 공개 절차, 유지보수자 체력 같은 진짜 병목이 한꺼번에 드러남.