Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다

security 2026-05-22 약 10분

 tags

#ai-security #vulnerability #open-source #claude #cve

vote

북마크

Anthropic이 Project Glasswing 첫 달 성과를 공개했어. Claude Mythos Preview와 약 50개 파트너가 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾았고, 이제 병목은 취약점 발견이 아니라 검증·공개·패치 쪽으로 옮겨갔다는 게 핵심이야.

1
Claude Mythos Preview가 파트너 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냄
2
오픈소스 1,000개 이상을 스캔해 고위험·치명 추정 취약점 6,202개를 발견함
3
검증된 표본 1,752개 중 90.6%가 실제 취약점으로 확인됨
4
wolfSSL에서는 인증서 위조로 이어질 수 있는 CVE-2026-5194를 찾아 패치까지 진행됨
5
Anthropic은 Mythos급 모델을 아직 공개하지 않고, 방어자용 도구와 검증 프로그램부터 확대 중임

AI가 취약점을 ‘찾는’ 단계는 이미 넘어간 듯

Anthropic이 Project Glasswing 첫 달 업데이트를 공개했는데, 숫자가 꽤 세다.
- Claude Mythos Preview와 약 50개 파트너가 전 세계 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냈다고 함.
- Anthropic의 표현을 빌리면, 예전 병목은 “새 취약점을 얼마나 빨리 찾느냐”였는데 이제는 “AI가 찾은 걸 사람이 얼마나 빨리 검증하고, 공개하고, 패치하느냐”로 바뀐 셈.
공개 가능한 디테일이 아직 제한적인 이유도 있음.
- 업계 관행상 새 취약점은 보통 발견 후 90일 뒤, 패치가 먼저 나오면 패치 후 약 45일 뒤 공개하는 식으로 조율됨.
- 그래서 Anthropic은 지금 단계에서 개별 취약점 상세 PoC를 풀기보다는, 예시와 집계 수치 중심으로 공개하고 있음.

❗중요

> 이번 뉴스의 핵심은 “AI가 취약점을 잘 찾음”이 아니라 “취약점 발견 비용이 너무 낮아져서 보안 생태계의 병목이 패치와 운영으로 이동함”이야.

파트너 쪽 성과가 이미 현실 배포 코드에서 나옴

파트너 대부분이 한 달 만에 각자 수백 개의 고위험·치명 취약점을 찾았다고 함.
- 전체 합산은 1만 개 이상.
- 몇몇 파트너는 버그 발견 속도가 10배 이상 빨라졌다고 Anthropic에 전함.
Cloudflare 사례가 특히 눈에 띔.
- 핵심 경로 시스템에서 버그 2,000개를 찾았고, 이 중 400개가 고위험 또는 치명 등급.
- Cloudflare 팀은 오탐률이 인간 테스터보다 낫다고 평가했다고 함. 이건 꽤 무서운 칭찬임.
외부 평가에서도 Mythos Preview는 꽤 강하게 나옴.
- 영국 AI Security Institute는 Mythos Preview가 두 개의 사이버 레인지, 즉 다단계 공격 시뮬레이션을 처음으로 끝까지 해결한 모델이라고 보고함.
- Mozilla는 Firefox 150 테스트 중 취약점 271개를 찾아 고쳤고, Firefox 148에서 Claude Opus 4.6으로 찾은 것보다 10배 이상 많았다고 함.
- XBOW는 웹 익스플로잇 벤치마크에서 기존 모델 대비 “상당한 도약”이고, 토큰 대비 정밀도가 전례 없다고 평가함.
- ExploitBench와 ExploitGym에서도 Mythos Preview가 가장 강한 성능을 보였다고 함.

오픈소스 쪽은 더 복잡함

Anthropic은 지난 몇 달 동안 Mythos Preview로 1,000개 이상의 오픈소스 프로젝트를 스캔함.
- 이 프로젝트들은 인터넷과 Anthropic 내부 인프라의 기반이 되는 코드라고 설명됨.
- 모델은 전체 23,019개 취약점을 찾았고, 그중 6,202개를 고위험 또는 치명으로 추정함.
검증된 표본의 정확도도 낮지 않음.
- 고위험·치명 추정 취약점 1,752개를 독립 보안 리서치 회사 6곳 또는 Anthropic이 정밀 검토함.
- 이 중 90.6%인 1,587개가 실제 취약점으로 확인됨.
- 62.4%인 1,094개는 실제로도 고위험 또는 치명 등급으로 확인됨.
- 이 비율대로면 추가 발견이 없어도 오픈소스 코드에서 약 3,900개의 고위험·치명 취약점을 드러낸 셈이 된다고 Anthropic은 계산함.
wolfSSL 사례는 임팩트가 크다.
- wolfSSL은 전 세계 수십억 대 기기에서 쓰이는 오픈소스 암호화 라이브러리.
- Mythos Preview는 공격자가 인증서를 위조할 수 있는 익스플로잇을 구성했고, 이론상 은행이나 이메일 제공자처럼 보이는 가짜 사이트를 만들 수 있는 취약점이었다고 함.
- 해당 취약점은 CVE-2026-5194로 지정됐고, 이미 패치됨.

sequenceDiagram
    participant 모델 as Claude Mythos Preview
    participant 검증팀 as 보안 검증팀
    participant 유지보수자 as 오픈소스 유지보수자
    participant 사용자 as 최종 사용자
    모델->>검증팀: 취약점 후보와 익스플로잇 근거 제출
    검증팀->>검증팀: 재현 및 심각도 재평가
    검증팀->>유지보수자: 상세 보고서 전달
    유지보수자->>유지보수자: 패치 설계와 릴리스 준비
    유지보수자->>사용자: 보안 업데이트 배포
    사용자->>사용자: 패치 적용 전까지 노출 지속

진짜 문제는 유지보수자의 처리량

Anthropic의 공개 절차는 꽤 무겁다.
- 먼저 외부 보안 회사나 Anthropic이 Mythos가 찾은 이슈를 재현함.
- 실제 취약점인지 확인하고 심각도를 다시 매김.
- 이미 패치가 있는지 확인한 뒤, 유지보수자에게 상세 보고서를 씀.
이 과정이 느린 이유는 오픈소스 유지보수자들이 이미 과부하 상태이기 때문임.
- 요즘 유지보수자들은 저품질 AI 생성 버그 리포트 폭탄도 같이 맞고 있음.
- 몇몇 유지보수자는 Anthropic에 공개 속도를 늦춰 달라고 요청했다고 함.
- Mythos Preview가 찾은 고위험·치명 버그는 평균적으로 패치까지 2주가 걸림.
숫자로 보면 병목이 더 선명함.
- Anthropic은 현재까지 고위험·치명 취약점 530개를 유지보수자에게 공개했다고 추정함.
- 그중 패치된 건 75개, 공개 보안 권고문까지 나온 건 65개.
- 아직 공개를 목표로 대기 중인 확인 취약점도 827개 있음.

⚠️주의

> 취약점 발견 속도가 패치 속도를 압도하면, 방어자에게 좋은 도구가 동시에 공격자에게도 시간차 리스크를 만든다. 패치 윈도우가 길수록 그 틈이 커짐.

방어자에게 필요한 건 더 짧은 패치 루프

Anthropic은 Mythos급 모델이 곧 여러 AI 회사에서 나올 거라고 보고 있음.
- 문제는 이런 모델을 악용하지 못하게 막을 만큼 강한 안전장치가 아직 없다는 점.
- 그래서 Anthropic도 Mythos급 모델을 일반 공개하지 않고 있음.
개발자와 운영팀에게 던지는 메시지는 단순함.
- 보안 패치 사이클을 줄여야 함.
- 사용자가 업데이트를 쉽게 설치하게 만들어야 함.
- 알려진 취약점이 있는 버전을 계속 쓰는 사용자에게는 더 적극적으로 업데이트를 유도해야 함.
네트워크 방어자도 패치 테스트와 배포 시간을 줄여야 함.
- 기본 설정 하드닝, 다중 인증, 포괄적 로그 수집 같은 기본 통제가 더 중요해짐.
- 특정 패치 하나가 제때 안 나와도 버틸 수 있는 방어층이 필요하다는 얘기.

Anthropic은 공개 모델 대신 방어자용 도구부터 풀고 있음

Claude Enterprise 고객을 대상으로 Claude Security 공개 베타를 시작함.
- 코드베이스를 스캔해 취약점을 찾고, 수정안까지 생성하는 도구.
- 출시 후 3주 동안 Claude Opus 4.7로 2,100개 이상의 취약점이 패치됐다고 함.
합법적 보안 작업을 위한 Cyber Verification Program도 시작함.
- 취약점 연구, 침투 테스트, 레드팀 같은 목적이라면 일부 사이버 오용 방지 제한을 완화해 주는 프로그램.
Mythos Preview와 함께 쓰던 도구도 일부 적격 고객 보안팀에 요청 기반으로 제공함.
- 반복 작업용 스킬, 코드베이스 매핑과 스캔 서브에이전트 실행을 돕는 하네스, 위협 모델 빌더가 포함됨.
- Cisco는 자체 평가 시스템을 만들 때 쓰는 Foundry Security Spec도 오픈소스로 공개함.

기술 맥락

여기서 가장 큰 변화는 취약점 탐지의 단가가 내려갔다는 점이에요. 예전에는 숙련된 리서처가 긴 시간 코드를 파고들어야 했는데, Mythos Preview 같은 모델은 후보를 대량으로 뽑아내고 익스플로잇 가능성까지 같이 제시하거든요.
Anthropic이 모델을 바로 공개하지 않는 이유도 여기에 있어요. 방어자에게는 엄청난 생산성 도구지만, 같은 능력이 공격자에게 가면 아직 패치되지 않은 코드의 공격 비용도 같이 내려가요.
오픈소스에서 특히 힘든 건 기술 문제가 아니라 운영 문제예요. 취약점 후보를 재현하고, 심각도를 다시 매기고, 유지보수자와 조율하고, 패치가 실제 사용자에게 깔리는 데까지 사람이 계속 필요하거든요.
그래서 앞으로 보안팀의 경쟁력은 “취약점을 찾는 능력”만이 아니라 “찾은 취약점을 얼마나 빨리 triage하고 배포까지 끝내느냐”로 옮겨갈 가능성이 커요. CI, 릴리스, 의존성 업데이트, 로그 기반 탐지까지 한 덩어리로 봐야 하는 이유가 여기 있어요.

이건 ‘AI가 보안 취약점을 잘 찾는다’ 수준의 뉴스가 아니라, 보안 운영 모델 자체가 바뀌고 있다는 신호야. 발견 비용이 급락하면 패치 속도, 공개 절차, 유지보수자 체력 같은 진짜 병목이 한꺼번에 드러남.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다

요약

핵심 포인트

핵심 개념

분석

AI가 취약점을 ‘찾는’ 단계는 이미 넘어간 듯

파트너 쪽 성과가 이미 현실 배포 코드에서 나옴

오픈소스 쪽은 더 복잡함

진짜 문제는 유지보수자의 처리량

방어자에게 필요한 건 더 짧은 패치 루프

Anthropic은 공개 모델 대신 방어자용 도구부터 풀고 있음

기술 맥락

인사이트

댓글

댓글

Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다

요약

핵심 포인트

핵심 개념

분석

AI가 취약점을 ‘찾는’ 단계는 이미 넘어간 듯

파트너 쪽 성과가 이미 현실 배포 코드에서 나옴

오픈소스 쪽은 더 복잡함

진짜 문제는 유지보수자의 처리량

방어자에게 필요한 건 더 짧은 패치 루프

Anthropic은 공개 모델 대신 방어자용 도구부터 풀고 있음

기술 맥락

인사이트

댓글

댓글

관련 기사