Anthropic, AI로 제로데이 취약점 잡는 'Project Glasswing' 발표 — 11개 빅테크와 공동 추진

security 2026-04-07 약 5분

 tags

#ai #cybersecurity #anthropic #open-source #zero-day

vote

북마크

Anthropic이 AWS, Apple, Google, Microsoft 등 11개 파트너와 함께 AI 기반 사이버보안 프로젝트 'Glasswing'을 발표했음. 새 모델 Claude Mythos Preview가 OpenBSD 27년 된 버그, FFmpeg 16년 된 결함 등 수천 개의 제로데이 취약점을 발견했고, 참여 기관에 총 1억 달러 상당의 크레딧을 제공함.

1
Claude Mythos Preview가 주요 OS·브라우저에서 수천 개 제로데이 취약점 발견
2
OpenBSD 27년, FFmpeg 16년, Linux 커널 권한 상승 등 기존 자동화 도구가 놓친 취약점 탐지
3
CyberGym 벤치마크 83.1%, SWE-bench Pro 77.8%로 Opus 4.6 대비 큰 폭 향상
4
참여 기관에 $1억 크레딧 + Linux Foundation·Apache에 별도 $400만 투자
5
90일 주기로 취약점 수정 현황 공개 보고 예정

Anthropic이 'Project Glasswing'이라는 사이버보안 프로젝트를 발표함 — AWS, Apple, Google, Microsoft, NVIDIA, CrowdStrike 등 11개 대형 파트너와 함께
- 핵심은 새 모델 Claude Mythos Preview의 취약점 탐지 능력을 오픈소스·핵심 인프라 보안에 투입하겠다는 것

발견된 제로데이 취약점들

Mythos Preview가 주요 OS와 웹 브라우저에서 수천 개의 제로데이 취약점을 찾아냄
- OpenBSD: 27년 동안 숨어있던 원격 크래시 취약점 발견 — 보안 최우선으로 설계된 OS에서
- FFmpeg: 16년 된 영상 인코딩/디코딩 결함. 500만 번의 자동화 테스트를 다 통과했던 놈임
- Linux 커널: 일반 사용자 권한에서 시스템 완전 장악까지 가능한 권한 상승 취약점 체인 발견

❗중요

> CyberGym 벤치마크에서 취약점 재현 성공률 83.1% 달성 — 기존 Opus 4.6의 66.6%를 크게 상회함

코딩 벤치마크도 압도적

SWE-bench 시리즈에서 전작 대비 큰 폭의 성능 향상을 보여줌
- SWE-bench Pro: 77.8% (Opus 4.6은 53.4%)
- SWE-bench Verified: 93.9% (Opus 4.6은 80.8%)
- Terminal-Bench 2.0: 82.0% (Opus 4.6은 65.4%)
가격은 입력 토큰 100만 개당 $25, 출력 $125 — 프리뷰 이후 적용 예정

투자 규모와 프로그램 구조

참여 기관에 총 $1억 상당의 Mythos Preview 사용 크레딧 제공
- Linux Foundation 산하 Alpha-Omega·OpenSSF에 $250만
- Apache Software Foundation에 $150만
12개 론칭 파트너 + 40개 이상의 핵심 소프트웨어 인프라 조직에 접근 확대
- 오픈소스 메인테이너를 위한 'Claude for Open Source' 프로그램도 운영

적용 분야와 향후 계획

로컬 취약점 탐지, 블랙박스 바이너리 테스팅, 엔드포인트 보안, 침투 테스팅 등에 활용
90일마다 수정된 취약점과 개선 사항을 공개 보고할 예정
- 독립 제3자 거버넌스 기구 설립도 검토 중
Anthropic은 AI 사이버 역량의 국가 안보 영향에 대해 미국 정부와 협력할 준비가 되어있다고 밝힘

ℹ️참고

> Anthropic 측 표현에 따르면 "AI 모델이 취약점 익스플로잇에서 최고 수준의 인간 전문가를 제외하면 모두 능가하는 수준에 도달했다"고 함. 전 세계 사이버 범죄 비용은 연간 약 $5000억으로 추산됨

기술 맥락

AI를 사이버보안 공격이 아니라 방어에 쓰겠다는 게 Glasswing의 핵심이에요. 기존에는 AI가 악용될 위험이 주로 논의됐는데, Anthropic은 "어차피 이 수준의 AI는 나올 거니까 방어에 먼저 쓰자"는 전략을 택한 거거든요
Mythos Preview가 찾아낸 취약점들이 인상적인 건, 기존 자동화 도구(퍼징, 정적 분석 등)가 수십 년간 놓친 것들이라는 점이에요. FFmpeg의 경우 500만 번의 테스트를 통과한 코드에서 16년 된 버그를 잡아냈다는 건, AI가 패턴 매칭이 아니라 코드의 의미를 이해하고 있다는 걸 시사해요
SWE-bench Pro에서 77.8%라는 수치는 단순 코드 생성이 아니라 실제 GitHub 이슈를 해결하는 벤치마크에요. Opus 4.6 대비 24%p 이상 점프한 건 상당히 큰 폭이에요
$1억 크레딧을 뿌리면서 Linux Foundation과 Apache에 별도 투자까지 하는 건, 오픈소스 생태계에서 실질적 성과를 만들어 규제 논의에서 유리한 포지션을 잡으려는 의도도 읽혀요

AI를 사이버 공격이 아닌 방어에 선제적으로 투입하겠다는 전략인데, 오픈소스 생태계에 실질적 투자를 동반해서 단순 PR이 아닌 실행력이 보임. 규제 논의에서 유리한 포지션을 잡으려는 의도도 읽힘.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

Anthropic, AI로 제로데이 취약점 잡는 'Project Glasswing' 발표 — 11개 빅테크와 공동 추진

요약

핵심 포인트

핵심 개념

분석

발견된 제로데이 취약점들

코딩 벤치마크도 압도적

투자 규모와 프로그램 구조

적용 분야와 향후 계획

기술 맥락

인사이트

댓글

댓글

Anthropic, AI로 제로데이 취약점 잡는 'Project Glasswing' 발표 — 11개 빅테크와 공동 추진

요약

핵심 포인트

핵심 개념

분석

발견된 제로데이 취약점들

코딩 벤치마크도 압도적

투자 규모와 프로그램 구조

적용 분야와 향후 계획

기술 맥락

인사이트

댓글

댓글

관련 기사