본문으로 건너뛰기
피드

Anthropic의 Project Glasswing, AI로 고위험 취약점 1만 개 넘게 찾았다

security 약 10분
vote
0
댓글
북마크

Anthropic이 Project Glasswing 첫 달 성과를 공개했어. Claude Mythos Preview와 약 50개 파트너가 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾았고, 이제 병목은 취약점 발견이 아니라 검증·공개·패치 쪽으로 옮겨갔다는 게 핵심이야.

  • 1

    Claude Mythos Preview가 파트너 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냄

  • 2

    오픈소스 1,000개 이상을 스캔해 고위험·치명 추정 취약점 6,202개를 발견함

  • 3

    검증된 표본 1,752개 중 90.6%가 실제 취약점으로 확인됨

  • 4

    wolfSSL에서는 인증서 위조로 이어질 수 있는 CVE-2026-5194를 찾아 패치까지 진행됨

  • 5

    Anthropic은 Mythos급 모델을 아직 공개하지 않고, 방어자용 도구와 검증 프로그램부터 확대 중임

AI가 취약점을 ‘찾는’ 단계는 이미 넘어간 듯

  • Anthropic이 Project Glasswing 첫 달 업데이트를 공개했는데, 숫자가 꽤 세다.

    • Claude Mythos Preview와 약 50개 파트너가 전 세계 핵심 소프트웨어에서 고위험·치명 취약점 1만 개 이상을 찾아냈다고 함.
    • Anthropic의 표현을 빌리면, 예전 병목은 “새 취약점을 얼마나 빨리 찾느냐”였는데 이제는 “AI가 찾은 걸 사람이 얼마나 빨리 검증하고, 공개하고, 패치하느냐”로 바뀐 셈.
  • 공개 가능한 디테일이 아직 제한적인 이유도 있음.

    • 업계 관행상 새 취약점은 보통 발견 후 90일 뒤, 패치가 먼저 나오면 패치 후 약 45일 뒤 공개하는 식으로 조율됨.
    • 그래서 Anthropic은 지금 단계에서 개별 취약점 상세 PoC를 풀기보다는, 예시와 집계 수치 중심으로 공개하고 있음.

중요

> 이번 뉴스의 핵심은 “AI가 취약점을 잘 찾음”이 아니라 “취약점 발견 비용이 너무 낮아져서 보안 생태계의 병목이 패치와 운영으로 이동함”이야.

파트너 쪽 성과가 이미 현실 배포 코드에서 나옴

  • 파트너 대부분이 한 달 만에 각자 수백 개의 고위험·치명 취약점을 찾았다고 함.

    • 전체 합산은 1만 개 이상.
    • 몇몇 파트너는 버그 발견 속도가 10배 이상 빨라졌다고 Anthropic에 전함.
  • Cloudflare 사례가 특히 눈에 띔.

    • 핵심 경로 시스템에서 버그 2,000개를 찾았고, 이 중 400개가 고위험 또는 치명 등급.
    • Cloudflare 팀은 오탐률이 인간 테스터보다 낫다고 평가했다고 함. 이건 꽤 무서운 칭찬임.
  • 외부 평가에서도 Mythos Preview는 꽤 강하게 나옴.

    • 영국 AI Security Institute는 Mythos Preview가 두 개의 사이버 레인지, 즉 다단계 공격 시뮬레이션을 처음으로 끝까지 해결한 모델이라고 보고함.
    • Mozilla는 Firefox 150 테스트 중 취약점 271개를 찾아 고쳤고, Firefox 148에서 Claude Opus 4.6으로 찾은 것보다 10배 이상 많았다고 함.
    • XBOW는 웹 익스플로잇 벤치마크에서 기존 모델 대비 “상당한 도약”이고, 토큰 대비 정밀도가 전례 없다고 평가함.
    • ExploitBench와 ExploitGym에서도 Mythos Preview가 가장 강한 성능을 보였다고 함.

오픈소스 쪽은 더 복잡함

  • Anthropic은 지난 몇 달 동안 Mythos Preview로 1,000개 이상의 오픈소스 프로젝트를 스캔함.

    • 이 프로젝트들은 인터넷과 Anthropic 내부 인프라의 기반이 되는 코드라고 설명됨.
    • 모델은 전체 23,019개 취약점을 찾았고, 그중 6,202개를 고위험 또는 치명으로 추정함.
  • 검증된 표본의 정확도도 낮지 않음.

    • 고위험·치명 추정 취약점 1,752개를 독립 보안 리서치 회사 6곳 또는 Anthropic이 정밀 검토함.
    • 이 중 90.6%인 1,587개가 실제 취약점으로 확인됨.
    • 62.4%인 1,094개는 실제로도 고위험 또는 치명 등급으로 확인됨.
    • 이 비율대로면 추가 발견이 없어도 오픈소스 코드에서 약 3,900개의 고위험·치명 취약점을 드러낸 셈이 된다고 Anthropic은 계산함.
  • wolfSSL 사례는 임팩트가 크다.

    • wolfSSL은 전 세계 수십억 대 기기에서 쓰이는 오픈소스 암호화 라이브러리.
    • Mythos Preview는 공격자가 인증서를 위조할 수 있는 익스플로잇을 구성했고, 이론상 은행이나 이메일 제공자처럼 보이는 가짜 사이트를 만들 수 있는 취약점이었다고 함.
    • 해당 취약점은 CVE-2026-5194로 지정됐고, 이미 패치됨.
sequenceDiagram
    participant 모델 as Claude Mythos Preview
    participant 검증팀 as 보안 검증팀
    participant 유지보수자 as 오픈소스 유지보수자
    participant 사용자 as 최종 사용자
    모델->>검증팀: 취약점 후보와 익스플로잇 근거 제출
    검증팀->>검증팀: 재현 및 심각도 재평가
    검증팀->>유지보수자: 상세 보고서 전달
    유지보수자->>유지보수자: 패치 설계와 릴리스 준비
    유지보수자->>사용자: 보안 업데이트 배포
    사용자->>사용자: 패치 적용 전까지 노출 지속

진짜 문제는 유지보수자의 처리량

  • Anthropic의 공개 절차는 꽤 무겁다.

    • 먼저 외부 보안 회사나 Anthropic이 Mythos가 찾은 이슈를 재현함.
    • 실제 취약점인지 확인하고 심각도를 다시 매김.
    • 이미 패치가 있는지 확인한 뒤, 유지보수자에게 상세 보고서를 씀.
  • 이 과정이 느린 이유는 오픈소스 유지보수자들이 이미 과부하 상태이기 때문임.

    • 요즘 유지보수자들은 저품질 AI 생성 버그 리포트 폭탄도 같이 맞고 있음.
    • 몇몇 유지보수자는 Anthropic에 공개 속도를 늦춰 달라고 요청했다고 함.
    • Mythos Preview가 찾은 고위험·치명 버그는 평균적으로 패치까지 2주가 걸림.
  • 숫자로 보면 병목이 더 선명함.

    • Anthropic은 현재까지 고위험·치명 취약점 530개를 유지보수자에게 공개했다고 추정함.
    • 그중 패치된 건 75개, 공개 보안 권고문까지 나온 건 65개.
    • 아직 공개를 목표로 대기 중인 확인 취약점도 827개 있음.

⚠️주의

> 취약점 발견 속도가 패치 속도를 압도하면, 방어자에게 좋은 도구가 동시에 공격자에게도 시간차 리스크를 만든다. 패치 윈도우가 길수록 그 틈이 커짐.

방어자에게 필요한 건 더 짧은 패치 루프

  • Anthropic은 Mythos급 모델이 곧 여러 AI 회사에서 나올 거라고 보고 있음.

    • 문제는 이런 모델을 악용하지 못하게 막을 만큼 강한 안전장치가 아직 없다는 점.
    • 그래서 Anthropic도 Mythos급 모델을 일반 공개하지 않고 있음.
  • 개발자와 운영팀에게 던지는 메시지는 단순함.

    • 보안 패치 사이클을 줄여야 함.
    • 사용자가 업데이트를 쉽게 설치하게 만들어야 함.
    • 알려진 취약점이 있는 버전을 계속 쓰는 사용자에게는 더 적극적으로 업데이트를 유도해야 함.
  • 네트워크 방어자도 패치 테스트와 배포 시간을 줄여야 함.

    • 기본 설정 하드닝, 다중 인증, 포괄적 로그 수집 같은 기본 통제가 더 중요해짐.
    • 특정 패치 하나가 제때 안 나와도 버틸 수 있는 방어층이 필요하다는 얘기.

Anthropic은 공개 모델 대신 방어자용 도구부터 풀고 있음

  • Claude Enterprise 고객을 대상으로 Claude Security 공개 베타를 시작함.

    • 코드베이스를 스캔해 취약점을 찾고, 수정안까지 생성하는 도구.
    • 출시 후 3주 동안 Claude Opus 4.7로 2,100개 이상의 취약점이 패치됐다고 함.
  • 합법적 보안 작업을 위한 Cyber Verification Program도 시작함.

    • 취약점 연구, 침투 테스트, 레드팀 같은 목적이라면 일부 사이버 오용 방지 제한을 완화해 주는 프로그램.
  • Mythos Preview와 함께 쓰던 도구도 일부 적격 고객 보안팀에 요청 기반으로 제공함.

    • 반복 작업용 스킬, 코드베이스 매핑과 스캔 서브에이전트 실행을 돕는 하네스, 위협 모델 빌더가 포함됨.
    • Cisco는 자체 평가 시스템을 만들 때 쓰는 Foundry Security Spec도 오픈소스로 공개함.

기술 맥락

  • 여기서 가장 큰 변화는 취약점 탐지의 단가가 내려갔다는 점이에요. 예전에는 숙련된 리서처가 긴 시간 코드를 파고들어야 했는데, Mythos Preview 같은 모델은 후보를 대량으로 뽑아내고 익스플로잇 가능성까지 같이 제시하거든요.

  • Anthropic이 모델을 바로 공개하지 않는 이유도 여기에 있어요. 방어자에게는 엄청난 생산성 도구지만, 같은 능력이 공격자에게 가면 아직 패치되지 않은 코드의 공격 비용도 같이 내려가요.

  • 오픈소스에서 특히 힘든 건 기술 문제가 아니라 운영 문제예요. 취약점 후보를 재현하고, 심각도를 다시 매기고, 유지보수자와 조율하고, 패치가 실제 사용자에게 깔리는 데까지 사람이 계속 필요하거든요.

  • 그래서 앞으로 보안팀의 경쟁력은 “취약점을 찾는 능력”만이 아니라 “찾은 취약점을 얼마나 빨리 triage하고 배포까지 끝내느냐”로 옮겨갈 가능성이 커요. CI, 릴리스, 의존성 업데이트, 로그 기반 탐지까지 한 덩어리로 봐야 하는 이유가 여기 있어요.

이건 ‘AI가 보안 취약점을 잘 찾는다’ 수준의 뉴스가 아니라, 보안 운영 모델 자체가 바뀌고 있다는 신호야. 발견 비용이 급락하면 패치 속도, 공개 절차, 유지보수자 체력 같은 진짜 병목이 한꺼번에 드러남.

댓글

댓글

댓글을 불러오는 중...

security

한양대 에리카와 네이버클라우드, 클라우드·보안·AI 인재 키우는 산학협력 체결

한양대 에리카가 네이버클라우드와 첨단 분야 지역인재 양성과 글로벌 산학협력을 위한 업무협약을 맺었다. 협력 범위는 클라우드, 사이버보안, 블록체인, 개인정보보호, 인공지능(AI), 디지털 전환(DX) 교육·연구 기반 구축까지 포함된다.

security

악성 npm 패키지가 AI 개발도구의 지침 파일과 MCP까지 노리기 시작함

이스트시큐리티가 웹과 탈중앙화금융 개발자를 겨냥한 악성 npm 패키지 캠페인을 포착했어. 공격자는 유명 웹3 도구를 사칭하는 데서 그치지 않고, AI 에이전트가 읽는 프로젝트 지침 파일과 MCP 기반 외부 도구 호출까지 공격 경로로 삼으려 했어.

security

금융권, 앤트로픽 미토스가 찾은 오픈소스 취약점에 긴급 점검 들어감

앤트로픽의 AI 모델 클로드 미토스가 1000개 넘는 오픈소스에서 대량의 취약점 후보를 찾아냈고, 그중 일부가 실제 취약점으로 검증돼 공개됐어. 금융당국은 nginx, wolfSSL, FreeRDP, Ghost 같은 널리 쓰이는 구성요소를 중심으로 금융권에 긴급 자산 점검과 패치 적용을 권고했어.

security

애플이 양자 내성 암호화 검증 코드를 공개했다, 핵심은 수학적 증명

애플이 corecrypto 라이브러리의 포스트 양자 암호화 구현과 검증 코드를 GitHub에 공개했다. ML-KEM, ML-DSA 구현과 형식 검증 접근을 공개해 보안 연구자들이 직접 검토할 수 있게 했고, 이 기술은 25억 대 이상 활성 기기에서 쓰이는 암호화 기반과 연결된다.

security

라라벨 번역 패키지 태그가 통째로 바뀌었다, 개발자 비밀값 털리는 공급망 공격

전 세계 라라벨 개발자가 쓰는 Laravel-Lang 패키지가 공격을 받아 Git 태그가 악성 버전을 가리키도록 바뀌었다. 5월 22일 약 90분 동안 4개 저장소의 태그가 교체됐고, 감염된 패키지는 AWS 키, GitHub 토큰, Stripe 시크릿, 암호화폐 지갑 복구 구문, SSH 개인키 등을 노렸다.