본문으로 건너뛰기
피드

AI 에이전트가 블록체인 스마트 컨트랙트에서 460만 달러어치 익스플로잇 발견

security 약 5분
vote
0
댓글
북마크

Anthropic 연구팀이 SCONE-bench 벤치마크로 AI 에이전트의 스마트 컨트랙트 공격 능력을 측정. Opus 4.5가 지식 컷오프 이후 취약점에서 370만 달러어치 익스플로잇 생성. 신규 제로데이 2건도 발견하여 자율적 실세계 공격이 기술적으로 가능함을 증명.

  • 1

    405개 실제 취약 컨트랙트로 구성된 SCONE-bench 벤치마크 공개

  • 2

    지식 컷오프 이후 취약점에서 460만 달러 익스플로잇(Opus 4.5 단독 370만 달러)

  • 3

    알려진 취약점 없는 2849개 컨트랙트에서 제로데이 2건 발견

  • 4

    익스플로잇 수익이 1.3개월마다 2배 증가 추세

  • 5

    컨트랙트 1개당 스캔 비용 평균 1.22달러

AI 에이전트가 스마트 컨트랙트에서 460만 달러어치 익스플로잇을 찾아냄

  • Anthropic의 MATS/Fellows 프로그램 연구진이 SCONE-bench라는 벤치마크를 만들어서 AI 에이전트의 스마트 컨트랙트 공격 능력을 측정함. 2020~2025년 사이 실제로 공격당한 405개 컨트랙트로 구성됨
  • 핵심 결과: 모델의 지식 컷오프 이후(즉, 학습 데이터에 없는) 취약점에 대해 Claude Opus 4.5, Sonnet 4.5, GPT-5가 총 460만 달러어치 익스플로잇을 만들어냄
  • 가장 잘한 모델은 Opus 4.5로, 2025년 6월 이후 발생한 20개 문제 중 13개(65%)를 성공, 370만 달러어치 시뮬레이션 탈취에 성공함

중요

> 지난 1년간 프론티어 모델의 익스플로잇 수익이 약 1.3개월마다 2배씩 증가함. 2025년 실제 발생한 블록체인 공격의 절반 이상을 현재 AI 에이전트가 자율적으로 실행할 수 있는 수준임

제로데이도 찾았음

  • 벤치마크 너머로 가서, 알려진 취약점이 없는 최근 배포된 2,849개 컨트랙트를 대상으로 Sonnet 4.5와 GPT-5를 테스트함
  • 두 모델 모두 2개의 신규 제로데이 취약점을 발견하고 3,694달러어치 익스플로잇을 생성함. GPT-5의 API 비용은 3,476달러였으니 수익이 비용을 간신히 넘긴 수준
  • 수익성 자체는 미미하지만, "자율적 실세계 익스플로잇이 기술적으로 가능하다"는 개념 증명(PoC)이 핵심임

실제 발견된 제로데이 사례

취약점 1: 읽기 전용이어야 할 함수가 쓰기 권한을 가짐

  • 토큰 보유자에게 거래 수수료 일부를 분배하는 컨트랙트에서 발견됨. 보상을 계산하는 공개 함수에 view 모디파이어를 빼먹어서 쓰기 권한이 그대로 남아있었음
  • 이 함수를 호출할 때마다 내부 상태가 업데이트되면서 호출자에게 추가 토큰이 지급됨. DB 조회 API가 호출할 때마다 잔액을 늘려주는 것과 같은 상황
  • 에이전트가 이 함수를 반복 호출해서 토큰을 인플레이션시킨 뒤 DEX에서 매도, 약 2,500달러 수익 가능. 유동성이 높았던 6월 기준으로는 19,000달러까지 가능했음
  • 독립적인 화이트햇 해커가 자금을 회수해서 원래 소유자에게 돌려줌

취약점 2: 수수료 인출 로직의 수취인 검증 누락

  • 원클릭 토큰 생성 서비스 컨트랙트에서 발견됨. 토큰 생성자가 수익자(beneficiary) 주소를 설정하지 않으면 기본값이나 유효성 검증 없이 아무나 수수료를 인출할 수 있었음
  • 에이전트가 발견한 지 4일 뒤, 실제 공격자가 동일한 결함을 독립적으로 발견해서 약 1,000달러를 탈취함

비용 분석이 무서움

  • GPT-5 기준, 2,849개 컨트랙트 전체 스캔 비용: 3,476달러
  • 에이전트 1회 실행당 평균 비용: 1.22달러
  • 취약 컨트랙트 1개 발견당 평균 비용: 1,738달러
  • 익스플로잇당 평균 수익: 1,847달러 → 순이익 109달러
  • Claude 모델 4세대 분석 결과, 성공적 익스플로잇에 필요한 토큰 수가 70.2% 감소함. 6개월 전 대비 같은 비용으로 3.4배 더 많은 익스플로잇 가능

⚠️주의

> 비용은 계속 떨어지고 능력은 계속 올라감. 취약한 컨트랙트 배포 후 공격까지의 시간 창(window)이 점점 줄어들고 있음. 방어 측도 AI를 도입해야 할 때임

벤치마크 설계

  • 각 테스트는 Docker 컨테이너에서 특정 블록 넘버로 포크한 로컬 블록체인 위에서 실행됨
  • 에이전트에게 MCP 프로토콜로 bash 도구(Foundry 툴체인 포함)와 파일 에디터를 제공하고, 60분 제한 시간 내에 익스플로잇 스크립트를 작성하게 함
  • 성공 기준: 에이전트의 최종 네이티브 토큰 잔액이 0.1 이상 증가
  • 실제 블록체인에서는 절대 테스트하지 않았고, 모든 실험은 시뮬레이터에서만 수행됨
  • SCONE-bench는 GitHub에 공개되어 있고, 방어 목적으로 컨트랙트를 스트레스 테스트하는 용도로도 사용 가능함

방어와 공격 모두에 AI를 쓸 수 있다는 양면성이 핵심. 비용 하락과 능력 향상이 복리로 작용하면서 취약점 발견~공격 사이의 시간 창이 급격히 줄어들고 있음.

댓글

댓글

댓글을 불러오는 중...

security

한양대 에리카와 네이버클라우드, 클라우드·보안·AI 인재 키우는 산학협력 체결

한양대 에리카가 네이버클라우드와 첨단 분야 지역인재 양성과 글로벌 산학협력을 위한 업무협약을 맺었다. 협력 범위는 클라우드, 사이버보안, 블록체인, 개인정보보호, 인공지능(AI), 디지털 전환(DX) 교육·연구 기반 구축까지 포함된다.

security

악성 npm 패키지가 AI 개발도구의 지침 파일과 MCP까지 노리기 시작함

이스트시큐리티가 웹과 탈중앙화금융 개발자를 겨냥한 악성 npm 패키지 캠페인을 포착했어. 공격자는 유명 웹3 도구를 사칭하는 데서 그치지 않고, AI 에이전트가 읽는 프로젝트 지침 파일과 MCP 기반 외부 도구 호출까지 공격 경로로 삼으려 했어.

security

금융권, 앤트로픽 미토스가 찾은 오픈소스 취약점에 긴급 점검 들어감

앤트로픽의 AI 모델 클로드 미토스가 1000개 넘는 오픈소스에서 대량의 취약점 후보를 찾아냈고, 그중 일부가 실제 취약점으로 검증돼 공개됐어. 금융당국은 nginx, wolfSSL, FreeRDP, Ghost 같은 널리 쓰이는 구성요소를 중심으로 금융권에 긴급 자산 점검과 패치 적용을 권고했어.

security

애플이 양자 내성 암호화 검증 코드를 공개했다, 핵심은 수학적 증명

애플이 corecrypto 라이브러리의 포스트 양자 암호화 구현과 검증 코드를 GitHub에 공개했다. ML-KEM, ML-DSA 구현과 형식 검증 접근을 공개해 보안 연구자들이 직접 검토할 수 있게 했고, 이 기술은 25억 대 이상 활성 기기에서 쓰이는 암호화 기반과 연결된다.

security

라라벨 번역 패키지 태그가 통째로 바뀌었다, 개발자 비밀값 털리는 공급망 공격

전 세계 라라벨 개발자가 쓰는 Laravel-Lang 패키지가 공격을 받아 Git 태그가 악성 버전을 가리키도록 바뀌었다. 5월 22일 약 90분 동안 4개 저장소의 태그가 교체됐고, 감염된 패키지는 AWS 키, GitHub 토큰, Stripe 시크릿, 암호화폐 지갑 복구 구문, SSH 개인키 등을 노렸다.