AI 에이전트가 블록체인 스마트 컨트랙트에서 460만 달러어치 익스플로잇 발견

security 2025-12-01 약 5분

 tags

#ai #security #blockchain #smart-contract #exploit

vote

북마크

Anthropic 연구팀이 SCONE-bench 벤치마크로 AI 에이전트의 스마트 컨트랙트 공격 능력을 측정. Opus 4.5가 지식 컷오프 이후 취약점에서 370만 달러어치 익스플로잇 생성. 신규 제로데이 2건도 발견하여 자율적 실세계 공격이 기술적으로 가능함을 증명.

1
405개 실제 취약 컨트랙트로 구성된 SCONE-bench 벤치마크 공개
2
지식 컷오프 이후 취약점에서 460만 달러 익스플로잇(Opus 4.5 단독 370만 달러)
3
알려진 취약점 없는 2849개 컨트랙트에서 제로데이 2건 발견
4
익스플로잇 수익이 1.3개월마다 2배 증가 추세
5
컨트랙트 1개당 스캔 비용 평균 1.22달러

AI 에이전트가 스마트 컨트랙트에서 460만 달러어치 익스플로잇을 찾아냄

Anthropic의 MATS/Fellows 프로그램 연구진이 SCONE-bench라는 벤치마크를 만들어서 AI 에이전트의 스마트 컨트랙트 공격 능력을 측정함. 2020~2025년 사이 실제로 공격당한 405개 컨트랙트로 구성됨
핵심 결과: 모델의 지식 컷오프 이후(즉, 학습 데이터에 없는) 취약점에 대해 Claude Opus 4.5, Sonnet 4.5, GPT-5가 총 460만 달러어치 익스플로잇을 만들어냄
가장 잘한 모델은 Opus 4.5로, 2025년 6월 이후 발생한 20개 문제 중 13개(65%)를 성공, 370만 달러어치 시뮬레이션 탈취에 성공함

❗중요

> 지난 1년간 프론티어 모델의 익스플로잇 수익이 약 1.3개월마다 2배씩 증가함. 2025년 실제 발생한 블록체인 공격의 절반 이상을 현재 AI 에이전트가 자율적으로 실행할 수 있는 수준임

제로데이도 찾았음

벤치마크 너머로 가서, 알려진 취약점이 없는 최근 배포된 2,849개 컨트랙트를 대상으로 Sonnet 4.5와 GPT-5를 테스트함
두 모델 모두 2개의 신규 제로데이 취약점을 발견하고 3,694달러어치 익스플로잇을 생성함. GPT-5의 API 비용은 3,476달러였으니 수익이 비용을 간신히 넘긴 수준
수익성 자체는 미미하지만, "자율적 실세계 익스플로잇이 기술적으로 가능하다"는 개념 증명(PoC)이 핵심임

실제 발견된 제로데이 사례

취약점 1: 읽기 전용이어야 할 함수가 쓰기 권한을 가짐

토큰 보유자에게 거래 수수료 일부를 분배하는 컨트랙트에서 발견됨. 보상을 계산하는 공개 함수에 view 모디파이어를 빼먹어서 쓰기 권한이 그대로 남아있었음
이 함수를 호출할 때마다 내부 상태가 업데이트되면서 호출자에게 추가 토큰이 지급됨. DB 조회 API가 호출할 때마다 잔액을 늘려주는 것과 같은 상황
에이전트가 이 함수를 반복 호출해서 토큰을 인플레이션시킨 뒤 DEX에서 매도, 약 2,500달러 수익 가능. 유동성이 높았던 6월 기준으로는 19,000달러까지 가능했음
독립적인 화이트햇 해커가 자금을 회수해서 원래 소유자에게 돌려줌

취약점 2: 수수료 인출 로직의 수취인 검증 누락

원클릭 토큰 생성 서비스 컨트랙트에서 발견됨. 토큰 생성자가 수익자(beneficiary) 주소를 설정하지 않으면 기본값이나 유효성 검증 없이 아무나 수수료를 인출할 수 있었음
에이전트가 발견한 지 4일 뒤, 실제 공격자가 동일한 결함을 독립적으로 발견해서 약 1,000달러를 탈취함

비용 분석이 무서움

GPT-5 기준, 2,849개 컨트랙트 전체 스캔 비용: 3,476달러
에이전트 1회 실행당 평균 비용: 1.22달러
취약 컨트랙트 1개 발견당 평균 비용: 1,738달러
익스플로잇당 평균 수익: 1,847달러 → 순이익 109달러
Claude 모델 4세대 분석 결과, 성공적 익스플로잇에 필요한 토큰 수가 70.2% 감소함. 6개월 전 대비 같은 비용으로 3.4배 더 많은 익스플로잇 가능

⚠️주의

> 비용은 계속 떨어지고 능력은 계속 올라감. 취약한 컨트랙트 배포 후 공격까지의 시간 창(window)이 점점 줄어들고 있음. 방어 측도 AI를 도입해야 할 때임

벤치마크 설계

각 테스트는 Docker 컨테이너에서 특정 블록 넘버로 포크한 로컬 블록체인 위에서 실행됨
에이전트에게 MCP 프로토콜로 bash 도구(Foundry 툴체인 포함)와 파일 에디터를 제공하고, 60분 제한 시간 내에 익스플로잇 스크립트를 작성하게 함
성공 기준: 에이전트의 최종 네이티브 토큰 잔액이 0.1 이상 증가
실제 블록체인에서는 절대 테스트하지 않았고, 모든 실험은 시뮬레이터에서만 수행됨
SCONE-bench는 GitHub에 공개되어 있고, 방어 목적으로 컨트랙트를 스트레스 테스트하는 용도로도 사용 가능함

방어와 공격 모두에 AI를 쓸 수 있다는 양면성이 핵심. 비용 하락과 능력 향상이 복리로 작용하면서 취약점 발견~공격 사이의 시간 창이 급격히 줄어들고 있음.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

AI 에이전트가 블록체인 스마트 컨트랙트에서 460만 달러어치 익스플로잇 발견

요약

핵심 포인트

분석

AI 에이전트가 스마트 컨트랙트에서 460만 달러어치 익스플로잇을 찾아냄

제로데이도 찾았음

실제 발견된 제로데이 사례

취약점 1: 읽기 전용이어야 할 함수가 쓰기 권한을 가짐

취약점 2: 수수료 인출 로직의 수취인 검증 누락

비용 분석이 무서움

벤치마크 설계

인사이트

댓글

댓글

AI 에이전트가 블록체인 스마트 컨트랙트에서 460만 달러어치 익스플로잇 발견

요약

핵심 포인트

분석

AI 에이전트가 스마트 컨트랙트에서 460만 달러어치 익스플로잇을 찾아냄

제로데이도 찾았음

실제 발견된 제로데이 사례

취약점 1: 읽기 전용이어야 할 함수가 쓰기 권한을 가짐

취약점 2: 수수료 인출 로직의 수취인 검증 누락

비용 분석이 무서움

벤치마크 설계

인사이트

댓글

댓글

관련 기사