본문으로 건너뛰기
피드

GPT-5.5, 사이버 보안 평가서 클로드 미토스 앞섰다

security 약 5분
vote
0
댓글
북마크

영국 AI안전연구소 평가에서 GPT-5.5가 전문가급 사이버 보안 과제 통과율 71.4%를 기록하며 클로드 미토스 프리뷰를 앞섰다. 기업망 침투 시뮬레이션까지 통과하면서, AI 모델의 공격 역량이 몇 달 단위로 빠르게 상향 평준화되고 있다는 경고가 나왔다.

  • 1

    GPT-5.5는 95개 사이버 보안 과제에서 평균 통과율 71.4%를 기록했다

  • 2

    기업망 침투 시뮬레이션 더 라스트 원스의 32단계를 자율 수행한 두 번째 모델이 됐다

  • 3

    AI 모델의 사이버 공격 수준은 2024년 말 이후 4.7개월마다 두 배씩 증가하는 것으로 분석됐다

  • 4

    마이크로소프트도 100개 이상 AI 에이전트로 보안 허점을 찾는 MDASH를 공개했다

  • GPT-5.5가 영국 정부 산하 AI안전연구소(AISI)의 사이버 보안 평가에서 꽤 센 점수를 받음

    • 전문가 수준의 사이버 보안 기술을 보는 95개 과제에서 평균 통과율 71.4%를 기록함
    • 직전 모델인 GPT-5.4는 52.4%였으니, 한 세대 사이에 19%포인트가량 뛴 셈임
    • 비교 대상이던 앤스로픽 클로드 미토스(Mythos) 프리뷰는 68.6%, 클로드 오퍼스 4.7은 48.6%였음
  • 평가 범위도 단순한 보안 상식 퀴즈가 아니라 꽤 실전적임

    • 취약점 탐색, 웹 공격, 암호 분석 같은 과제가 포함됨
    • 특히 GPT-5.5는 기업망 침투 시뮬레이션인 더 라스트 원스(TLO)를 통과한 두 번째 모델로 기록됨
    • 이 시뮬레이션은 외부 시스템 침투, 소프트웨어 취약점 악용, 최종 데이터 탈취까지 총 32단계로 구성됨

중요

> 포인트는 “AI가 보안 문제를 잘 푼다”가 아니라, 기업망 침투 흐름을 단계별로 자율 수행했다는 데 있음. 공격 자동화의 체감선이 확 올라간 얘기임.

  • AISI는 AI 해커의 공격 역량이 상향 평준화되고 있다고 봄

    • 지난달에는 클로드 미토스 프리뷰가 TLO를 처음 통과한 모델로 기록됐음
    • 이번에는 GPT-5.5도 같은 종류의 고난도 평가를 통과하면서, 특정 회사만의 특이 케이스로 보기 어려워짐
    • AISI는 모델 전반의 성능 향상이 사이버 공격 역량 향상으로 이어진다면 가까운 미래에 여러 모델에서 추가 점프가 나올 수 있다고 봄
  • 속도 지표가 좀 무서움

    • AISI의 다른 보고서에 따르면 AI 모델의 사이버 공격 수준은 2024년 말 이후 4.7개월마다 두 배씩 늘어나는 중이라고 함
    • 기존에 제시했던 8개월 주기보다 훨씬 빨라진 속도임
    • 보안 조직 입장에서는 분기 단위로 위협 모델을 다시 봐야 하는 분위기임
  • 빅테크의 보안 경쟁도 이제 모델 경쟁이랑 붙어버림

    • 금융, 통신처럼 정보 시스템 의존도가 높은 산업에서는 사이버 보안이 곧 인프라 경쟁력이 됨
    • 마이크로소프트는 100개 이상의 AI 에이전트를 조율해 보안 시스템 허점을 찾는 MDASH를 공개함
    • 결국 공격자도 AI, 방어자도 AI를 쓰는 구도로 가고 있음

기술 맥락

  • 이번 평가가 의미 있는 이유는 모델의 ‘지식’이 아니라 ‘절차 수행 능력’을 봤기 때문이에요. 취약점 설명을 맞히는 것과 외부 침투부터 데이터 탈취까지 이어지는 흐름을 따라가는 건 난도가 완전히 다르거든요.

  • TLO 같은 시뮬레이션은 보안팀이 실제 사고 대응에서 보는 연쇄 과정을 압축해 놓은 테스트에 가까워요. 한 단계에서 얻은 정보가 다음 단계의 입력이 되기 때문에, 모델이 중간 결과를 해석하고 다음 행동을 고르는 능력이 중요해요.

  • AISI가 4.7개월마다 공격 역량이 두 배로 늘고 있다고 본 대목도 실무적으로 꽤 큽니다. 취약점 관리, 패치 우선순위, 침투 테스트 주기를 예전 기준으로 잡아두면 공격 자동화 속도를 못 따라갈 수 있어요.

  • 마이크로소프트의 MDASH처럼 방어 쪽도 여러 에이전트를 조율하는 방식으로 가는 건 자연스러운 대응이에요. 공격 표면이 넓어질수록 사람이 전부 수동으로 보는 방식은 병목이 생기고, AI가 먼저 후보를 걸러주는 구조가 필요해지거든요.

이제 중요한 건 특정 모델 하나가 잘하냐가 아니라, 여러 프런티어 모델이 동시에 공격 자동화 능력을 끌어올리고 있다는 점임. 보안팀 입장에서는 ‘AI가 공격자 생산성을 얼마나 올리나’를 현실 지표로 봐야 하는 시점이 됐다.

댓글

댓글

댓글을 불러오는 중...

security

한양대 에리카와 네이버클라우드, 클라우드·보안·AI 인재 키우는 산학협력 체결

한양대 에리카가 네이버클라우드와 첨단 분야 지역인재 양성과 글로벌 산학협력을 위한 업무협약을 맺었다. 협력 범위는 클라우드, 사이버보안, 블록체인, 개인정보보호, 인공지능(AI), 디지털 전환(DX) 교육·연구 기반 구축까지 포함된다.

security

악성 npm 패키지가 AI 개발도구의 지침 파일과 MCP까지 노리기 시작함

이스트시큐리티가 웹과 탈중앙화금융 개발자를 겨냥한 악성 npm 패키지 캠페인을 포착했어. 공격자는 유명 웹3 도구를 사칭하는 데서 그치지 않고, AI 에이전트가 읽는 프로젝트 지침 파일과 MCP 기반 외부 도구 호출까지 공격 경로로 삼으려 했어.

security

금융권, 앤트로픽 미토스가 찾은 오픈소스 취약점에 긴급 점검 들어감

앤트로픽의 AI 모델 클로드 미토스가 1000개 넘는 오픈소스에서 대량의 취약점 후보를 찾아냈고, 그중 일부가 실제 취약점으로 검증돼 공개됐어. 금융당국은 nginx, wolfSSL, FreeRDP, Ghost 같은 널리 쓰이는 구성요소를 중심으로 금융권에 긴급 자산 점검과 패치 적용을 권고했어.

security

애플이 양자 내성 암호화 검증 코드를 공개했다, 핵심은 수학적 증명

애플이 corecrypto 라이브러리의 포스트 양자 암호화 구현과 검증 코드를 GitHub에 공개했다. ML-KEM, ML-DSA 구현과 형식 검증 접근을 공개해 보안 연구자들이 직접 검토할 수 있게 했고, 이 기술은 25억 대 이상 활성 기기에서 쓰이는 암호화 기반과 연결된다.

security

라라벨 번역 패키지 태그가 통째로 바뀌었다, 개발자 비밀값 털리는 공급망 공격

전 세계 라라벨 개발자가 쓰는 Laravel-Lang 패키지가 공격을 받아 Git 태그가 악성 버전을 가리키도록 바뀌었다. 5월 22일 약 90분 동안 4개 저장소의 태그가 교체됐고, 감염된 패키지는 AWS 키, GitHub 토큰, Stripe 시크릿, 암호화폐 지갑 복구 구문, SSH 개인키 등을 노렸다.