GPT-5.5와 클로드 미토스, 20시간짜리 해킹 시나리오를 스스로 끝까지 수행
영국 AI안전연구소 보고서에 따르면 클로드 미토스 프리뷰와 GPT-5.5가 숙련 보안 전문가에게 20시간 걸릴 만한 기업 네트워크 해킹 시나리오를 자율적으로 완수했다. 단일 모델의 우연한 성과가 아니라 프론티어 AI 전반이 사이버 작전 수행 능력의 새 임계점을 넘고 있다는 신호로 읽힌다.
- 1
GPT-5.5는 고난도 사이버 작업의 엑스퍼트급 문제에서 약 71%, 클로드 미토스 프리뷰는 약 68% 성공률을 기록함
- 2
기업 네트워크 해킹 시나리오에서는 클로드 미토스가 10번 중 3번, GPT-5.5가 10번 중 2번 성공함
- 3
정보 수집, 권한 탈취, 내부 이동, 데이터 유출까지 32단계 연속 공격을 모델이 스스로 설계하고 실행함
- 4
전문가들이 단 6시간 만에 GPT-5.5의 사이버 안전장치를 우회하는 유니버설 탈옥 방법을 찾아냈다는 점이 특히 위험함
이제 보안팀이 봐야 할 건 ‘AI가 취약점 하나를 찾을 수 있나’가 아니라 ‘목표만 주면 공격 흐름 전체를 운영할 수 있나’임. 공격자와 방어자 모두 같은 급의 AI를 쓰게 되면, 보안 운영의 속도전이 훨씬 거칠어질 가능성이 큼.
관련 기사
AI 보안은 사람 속도로 못 막는다, 이제 기계 속도로 대응해야 한다
이 글은 클로드 미토스가 보여준 자율형 AI 공격 가능성을 계기로 기존 보안 전제가 흔들리고 있다고 주장한다. 알려진 패턴 탐지, 전문가 판단, 느려도 따라잡는 대응이라는 세 가지 믿음이 AI 공격 속도 앞에서 더 이상 충분하지 않다는 논지다.
금융권 AI 가이드라인, ‘미토스 쇼크’ 때문에 보안 파트 다시 뜯어보는 중
국내 금융권 통합 AI 가이드라인 발표가 앤트로픽의 보안 특화 AI 모델 ‘클로드 미토스 프리뷰’ 공개 이후 늦어지고 있다. 금융당국과 신용정보원은 AI 개발·운영·보안 지침을 하나로 묶으려 했지만, AI가 직접 취약점을 찾고 침투 경로까지 설계할 수 있다는 우려 때문에 보안 기준을 다시 점검하는 분위기다.
알파벳 투자자들, 정부 감시에 쓰이는 클라우드·AI 통제 공개하라고 압박
알파벳 주요 투자자들이 회사의 클라우드와 AI 기술이 정부 감시나 군사적 목적에 활용될 때 어떤 통제 장치가 있는지 설명하라고 요구했다. 42개 기관과 14명의 개인 투자자가 참여했고, 이들의 운용 자산은 1조1500억 달러 규모다.
메타, 직원 PC 로그로 AI 학습 논란…저커버그 해명이 더 묘하다
메타가 미국 직원들의 업무용 컴퓨터에 추적 소프트웨어를 설치해 마우스 움직임, 클릭, 키 입력 등을 수집했다는 의혹이 제기됐다. 저커버그는 ‘똑똑한 직원들이 일하는 모습을 AI가 배워야 한다’는 취지로 설명했지만, 수집 범위와 민감 정보 제외 기준은 명확히 공개되지 않았다.
시스코, 외부 AI 모델 출처 검증하는 오픈소스 툴 공개
시스코가 허깅페이스 같은 저장소에서 가져온 서드파티 AI 모델의 출처와 계보를 검증하는 오픈소스 도구를 공개했다. 모델 메타데이터와 가중치 수준 신호를 분석해 지문을 만들고, 비교·스캔 모드로 모델의 공통 계보를 추적하는 방식이다.
댓글
댓글
댓글을 불러오는 중...