본문으로 건너뛰기
피드

앤트로픽 '미토스', 27년 묵은 OpenBSD 버그까지 탐지… 위험성 때문에 후속 모델은 '성능 축소'

security 약 5분
vote
0
댓글
북마크

앤트로픽 AI 모델 미토스가 오픈BSD 27년 묵은 원격 취약점을 포함한 수천 건의 제로데이를 탐지하면서 AI 보안의 판도를 바꾸고 있다. 해킹 자동화 우려 때문에 앤트로픽은 후속 모델 오퍼스 4.7에서 의도적으로 사이버 보안 기능을 축소했고, 미국 정부도 도입을 재검토 중이다.

  • 1

    미토스가 수천 건의 제로데이 취약점 탐지 — 오픈BSD 27년 묵은 원격 다운 버그 포함

  • 2

    앤트로픽은 '프로젝트 글래스윙' 출범, 90일 내 취약점 수정 공개 예정

  • 3

    후속 모델 오퍼스 4.7은 SWE-벤치 베리파이드 87.6% 등 최고 코딩 성능에도 사이버 보안 기능을 의도적으로 축소

  • 4

    앤트로픽은 미토스를 일반 공개 대신 일부 기술·금융 기업에 제한적 우선 제공

  • 5

    미국 백악관 OMB가 미토스 도입 재검토 착수, 7월 공개 보고서가 AI 보안 정책 분수령

  • 앤트로픽이 공개한 AI 모델 '미토스'가 사이버 보안의 게임 체인저로 떠오르면서 동시에 판도라 상자 논란을 일으키는 중
    • 수천 건의 제로데이 취약점 탐지 — 그 중에는 수십 년간 잠재돼 있던 문제도 포함
    • 대표적으로 오픈소스 OS 오픈BSD에서 27년 된 버그를 찾아냄 (원격 접속만으로 시스템 다운 가능한 수준)

보안 혁신의 순기능

  • 기존 보안 시스템이 놓친 취약점을 대규모로 찾아냄 — AI가 '능동적 보안 분석가' 역할을 수행할 수 있음을 시사
  • 앤트로픽은 이 능력을 검증하기 위해 '프로젝트 글래스윙' 출범 (4월 16일)
    • 90일 내 학습 내용과 공개 가능한 취약점 수정·개선 사항을 공개 예정

⚠️주의

> 27년 묵은 OpenBSD 원격 시스템 다운 취약점이 AI에게 수시간 만에 발견됐다. 이 능력이 방어자에게만 주어지는 게 아니라는 게 핵심이다.

위험성 논란 — 앤트로픽의 '의도적 성능 축소'

  • 강력한 취약점 탐지 능력이 곧 해킹 자동화 능력이라는 게 업계의 우려
  • 앤트로픽은 후속 모델 오퍼스 4.7에서 의도적으로 사이버 보안 기능을 축소
    • SWE-벤치 프로 64.3%, SWE-벤치 베리파이드 87.6% — 코딩 성능은 최고 수준
    • 금융 분석 지표 64.4%로 경쟁 모델 앞섬
    • 그런데 앤트로픽은 "미토스 미리보기 대비 기능이 일부 제한적"이라고 명시적으로 밝힘
  • 해킹 등 고위험 요청을 자동 탐지·차단하는 안전장치 적용 + 사이버 보안 기능을 훈련 단계에서 줄이는 실험 진행
  • AI 성능을 일부 희생하더라도 위험성을 통제하려는 '의도적 제약 설계' 사례

국가 안보 이슈로 확산

  • 미국 정부는 한때 앤트로픽 모델 사용 중단을 검토하다가 미토스 등장 후 도입 재검토 국면
    • 백악관 관리예산국(OMB) CIO가 각 부처에 "적절한 보안 규정과 안전장치를 마련 중"이라며 신중한 접근 시사 (블룸버그 16일 보도)
  • 각국 정부·금융당국이 긴급회의를 열고 대응 방안 논의
  • 앤트로픽은 미토스를 일반 공개 대신 일부 기술·금융 기업에만 제한적으로 우선 제공
  • 7월에 공개 예정인 미토스 보고서가 AI 보안 정책 기준점이 될 가능성

기술 맥락

제로데이 취약점이 뭐길래 이렇게 큰 이슈가 되는지부터 풀어볼게요. 제로데이는 "패치가 나오기 전에 발견된 취약점"이에요. 공격자 입장에서는 방어 수단이 없는 상태로 뚫을 수 있어서 암시장에서 수십만~수백만 달러에 거래되는 자산이거든요. AI가 수천 건을 한 번에 찾아내면, 이 경제 자체가 무너져요.

오픈BSD 27년 버그 사례가 상징적이에요. 오픈BSD는 보안을 최우선으로 설계한 OS로 유명한데, 인간 보안 전문가들이 27년간 못 찾은 버그를 AI가 찾아냈다는 건 기존 보안 검토 프로세스의 한계를 드러낸 거죠. 퍼저(fuzzer)나 정적 분석기로도 찾기 어려운 논리적 결함을 LLM이 코드 맥락을 이해하면서 잡아내는 패턴이에요.

앤트로픽이 오퍼스 4.7에서 "의도적으로 성능 축소"한 건 AI 안전성 논의에서 중요한 선례예요. 성능이 좋을수록 좋다는 기존 AI 경쟁 프레임에 반대하는 거거든요. 훈련 데이터에서 사이버 보안 관련 내용을 빼거나 RLHF 단계에서 해당 요청을 거부하도록 튜닝하는 식인데, 이게 효과적인지는 또 다른 논쟁거리예요. 오픈소스 모델이 같은 수준에 도달하면 통제가 불가능해지니까요.

미국 정부가 앤트로픽 도입을 재검토한다는 대목도 의미심장해요. 공격용으로도 방어용으로도 쓰일 수 있는 이중용도(dual-use) 기술이라, 규제 프레임 자체를 새로 짜야 하는 상황이거든요. 7월에 나올 미토스 보고서가 분수령으로 꼽히는 이유예요.

공격용으로도 방어용으로도 쓰일 수 있는 이중용도 기술을 기업이 자발적으로 성능 축소한 선례는 AI 안전 규제의 새로운 모델이 될 수 있다. 성능 경쟁 일변도에 제동을 거는 흐름이다.

댓글

댓글

댓글을 불러오는 중...

security

레드햇 관련 npm 패키지 감염, 미아즈마 웜이 개발자 환경과 클라우드 계정까지 노렸다

레드햇 관련 npm 패키지가 악성코드에 감염돼 개발자 PC, 깃허브 토큰, 클라우드 자격증명, 쿠버네티스 설정, CI/CD 비밀정보까지 노린 사건이 드러났어. 이번 미아즈마 변종은 패키지 설치만으로 실행되고, VS 코드와 클로드 코드 설정까지 건드려 지속성을 확보하려 했다는 점이 특히 위험해.

security

치폴레 상담봇을 코딩 에이전트로 훔쳐 쓴 밈 프로젝트, 치포틀라이 맥스

치포틀라이 맥스는 치폴레의 고객지원 챗봇 페퍼를 오픈코드의 기본 모델처럼 붙인 밈성 프로젝트다. 핵심은 누군가 페퍼의 웹소켓 기반 백엔드를 역공학해 오픈에이아이 호환 프록시를 만들었고, 이를 코딩 에이전트에 연결해 무료 추론처럼 쓰게 했다는 점이다.

security

소셜 미디어 연령 확인이 무료 인터넷의 끝이 될 수 있다는 경고

멀바드는 소셜 미디어 연령 확인이 아이 보호라는 명분으로 전 세계에 퍼지고 있지만, 실제로는 신원 확인 기반 인터넷 통제 인프라가 될 수 있다고 주장한다. 특히 앱스토어, 운영체제, 브라우저, 가상 사설망까지 통제 범위가 넓어지면 익명 표현과 온라인 프라이버시가 크게 훼손될 수 있다는 경고가 핵심이다.

security

애드어프루트, 플럭스 측 법적 경고로 블로그 발행 일시 중단

애드어프루트가 플럭스 측 법률대리인으로부터 명예훼손 가능성과 컴퓨터 사기 및 남용법 위반 주장을 담은 요구서를 받았다고 공개했어. 애드어프루트는 공개된 서버 설정 오류로 노출된 정보만 확인했고, 보안상 공익이 있는 사안을 책임 있는 공개 방식으로 다뤘다는 입장이야.

security

인스타그램 계정 탈취, 이번엔 메타 지원 AI가 문을 열어준 꼴

인스타그램에서 일부 계정이 탈취된 사건의 핵심은 공격자가 사용자명과 대략적인 위치만 맞춘 뒤, 메타 지원 AI에게 본인 소유 이메일로 인증 코드를 보내게 만들었다는 주장임. 이 흐름에서는 2단계 인증도 계정 복구 절차 안에서 우회됐고, 고가의 짧은 핸들을 노린 블랙마켓 거래까지 이어졌다고 해.