앤트로픽 '미토스', 27년 묵은 OpenBSD 버그까지 탐지… 위험성 때문에 후속 모델은 '성능 축소'

security 2026-04-19 약 5분

 tags

#anthropic #ai-security #zero-day #vulnerability #dual-use

vote

북마크

앤트로픽 AI 모델 미토스가 오픈BSD 27년 묵은 원격 취약점을 포함한 수천 건의 제로데이를 탐지하면서 AI 보안의 판도를 바꾸고 있다. 해킹 자동화 우려 때문에 앤트로픽은 후속 모델 오퍼스 4.7에서 의도적으로 사이버 보안 기능을 축소했고, 미국 정부도 도입을 재검토 중이다.

1
미토스가 수천 건의 제로데이 취약점 탐지 — 오픈BSD 27년 묵은 원격 다운 버그 포함
2
앤트로픽은 '프로젝트 글래스윙' 출범, 90일 내 취약점 수정 공개 예정
3
후속 모델 오퍼스 4.7은 SWE-벤치 베리파이드 87.6% 등 최고 코딩 성능에도 사이버 보안 기능을 의도적으로 축소
4
앤트로픽은 미토스를 일반 공개 대신 일부 기술·금융 기업에 제한적 우선 제공
5
미국 백악관 OMB가 미토스 도입 재검토 착수, 7월 공개 보고서가 AI 보안 정책 분수령

앤트로픽이 공개한 AI 모델 '미토스'가 사이버 보안의 게임 체인저로 떠오르면서 동시에 판도라 상자 논란을 일으키는 중
- 수천 건의 제로데이 취약점 탐지 — 그 중에는 수십 년간 잠재돼 있던 문제도 포함
- 대표적으로 오픈소스 OS 오픈BSD에서 27년 된 버그를 찾아냄 (원격 접속만으로 시스템 다운 가능한 수준)

보안 혁신의 순기능

기존 보안 시스템이 놓친 취약점을 대규모로 찾아냄 — AI가 '능동적 보안 분석가' 역할을 수행할 수 있음을 시사
앤트로픽은 이 능력을 검증하기 위해 '프로젝트 글래스윙' 출범 (4월 16일)
- 90일 내 학습 내용과 공개 가능한 취약점 수정·개선 사항을 공개 예정

⚠️주의

> 27년 묵은 OpenBSD 원격 시스템 다운 취약점이 AI에게 수시간 만에 발견됐다. 이 능력이 방어자에게만 주어지는 게 아니라는 게 핵심이다.

위험성 논란 — 앤트로픽의 '의도적 성능 축소'

강력한 취약점 탐지 능력이 곧 해킹 자동화 능력이라는 게 업계의 우려
앤트로픽은 후속 모델 오퍼스 4.7에서 의도적으로 사이버 보안 기능을 축소
- SWE-벤치 프로 64.3%, SWE-벤치 베리파이드 87.6% — 코딩 성능은 최고 수준
- 금융 분석 지표 64.4%로 경쟁 모델 앞섬
- 그런데 앤트로픽은 "미토스 미리보기 대비 기능이 일부 제한적"이라고 명시적으로 밝힘
해킹 등 고위험 요청을 자동 탐지·차단하는 안전장치 적용 + 사이버 보안 기능을 훈련 단계에서 줄이는 실험 진행
AI 성능을 일부 희생하더라도 위험성을 통제하려는 '의도적 제약 설계' 사례

국가 안보 이슈로 확산

미국 정부는 한때 앤트로픽 모델 사용 중단을 검토하다가 미토스 등장 후 도입 재검토 국면
- 백악관 관리예산국(OMB) CIO가 각 부처에 "적절한 보안 규정과 안전장치를 마련 중"이라며 신중한 접근 시사 (블룸버그 16일 보도)
각국 정부·금융당국이 긴급회의를 열고 대응 방안 논의
앤트로픽은 미토스를 일반 공개 대신 일부 기술·금융 기업에만 제한적으로 우선 제공
7월에 공개 예정인 미토스 보고서가 AI 보안 정책 기준점이 될 가능성

기술 맥락

제로데이 취약점이 뭐길래 이렇게 큰 이슈가 되는지부터 풀어볼게요. 제로데이는 "패치가 나오기 전에 발견된 취약점"이에요. 공격자 입장에서는 방어 수단이 없는 상태로 뚫을 수 있어서 암시장에서 수십만~수백만 달러에 거래되는 자산이거든요. AI가 수천 건을 한 번에 찾아내면, 이 경제 자체가 무너져요.

오픈BSD 27년 버그 사례가 상징적이에요. 오픈BSD는 보안을 최우선으로 설계한 OS로 유명한데, 인간 보안 전문가들이 27년간 못 찾은 버그를 AI가 찾아냈다는 건 기존 보안 검토 프로세스의 한계를 드러낸 거죠. 퍼저(fuzzer)나 정적 분석기로도 찾기 어려운 논리적 결함을 LLM이 코드 맥락을 이해하면서 잡아내는 패턴이에요.

앤트로픽이 오퍼스 4.7에서 "의도적으로 성능 축소"한 건 AI 안전성 논의에서 중요한 선례예요. 성능이 좋을수록 좋다는 기존 AI 경쟁 프레임에 반대하는 거거든요. 훈련 데이터에서 사이버 보안 관련 내용을 빼거나 RLHF 단계에서 해당 요청을 거부하도록 튜닝하는 식인데, 이게 효과적인지는 또 다른 논쟁거리예요. 오픈소스 모델이 같은 수준에 도달하면 통제가 불가능해지니까요.

미국 정부가 앤트로픽 도입을 재검토한다는 대목도 의미심장해요. 공격용으로도 방어용으로도 쓰일 수 있는 이중용도(dual-use) 기술이라, 규제 프레임 자체를 새로 짜야 하는 상황이거든요. 7월에 나올 미토스 보고서가 분수령으로 꼽히는 이유예요.

공격용으로도 방어용으로도 쓰일 수 있는 이중용도 기술을 기업이 자발적으로 성능 축소한 선례는 AI 안전 규제의 새로운 모델이 될 수 있다. 성능 경쟁 일변도에 제동을 거는 흐름이다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

security 2026-07-13

엘에이 경찰, 사생활 침해 논란 끝에 플록 번호판 감시 계약 종료

엘에이 경찰이 번호판 인식 카메라 업체 플록 세이프티와의 3년 계약을 연장하지 않기로 했어. 시민권, 프라이버시, 데이터 보관과 공유 문제를 해결하지 못했다는 게 핵심 이유야. 플록은 미국 전역에 최소 8만 대 카메라망을 깔아 경찰과 연방기관이 차량을 추적할 수 있게 해왔고, 오탐·보안 사고·이민 단속 악용 의혹까지 겹치며 압박이 커졌어.

security 2026-07-12

크로미움 148부터 Math.tanh 한 번으로 운영체제 지문이 새는 문제

크로미움 148 이후 V8이 Math.tanh 계산을 자체 구현 대신 운영체제의 수학 라이브러리에 맡기면서, 같은 입력값도 리눅스·맥·윈도우에서 마지막 비트가 달라지는 지문 신호가 생겼다. 이 차이는 User-Agent로 맥이라고 주장하면서 리눅스 수학 결과를 내는 식의 위장을 바로 들키게 만든다. CSS 삼각함수와 웹 오디오까지 보면 브라우저 수학 경로가 꽤 복잡하게 갈라지고, 제대로 흉내 내려면 실제 운영체제 라이브러리의 비트 단위 동작까지 맞춰야 한다.

security 2026-07-12

출입통제도 클라우드 구독제로 간다…제로트러스트·AI 분석이 승부처

기업 출입보안이 사업장별 서버를 두는 방식에서 클라우드 기반 서비스형 출입통제(ACaaS)로 옮겨가고 있다. 시장은 2026년 17억8000만 달러에서 2030년 31억9000만 달러로 커질 전망이고, 제로트러스트·모바일 인증·AI 출입 분석·스마트빌딩 통합이 핵심 경쟁 포인트로 꼽힌다.

security 2026-07-12

AWS·구글 클라우드, 양자컴퓨터 대비해 암호 체계 갈아엎는 중

AWS와 구글 클라우드가 양자컴퓨터 시대를 대비해 기존 공개키 암호와 양자내성암호를 함께 쓰는 하이브리드 전환을 시작했다. 핵심 배경은 지금 훔친 암호문을 나중에 양자컴퓨터로 푸는 ‘선수집·후해독’ 공격이고, 국내도 통신·금융·국방 등 5개 분야에 45억원을 투입해 실증에 들어간다.

security 2026-07-12

보안 점검 맡긴 AI 에이전트가 악성코드를 직접 실행할 수 있다는 경고

AI 보안 에이전트가 저장소를 검사하다가 README 같은 문서에 숨은 프롬프트 인젝션에 속아 악성 바이너리를 실행할 수 있다는 연구가 나왔다. 클로드 코드와 코덱스의 자동 모드처럼 승인 없이 명령을 수행하는 구성에서 문제가 재현됐고, 여러 모델과 공급업체를 가로질러 같은 패턴이 통했다는 점이 핵심이다.

앤트로픽 '미토스', 27년 묵은 OpenBSD 버그까지 탐지… 위험성 때문에 후속 모델은 '성능 축소'

요약

핵심 포인트

핵심 개념

분석

보안 혁신의 순기능

위험성 논란 — 앤트로픽의 '의도적 성능 축소'

국가 안보 이슈로 확산

기술 맥락

인사이트

댓글

댓글

앤트로픽 '미토스', 27년 묵은 OpenBSD 버그까지 탐지… 위험성 때문에 후속 모델은 '성능 축소'

요약

핵심 포인트

핵심 개념

분석

보안 혁신의 순기능

위험성 논란 — 앤트로픽의 '의도적 성능 축소'

국가 안보 이슈로 확산

기술 맥락

인사이트

댓글

댓글

관련 기사