앤트로픽 보안 모델 '페이블', 가드레일이 너무 빡세서 연구자들 불만 터짐
앤트로픽이 강력한 사이버보안 모델 Mythos의 공개 제한판인 Fable을 내놨지만, 보안 연구자들은 정상적인 코드 리뷰나 블로그 읽기까지 막힌다고 불만을 내고 있어. 악성코드 제작과 침해 지원을 막겠다는 의도는 이해되지만, 현재 가드레일이 키워드 기반처럼 동작하면서 실무 보안 작업까지 과하게 차단한다는 지적이 나옴.
- 1
Fable은 Mythos 기반의 공개 제한판 모델로, 사이버보안과 생물학 관련 요청에 강한 가드레일이 걸려 있음
- 2
보안 연구자들은 블로그 읽기, 안전한 코드 작성, 코드 리뷰 같은 무해한 작업도 차단된다고 지적함
- 3
가드레일에 걸리면 Fable 대신 Claude Opus 4.8로 폴백되는 구조라, 고성능 보안 모델을 쓰려던 목적이 흐려짐
- 4
앤트로픽은 별도 Cyber Verification Program을 통해 승인된 보안 전문가에게 제한을 줄이는 방식을 운영 중임
AI 보안 모델은 딱 여기서 어려워짐. 공격 자동화를 막아야 하는데, 너무 세게 막으면 정작 방어하는 사람들이 못 쓰는 도구가 돼버림.
관련 기사
티오리, AI 보안 제품 앞세워 국제 보안 인증 2종 확보
티오리가 정보보호 경영시스템 국제 표준 ISO/IEC 27001과 클라우드 보안 표준 ISO/IEC 27017 인증을 획득했다. AI 취약점 진단 플랫폼과 대규모 언어 모델 보안 솔루션의 보안 운영 체계를 글로벌 고객에게 설명할 수 있는 근거를 마련한 셈이다.
엑스게이트, 양자보안과 AI 방화벽으로 공공·국방 보안 시장 정조준
엑스게이트가 기존 VPN·방화벽 사업을 기반으로 양자보안과 AI 차세대 방화벽을 차기 성장축으로 제시했다. 자체 운영체제 기반 제품, 하이브리드 KCMVP 인증, QRNG·PQC 결합 플랫폼, LLM 기반 보안장비 제어가 주요 카드다. 국방·공공처럼 신뢰성과 인증이 중요한 시장을 노리는 전략이 분명하다.
대구대, 오픈소스 보안 분석에서 ‘가짜 안전 판정’ 잡는 AI 에이전트 연구로 수상
대구대 SW중심대학사업단이 학생 오픈소스 프로젝트를 재사용·고도화하는 OSS 업사이클링 체계를 운영하며 AI 에이전트 기반 보안 분석 연구 성과를 냈다. 특히 공개SW 저장소 일부만 분석하고도 전체가 안전한 것처럼 보이는 ‘False-Clean’ 문제를 줄이는 아키텍처가 우수논문상을 받았다.
금융권, 해킹·보이스피싱을 AI로 막겠다고 속도전 들어감
금융위원회와 5대 금융지주가 AI 기반 해킹·보이스피싱 대응 체계를 함께 키우기로 했다. 망분리 규제 완화, 보이스피싱 정보공유·분석 AI 플랫폼 고도화, 이상거래 탐지시스템 반영 같은 실무 조치가 같이 묶였다.
AI로 2분 만에 네이버 판박이 피싱 사이트가 만들어지는 시대
생성형 AI로 네이버 같은 실제 서비스와 거의 구분 안 되는 피싱 사이트를 2분 만에 만들 수 있다는 시연이 나왔다. 누리랩 탐지 기준 지난달 악성 페이지는 85만7870건, 하루 약 3만 건 수준까지 올라왔고, KISA 차단 건수도 2024년에 전년 대비 60.7% 늘었다.
댓글
댓글
댓글을 불러오는 중...