본문으로 건너뛰기
피드

앤트로픽, Mythos급 모델은 제로 보존 고객도 30일 데이터 보관 요구

ai-ml 약 6분
vote
0
댓글
북마크

앤트로픽이 Mythos급 모델을 책임 있게 배포한다는 이유로 프롬프트와 출력물을 30일 동안 보관하겠다고 발표했어. 특히 기존에 제로 데이터 보존(ZDR)을 쓰던 기업 고객도 Mythos와 Fable 같은 고위험 능력 모델을 쓰려면 보관 설정을 켜야 해서, 보안과 프라이버시 사이의 긴장이 커질 수 있음.

  • 1

    Mythos급 모델의 프롬프트와 출력은 모든 제공 플랫폼에서 30일간 보관됨

  • 2

    소비자 플랜은 이미 안전 목적 보관이 적용돼 있어 이번 변경의 핵심 대상이 아님

  • 3

    영향을 받는 쪽은 Claude Console, Claude Enterprise, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry에서 ZDR을 쓰던 조직임

  • 4

    앤트로픽은 대량 변형 프롬프트를 보내는 Best-of-N 탈옥이나 국가 단위 악용 패턴을 잡으려면 요청 단위가 아니라 여러 요청을 묶어 봐야 한다고 설명함

  • 앤트로픽이 Mythos급 모델에 대해 30일 데이터 보관 정책을 도입함

    • 대상은 Mythos급 모델과 앞으로 비슷한 능력을 가진 모델로 지정되는 모델들임
    • 프롬프트와 모델 출력이 신뢰·안전 목적의 검토를 위해 30일 동안 보관됨
    • 정책은 2026년 6월 9일부터 적용됨
  • 이번 변경의 핵심 대상은 일반 개인 사용자가 아니라 ZDR을 쓰던 기업 고객임

    • Claude Free, Pro, Max 같은 소비자 플랜은 이미 안전 목적 보관이 적용돼 있어서 이번 업데이트로 바뀌는 게 없음
    • 영향을 받는 쪽은 Claude Console의 ZDR 워크스페이스, Claude Enterprise의 ZDR 기반 Claude Code, AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry에서 ZDR로 Claude를 쓰던 조직임
    • 다른 모델들은 기존 약관과 데이터 처리 방식이 그대로 유지됨

중요

> ZDR을 쓰던 조직도 Mythos급 모델을 쓰려면 30일 보관을 받아들여야 함. 고성능 보안 모델 접근권과 데이터 비보관 원칙을 동시에 가져가기는 어려워진 셈임.

  • 앤트로픽이 내세우는 이유는 고성능 모델의 이중용도 위험임

    • Claude Mythos 5는 선의와 악의 양쪽에 모두 쓸 수 있는 능력이 크게 올라간 모델로 설명됨
    • Claude Fable 5는 같은 기반 모델을 공유하지만, 사이버와 생물학 영역에 추가 안전장치가 붙어 있음
    • 이런 모델이 악용되는 패턴을 보려면 단일 요청만 보는 게 아니라 여러 요청을 묶어서 봐야 한다는 논리임
  • 특히 Best-of-N 탈옥 같은 공격은 보관 없이는 잡기 어렵다고 함

    • 공격자가 수백 개의 살짝 다른 프롬프트를 보내고 그중 하나가 통과하길 노리는 방식임
    • 국가 후원 스파이 활동이나 데이터 갈취 캠페인도 개별 요청만 보면 잘 안 드러남
    • 그래서 앤트로픽은 프롬프트와 출력을 임시 보관해야 더 큰 악용 패턴을 분석할 수 있다고 주장함
  • 데이터 접근 통제는 꽤 강하게 설계했다고 설명함

    • 앤트로픽 직원은 심각한 위해 가능성이 표시되거나 고객이 서면 요청한 경우가 아니면 대화에 접근할 수 없음
    • 승인된 소수 리뷰어만 전용 도구로 볼 수 있고, 내보내기·복사·다운로드는 막힘
    • 모든 접근은 리뷰어가 지우거나 바꿀 수 없는 조작 방지 로그에 기록됨
    • 30일 뒤에는 자동 삭제되지만, 안전 조사나 법적 보존 의무가 있는 예외는 남을 수 있음
  • 클라우드별 설정 방식은 꽤 갈림

    • Anthropic API 직접 사용자는 개발자 콘솔의 워크스페이스 개인정보 설정에서 보관을 켜야 함
    • AWS Bedrock에서는 보관을 켜야 새 커버드 모델에 접근할 수 있고, 보관 데이터는 AWS 안에 남음
    • Google Cloud Agent Platform도 비슷하게 GCP 환경 안에 보관 데이터가 남음
    • Azure Foundry는 Azure Subscription 단위로 보관이 설정되며, ZDR 구성이 있다면 별도 Subscription을 만들어야 할 수 있음
  • Claude Code를 쓰는 팀도 실행 경로에 따라 영향이 달라짐

    • Anthropic API 기반 Claude Code는 해당 워크스페이스의 보관 설정을 따름
    • Bedrock이나 Google Cloud Agent Platform 기반이면 클라우드 자격증명과 환경의 보관 설정을 따름
    • Claude Enterprise with ZDR은 관리 콘솔에서 Primary Owner가 직접 보관 설정을 바꿀 수 있는 컨트롤이 제공될 예정임

기술 맥락

  • 이번 정책의 핵심은 모델 성능이 올라갈수록 안전 모니터링도 요청 단위가 아니라 세션과 조직 단위로 봐야 한다는 판단이에요. Mythos급 모델은 보안 분석에도 강하지만, 같은 능력이 공격 자동화에도 쓰일 수 있거든요.

  • ZDR을 포기하라는 말이 민감한 이유는 기업 고객이 AI 도입 때 가장 먼저 보는 게 코드와 내부 데이터의 보관 여부이기 때문이에요. 특히 금융, 보안, 대기업 개발 조직은 프롬프트가 저장된다는 사실만으로도 승인 절차가 길어질 수 있어요.

  • 앤트로픽은 대신 접근 통제, 조작 방지 로그, 고객 관리 암호화 키 같은 보완책을 제시해요. 완전한 비보관은 아니지만, 누가 언제 봤는지 추적하고 데이터 유출면을 줄이려는 방식이에요.

  • 클라우드별로 데이터가 머무는 위치가 다르게 설계된 것도 중요해요. Bedrock은 AWS에, Google Cloud Agent Platform은 GCP 환경에 보관된다고 하니, 조직 입장에서는 모델 선택뿐 아니라 어느 클라우드 경로로 붙을지도 같이 결정해야 해요.

기업용 AI에서 ZDR은 강한 구매 포인트였는데, 고성능 위험 모델로 갈수록 그 약속이 조건부가 되고 있음. 앞으로 보안 특화 모델을 쓰는 조직은 모델 성능만이 아니라 데이터 보관 정책까지 아키텍처 결정에 넣어야 함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

KT, 경기권 스타트업에 AI·클라우드 전환 전략 공유

KT가 경기권 스타트업을 대상으로 AI와 클라우드를 활용한 AX 전환 전략을 공유했다. AWS, 데이터브릭스, KT클라우드와 함께 AI 에이전트, 데이터 기반 의사결정, 클라우드 전환 사례를 소개하며 스타트업이 실제 업무에 적용할 수 있는 방향을 제시했다.

ai-ml

네이버클라우드, 국방 AI에 ‘옴니모달·엣지 데이터센터’ 카드 꺼냈다

네이버클라우드가 국방 AI를 실제 작전 환경에 적용하기 위한 전략을 공개했다. 핵심은 텍스트·음성·영상·지도 데이터를 한 작전 상황으로 묶는 옴니모달 AI, 중앙·엣지 데이터센터, 온톨로지 기반 지식체계, 현장 엔지니어 전진 배치다. 해외의 합동 지휘통제 사례까지 끌어오며 국방 AI가 단순 자동화가 아니라 미래 지휘통제 경쟁력이라는 메시지를 던졌다.

ai-ml

네이버클라우드, 국방 AI 시장에 풀스택으로 들어가려는 그림

네이버클라우드가 국방 인공지능 전환 시장을 겨냥해 옴니모달 AI, 국방 전용 AI 데이터센터, 전장 엣지, 현장 파견 엔지니어 체계를 묶은 전략을 공개했다. 단순 모델 납품이 아니라 폐쇄망 클라우드와 작전 체계 연동까지 포함한 국방 AI 인프라 포지셔닝에 가깝다.

ai-ml

네이버클라우드, 국방 AI 전담팀 꾸리고 ‘소버린 AI’로 합참 AX 겨냥

네이버클라우드가 국방 AX 전담 조직을 만들고 소버린 AI 기반 국방 인프라 전략을 공개했다. 하이퍼클로바X 옴니모달, 구축형 클라우드, 온톨로지 기반 지식체계, 현장 배치형 개발자를 묶어 군사 데이터를 통합 분석하는 풀스택 전략을 내세웠다. 합참의 K-JADC2 추진 흐름과 맞물려 국내 클라우드·AI 기업들의 국방 시장 경쟁이 본격화되는 분위기다.

ai-ml

AI 학습데이터도 성분표가 필요해졌다, LG AI연구원이 말한 ‘AI-BOM’

LG AI연구원은 생성형 AI 저작권·데이터 공급망 리스크에 대응하려면 AI 모델이 어떤 데이터, 모델, 소프트웨어, 라이선스, 보안 요소로 만들어졌는지 추적하는 AI-BOM이 필요하다고 설명했다. 자체 분석에서는 상업적으로 이용 가능해 보이는 2852개 데이터셋 중 종속 데이터 리스크까지 고려하면 실제 사용 가능한 데이터셋이 605개, 약 21.21%에 그쳤다. 오픈소스 코드 기준의 라이선스 판단을 AI 학습데이터에 그대로 적용하면 큰 오판이 날 수 있다는 얘기다.