본문으로 건너뛰기
피드

미국 정부 지시로 Anthropic이 Fable 5·Mythos 5 접근을 전면 중단함

ai-ml 약 7분
vote
0
댓글
북마크

미국 정부가 국가안보 권한을 근거로 Anthropic의 Fable 5와 Mythos 5 접근 중단을 지시했고, Anthropic은 모든 고객의 접근을 끊겠다고 밝힘. 정부가 문제 삼은 건 Fable 5의 좁은 범위 탈옥(jailbreak) 가능성인데, Anthropic은 공개 모델들도 할 수 있는 수준의 취약점 탐지라며 반박함.

  • 1

    미국 정부 지시는 외국 국적자뿐 아니라 미국 내 외국 국적 Anthropic 직원까지 포함함

  • 2

    Anthropic은 규정 준수를 위해 Fable 5와 Mythos 5를 모든 고객에게서 비활성화해야 한다고 설명함

  • 3

    정부가 제시한 근거는 넓은 범위의 보편 탈옥이 아니라 특정 코드베이스에서 결함을 찾게 하는 좁은 탈옥 사례로 보임

  • 4

    Anthropic은 Fable 5 출시 전 미국 정부, 영국 AISI, 외부 기관, 내부 팀과 수천 시간 레드팀 테스트를 했다고 주장함

  • 5

    Anthropic은 이런 기준이 업계 전체에 적용되면 프런티어 모델 배포가 사실상 멈출 수 있다고 경고함

  • 미국 정부가 Anthropic에 Fable 5와 Mythos 5 접근을 중단하라는 지시를 내림

    • 근거는 국가안보 권한과 수출통제(export control) 성격의 지시임
    • 대상은 미국 밖 외국 국적자뿐 아니라 미국 안에 있는 외국 국적자, 심지어 Anthropic 내부의 외국 국적 직원까지 포함됨
    • Anthropic은 이 조건을 맞추려면 결국 모든 고객에게서 Fable 5와 Mythos 5를 꺼야 한다고 설명함
  • Anthropic은 지시를 받은 시간이 미국 동부시간 오후 5시 21분이었다고 밝힘

    • 꽤 갑작스러운 조치였다는 얘기임
    • 다른 Anthropic 모델 접근은 영향 없다고 선을 그음
    • 문제는 Fable 5와 Mythos 5에 한정됨
  • 정부가 문제 삼은 건 Fable 5의 탈옥(jailbreak) 가능성으로 보임

    • Anthropic이 이해한 바로는, 특정 방식으로 Fable 5의 안전장치를 우회할 수 있다는 시연이 있었음
    • 그 우회로 찾아낸 건 이미 알려진 소수의 경미한 취약점이었다고 함
    • Anthropic은 이 정도 결과는 다른 공개 모델들도 우회 없이 찾아낼 수 있다고 반박함

중요

> Anthropic의 핵심 주장은 "보편 탈옥이 발견된 게 아니라 좁은 탈옥 사례 하나가 문제였고, 그 결과물도 다른 모델들이 이미 할 수 있는 수준"이라는 쪽임.

  • Anthropic은 Fable 5의 안전장치가 업계 기존 모델보다 훨씬 강하다고 주장함

    • 출시 전 몇 주 동안 미국 정부, 영국 AISI, 여러 민간 외부 기관, 내부 팀이 수천 시간 레드팀 테스트를 진행했다고 함
    • 테스트 결과, 이전에 배포된 어떤 모델보다 안전장치가 실질적으로 효과적이었다는 게 Anthropic의 설명임
    • 오히려 사용자들이 "너무 넓게 막는다"고 불평할 정도였다고 함
  • 아직 "보편 탈옥(universal jailbreak)"은 발견되지 않았다는 게 Anthropic의 입장임

    • 보편 탈옥은 다양한 사이버 능력을 넓게 풀어버리는 우회 방식임
    • Anthropic은 그런 수준의 우회는 아무 테스터도 찾지 못했다고 말함
    • 다만 어떤 모델 제공자도 완벽한 탈옥 저항성을 보장하긴 어렵다고 인정함
  • 그래서 Anthropic이 택한 전략은 완벽한 차단이 아니라 방어 심층화(defense in depth)였음

    • 비보편 탈옥은 가능한 좁게 만들고, 보편 탈옥은 만들기 아주 비싸게 만드는 방향임
    • 여기에 모니터링을 붙여 성공한 공격을 빨리 탐지하고 차단하려 했다고 함
    • Fable 고객 데이터 30일 보존 정책도 이 맥락에서 나온 조치라고 설명함
  • 정부가 실제로 준 증거는 아직 구두 설명 수준이었다고 Anthropic은 말함

    • 내용은 모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 고치게 하는 방식에 가까웠다고 함
    • Anthropic은 이 능력이 OpenAI의 GPT-5.5를 포함한 다른 모델에서도 널리 가능하다고 주장함
    • 방어자들이 매일 시스템을 안전하게 지키는 데 쓰는 기능이라는 반박도 붙임

⚠️주의

> Anthropic 말대로라면, "코드 취약점 찾기" 같은 정상적인 보안 보조 기능과 "위험한 사이버 역량" 사이의 경계가 정책적으로 크게 흔들리는 사례가 될 수 있음.

  • Anthropic은 법적 지시에는 따르지만, 판단 기준에는 동의하지 않는다고 밝힘

    • 좁은 잠재 탈옥 하나가 수억 명에게 배포된 상용 모델 회수 사유가 되는 건 과하다는 입장임
    • 같은 기준을 업계 전체에 적용하면 모든 프런티어 모델 배포가 사실상 멈출 수 있다고 경고함
    • 정부가 위험한 배포를 막을 권한은 필요하지만, 절차는 투명하고 공정하고 기술적 사실에 기반해야 한다고 주장함
  • 고객 입장에서는 기술보다 운영 리스크가 더 크게 보이는 사건임

    • 모델 성능이나 가격이 아니라 정부 지시 하나로 접근권이 날아갈 수 있음
    • 특히 규제 산업, 보안 제품, 글로벌 SaaS에서 특정 모델에 강하게 묶여 있다면 대체 경로를 고민해야 함
    • "프런티어 모델을 쓴다"는 건 이제 API 안정성뿐 아니라 지정학적 리스크까지 포함하는 선택이 됨

기술 맥락

  • 여기서 중요한 선택은 Anthropic이 완벽한 탈옥 방지를 약속하지 않고 방어 심층화 전략을 택했다는 점이에요. 모델 안전장치는 결국 프롬프트, 정책, 필터, 모니터링이 겹쳐진 구조라서 하나로 끝나는 문제가 아니거든요.

  • 정부가 문제 삼은 사례는 특정 코드베이스를 읽고 결함을 찾게 하는 흐름에 가까워 보여요. 이게 위험한 공격 보조인지, 합법적인 방어 자동화인지가 애매한 이유는 같은 기능이 보안팀에게도 매일 필요한 도구이기 때문이에요.

  • Anthropic이 30일 고객 데이터 보존을 언급한 것도 이 맥락이에요. 탈옥 시도를 사후 분석하고 막으려면 로그가 필요하지만, 고객 입장에서는 데이터 보존이 비용과 신뢰 문제로 바로 이어져요.

  • 개발팀 관점에서는 특정 모델 하나에 제품 핵심 기능을 강하게 묶는 게 점점 위험해지고 있어요. 성능 비교표만 보고 고르는 게 아니라, 접근 중단 가능성, 대체 모델 전환 비용, 로그 보존 정책까지 같이 봐야 하는 상황이에요.

핵심은 모델 안전성 논쟁이 기술 평가를 넘어 수출통제와 배포 중단 같은 정책 집행으로 바로 이어졌다는 점임. 한국 기업도 해외 AI API나 프런티어 모델에 의존한다면, 성능뿐 아니라 접근권이 하루아침에 끊길 수 있다는 운영 리스크를 같이 봐야 함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

건설업계도 피지컬 AI 실험 중, 관건은 로봇보다 현장 데이터다

국내 건설사들이 인공지능(AI)과 로보틱스를 건설 현장에 적용하려는 실험을 늘리고 있다. GS건설은 로봇을 활용한 자재 운반·반복 작업 자동화를 검토하고, 현대건설은 AI 카메라 기반 안전 기술을 도입하려는 중이다. 다만 실제 안착까지는 사람과 AI의 협업 방식, 현장 작업자의 데이터 활용 체계 같은 숙제가 남아 있다.

ai-ml

AI 모델 접속도 수출통제 대상이 되면 벌어지는 일

앤트로픽이 미국 정부 수출통제 지침에 따라 최신 AI 모델 접근을 출시 사흘 만에 차단했다는 사례를 통해, 클라우드 AI 모델 접근권이 국가 안보와 산업정책에 종속될 수 있다는 문제가 드러났다. 데이터 주권만으로는 부족하고, 모델 능력과 연산 접근권까지 포함한 소버린 AI 전략이 필요하다는 논점이다.

ai-ml

건설 현장에 AI 로봇이 들어오려면 아직 데이터와 협업 방식이 숙제

GS건설, 현대건설, 삼성물산 등 국내 건설사가 AI와 로봇 기술을 현장 자동화와 안전관리, 단지 서비스에 적용하려는 움직임을 보이고 있다. 다만 사람과 로봇이 함께 일하는 방식, 실증 사례 축적, 현장 작업자의 데이터 활용 체계가 갖춰져야 실제 확산이 가능하다는 지적이 나온다.

ai-ml

라벨링 1천 장을 100장으로 줄인다는 슈퍼브에이아이의 비전 AI 플랫폼

슈퍼브에이아이가 2026 스마트테크 코리아에서 데이터 구축부터 모델 개발, 운영까지 묶은 슈퍼브 플랫폼을 공개했다. 비전 파운데이션 모델로 라벨링 부담을 줄이고, 대규모 언어 모델과 비디오 언어 모델을 결합해 텍스트 명령만으로 CCTV 속 위험 상황을 찾는 기능까지 제시했다.

ai-ml

프롬프트만으로 게임 만드는 시대, 진짜 어디까지 왔나

AI가 이미지·영상·코드 생성을 넘어, 탐험 가능한 3D 세계와 게임 프로토타입까지 만들기 시작했다. 구글 딥마인드의 프로젝트 지니부터 오버데어, 버스에잇, 바르코까지 사례는 늘고 있지만, 물리 오류·레이턴시·최적화·조작감 같은 완성도 문제는 아직 사람 몫으로 남아 있다.