미국 정부 지시로 Anthropic이 Fable 5·Mythos 5 접근을 전면 중단함

ai-ml 2026-06-13 약 7분

 tags

#llm #ai-safety #jailbreak #export-control #anthropic

vote

북마크

미국 정부가 국가안보 권한을 근거로 Anthropic의 Fable 5와 Mythos 5 접근 중단을 지시했고, Anthropic은 모든 고객의 접근을 끊겠다고 밝힘. 정부가 문제 삼은 건 Fable 5의 좁은 범위 탈옥(jailbreak) 가능성인데, Anthropic은 공개 모델들도 할 수 있는 수준의 취약점 탐지라며 반박함.

1
미국 정부 지시는 외국 국적자뿐 아니라 미국 내 외국 국적 Anthropic 직원까지 포함함
2
Anthropic은 규정 준수를 위해 Fable 5와 Mythos 5를 모든 고객에게서 비활성화해야 한다고 설명함
3
정부가 제시한 근거는 넓은 범위의 보편 탈옥이 아니라 특정 코드베이스에서 결함을 찾게 하는 좁은 탈옥 사례로 보임
4
Anthropic은 Fable 5 출시 전 미국 정부, 영국 AISI, 외부 기관, 내부 팀과 수천 시간 레드팀 테스트를 했다고 주장함
5
Anthropic은 이런 기준이 업계 전체에 적용되면 프런티어 모델 배포가 사실상 멈출 수 있다고 경고함

미국 정부가 Anthropic에 Fable 5와 Mythos 5 접근을 중단하라는 지시를 내림
- 근거는 국가안보 권한과 수출통제(export control) 성격의 지시임
- 대상은 미국 밖 외국 국적자뿐 아니라 미국 안에 있는 외국 국적자, 심지어 Anthropic 내부의 외국 국적 직원까지 포함됨
- Anthropic은 이 조건을 맞추려면 결국 모든 고객에게서 Fable 5와 Mythos 5를 꺼야 한다고 설명함
Anthropic은 지시를 받은 시간이 미국 동부시간 오후 5시 21분이었다고 밝힘
- 꽤 갑작스러운 조치였다는 얘기임
- 다른 Anthropic 모델 접근은 영향 없다고 선을 그음
- 문제는 Fable 5와 Mythos 5에 한정됨
정부가 문제 삼은 건 Fable 5의 탈옥(jailbreak) 가능성으로 보임
- Anthropic이 이해한 바로는, 특정 방식으로 Fable 5의 안전장치를 우회할 수 있다는 시연이 있었음
- 그 우회로 찾아낸 건 이미 알려진 소수의 경미한 취약점이었다고 함
- Anthropic은 이 정도 결과는 다른 공개 모델들도 우회 없이 찾아낼 수 있다고 반박함

❗중요

> Anthropic의 핵심 주장은 "보편 탈옥이 발견된 게 아니라 좁은 탈옥 사례 하나가 문제였고, 그 결과물도 다른 모델들이 이미 할 수 있는 수준"이라는 쪽임.

Anthropic은 Fable 5의 안전장치가 업계 기존 모델보다 훨씬 강하다고 주장함
- 출시 전 몇 주 동안 미국 정부, 영국 AISI, 여러 민간 외부 기관, 내부 팀이 수천 시간 레드팀 테스트를 진행했다고 함
- 테스트 결과, 이전에 배포된 어떤 모델보다 안전장치가 실질적으로 효과적이었다는 게 Anthropic의 설명임
- 오히려 사용자들이 "너무 넓게 막는다"고 불평할 정도였다고 함
아직 "보편 탈옥(universal jailbreak)"은 발견되지 않았다는 게 Anthropic의 입장임
- 보편 탈옥은 다양한 사이버 능력을 넓게 풀어버리는 우회 방식임
- Anthropic은 그런 수준의 우회는 아무 테스터도 찾지 못했다고 말함
- 다만 어떤 모델 제공자도 완벽한 탈옥 저항성을 보장하긴 어렵다고 인정함
그래서 Anthropic이 택한 전략은 완벽한 차단이 아니라 방어 심층화(defense in depth)였음
- 비보편 탈옥은 가능한 좁게 만들고, 보편 탈옥은 만들기 아주 비싸게 만드는 방향임
- 여기에 모니터링을 붙여 성공한 공격을 빨리 탐지하고 차단하려 했다고 함
- Fable 고객 데이터 30일 보존 정책도 이 맥락에서 나온 조치라고 설명함
정부가 실제로 준 증거는 아직 구두 설명 수준이었다고 Anthropic은 말함
- 내용은 모델에게 특정 코드베이스를 읽고 소프트웨어 결함을 고치게 하는 방식에 가까웠다고 함
- Anthropic은 이 능력이 OpenAI의 GPT-5.5를 포함한 다른 모델에서도 널리 가능하다고 주장함
- 방어자들이 매일 시스템을 안전하게 지키는 데 쓰는 기능이라는 반박도 붙임

⚠️주의

> Anthropic 말대로라면, "코드 취약점 찾기" 같은 정상적인 보안 보조 기능과 "위험한 사이버 역량" 사이의 경계가 정책적으로 크게 흔들리는 사례가 될 수 있음.

Anthropic은 법적 지시에는 따르지만, 판단 기준에는 동의하지 않는다고 밝힘
- 좁은 잠재 탈옥 하나가 수억 명에게 배포된 상용 모델 회수 사유가 되는 건 과하다는 입장임
- 같은 기준을 업계 전체에 적용하면 모든 프런티어 모델 배포가 사실상 멈출 수 있다고 경고함
- 정부가 위험한 배포를 막을 권한은 필요하지만, 절차는 투명하고 공정하고 기술적 사실에 기반해야 한다고 주장함
고객 입장에서는 기술보다 운영 리스크가 더 크게 보이는 사건임
- 모델 성능이나 가격이 아니라 정부 지시 하나로 접근권이 날아갈 수 있음
- 특히 규제 산업, 보안 제품, 글로벌 SaaS에서 특정 모델에 강하게 묶여 있다면 대체 경로를 고민해야 함
- "프런티어 모델을 쓴다"는 건 이제 API 안정성뿐 아니라 지정학적 리스크까지 포함하는 선택이 됨

기술 맥락

여기서 중요한 선택은 Anthropic이 완벽한 탈옥 방지를 약속하지 않고 방어 심층화 전략을 택했다는 점이에요. 모델 안전장치는 결국 프롬프트, 정책, 필터, 모니터링이 겹쳐진 구조라서 하나로 끝나는 문제가 아니거든요.
정부가 문제 삼은 사례는 특정 코드베이스를 읽고 결함을 찾게 하는 흐름에 가까워 보여요. 이게 위험한 공격 보조인지, 합법적인 방어 자동화인지가 애매한 이유는 같은 기능이 보안팀에게도 매일 필요한 도구이기 때문이에요.
Anthropic이 30일 고객 데이터 보존을 언급한 것도 이 맥락이에요. 탈옥 시도를 사후 분석하고 막으려면 로그가 필요하지만, 고객 입장에서는 데이터 보존이 비용과 신뢰 문제로 바로 이어져요.
개발팀 관점에서는 특정 모델 하나에 제품 핵심 기능을 강하게 묶는 게 점점 위험해지고 있어요. 성능 비교표만 보고 고르는 게 아니라, 접근 중단 가능성, 대체 모델 전환 비용, 로그 보존 정책까지 같이 봐야 하는 상황이에요.

핵심은 모델 안전성 논쟁이 기술 평가를 넘어 수출통제와 배포 중단 같은 정책 집행으로 바로 이어졌다는 점임. 한국 기업도 해외 AI API나 프런티어 모델에 의존한다면, 성능뿐 아니라 접근권이 하루아침에 끊길 수 있다는 운영 리스크를 같이 봐야 함.

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-08-01

엘지, 7500억 파라미터급 케이 엑사원 2.0 오픈소스로 공개

엘지 AI연구원이 7500억 파라미터 규모의 케이 엑사원 2.0을 허깅페이스에 공개했다. 이전 2360억 파라미터 모델보다 3배 이상 커졌고, 장문 이해 평가에서 중국 모델을 크게 앞섰다는 수치가 제시됐다.

ai-ml 2026-08-01

구글 어스 AI 편집 기능, 가짜 위성사진 논란으로 하루 만에 철회

구글이 구글 어스에 AI 이미지 생성 도구 나노 바나나 2를 붙였다가 허위정보 악용 우려로 24시간도 안 돼 기능을 롤백했어. 실제 지형과 건물 위에 전쟁, 폭발, 군사시설 같은 가짜 장면을 그럴듯하게 만들 수 있다는 점이 OSINT 전문가들의 강한 반발을 불렀어.

ai-ml 2026-08-01

국가가 AI 경쟁을 이유로 개인정보 원칙을 흔들 때 생기는 문제

이 글은 소셜미디어의 개인정보 제공, 기업의 데이터 수집, 국가 주도의 AI 정책을 하나의 흐름으로 묶어 비판한다. 특히 피지컬 인공지능 특별법안처럼 영상·음성 정보를 정보주체 동의 없이 수집할 수 있게 하는 특례가 개인의 존엄과 자기결정권을 AI 경쟁력보다 뒤로 미루는 신호라고 본다.

ai-ml 2026-07-31

오픈AI, 멀티 에이전트 모델 ‘아스트라’ 비공개 시연했다는 보도 나옴

오픈AI가 차세대 모델 라인업으로 알려진 ‘아스트라’를 미국 정책 입안자와 규제 당국자에게 비공개 시연했다는 보도임. 핵심은 여러 AI 에이전트가 오래 상호작용하며 복잡한 프로젝트나 고급 수학 문제를 단계적으로 푸는 멀티 에이전트 협업 능력임.

ai-ml 2026-08-01

한국, AI 허브 되겠다고 미국 빅테크와 남미 광물 공급망을 한 번에 묶음

이재명 대통령 순방 성과 브리핑의 핵심은 한국을 메모리 반도체 공급국을 넘어 글로벌 AI 공급망의 중심축으로 만들겠다는 구상임. 미국에서는 AI 빅테크와 벤처캐피털을 만나고, 브라질·칠레·아르헨티나에서는 희토류·리튬·구리 같은 핵심광물 협력 채널을 열었다는 내용임.

미국 정부 지시로 Anthropic이 Fable 5·Mythos 5 접근을 전면 중단함

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

미국 정부 지시로 Anthropic이 Fable 5·Mythos 5 접근을 전면 중단함

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사