앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회

ai-ml 2026-06-09 약 9분

 tags

#claude #llm #ai-safety #cybersecurity #bioinformatics

vote

북마크

앤트로픽이 일반 사용자용 최상위 모델 Claude Fable 5와 제한 접근용 Claude Mythos 5를 공개했다. 두 모델은 같은 기반 모델이지만, Fable 5는 사이버보안·생물학·화학·모델 증류 관련 위험 요청을 감지하면 Claude Opus 4.8로 자동 우회하는 안전장치를 붙였다. 코딩, 장기 작업, 비전, 생명과학 연구에서 큰 성능 향상을 주장하지만, 30일 데이터 보관 정책과 보수적인 차단 정책도 같이 따라온다.

1
Fable 5와 Mythos 5는 같은 기반 모델이며, Fable 5는 일반 공개용 안전장치가 붙은 버전이다.
2
Stripe는 5천만 줄 Ruby 코드베이스 마이그레이션을 하루 만에 처리했다고 초기 테스트 사례를 공개했다.
3
위험 요청 감지 시 응답을 Opus 4.8로 넘기며, 평균 5% 미만 세션에서 fallback이 발생한다고 밝혔다.
4
Mythos 5는 Project Glasswing을 통해 일부 사이버 방어 조직과 인프라 제공자에게 제한 제공된다.
5
가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 책정됐다.

앤트로픽이 Claude Fable 5와 Claude Mythos 5를 같이 공개함. 이름은 둘인데, 실은 같은 기반 모델을 두 가지 접근 정책으로 나눈 구조임
- Fable 5는 일반 사용자용이고, 안전장치가 붙어 있음
- Mythos 5는 같은 모델에서 일부 안전장치를 푼 버전이고, 초기에는 Project Glasswing의 사이버 방어 파트너와 인프라 제공자에게만 제공됨
- 앤트로픽 설명으로는 Mythos급 모델은 기존 Opus급보다 위에 있는 새 성능 계층임
Fable 5의 메시지는 꽤 노골적임. “이제 모델이 너무 세져서 그냥 풀 수는 없다”는 쪽임
- 사이버보안, 생물학·화학, 모델 증류 관련 요청이 감지되면 Fable 5가 직접 답하지 않고 Claude Opus 4.8이 대신 응답함
- 사용자는 fallback이 발생했다는 사실을 안내받게 됨
- 앤트로픽은 이 fallback이 평균적으로 세션의 5% 미만에서 발생한다고 주장함
- 반대로 말하면, 보안 연구나 바이오 쪽에서 일하는 개발자는 정상 요청도 걸릴 가능성을 감수해야 함

❗중요

> Fable 5와 Mythos 5의 차이는 모델 능력이 아니라 접근 정책임. 같은 기반 모델인데, Fable 5는 위험 도메인에서 Opus 4.8로 우회하고 Mythos 5는 신뢰된 사용자에게 일부 제한을 풀어주는 식임

코딩 성능 쪽 사례는 개발자들이 제일 눈여겨볼 만함
- Stripe는 5천만 줄 Ruby 코드베이스에서 수작업이면 팀 전체가 2개월 넘게 걸릴 마이그레이션을 Fable 5가 하루 만에 처리했다고 밝힘
- Cognition의 FrontierCode 평가에서는 프로덕션 코드베이스 기준의 어려운 코딩 작업에서 프론티어 모델 중 최고 점수를 냈다고 함
- CursorBench, GitHub, Vercel, Replit 같은 초기 테스트 파트너들도 “긴 호흡의 코딩 작업”과 “에이전트형 프로토타이핑”에서 이전 Claude보다 확실히 낫다고 평가함
성능 향상은 코딩에만 걸려 있지 않음. 앤트로픽은 지식 작업, 비전, 장기 기억, 과학 연구를 전부 전면에 세움
- Hebbia의 금융 벤치마크에서는 문서 기반 추론, 차트·표 해석, 문제 해결에서 최고 점수를 냈다고 함
- 비전 작업에서는 과학 도표에서 정확한 숫자를 뽑고, 스크린샷만 보고 웹앱 소스코드를 재구성하는 사례를 들었음
- Pokémon FireRed를 최소한의 vision-only harness만으로 클리어했다는 예시도 붙어 있음. 벤치마크보다 이런 사례가 더 직관적으로 세게 다가오는 편임
장기 작업과 memory 쪽도 꽤 강조됨
- Fable 5는 수백만 토큰 규모의 긴 작업에서도 집중력을 유지한다고 설명됨
- Slay the Spire 실험에서는 파일 기반 persistent memory를 줬을 때 Opus 4.8보다 성능 개선폭이 3배 컸고, 최종 act에 도달한 비율도 3배 높았다고 함
- 에이전트가 자기 노트를 남기고 다음 판단에 반영하는 형태가 점점 실제 제품 기능으로 굳어지는 분위기임
Mythos 5의 생명과학 사례는 기대와 불안을 같이 부름
- 내부 단백질 설계 전문가들은 Mythos 5로 약물 설계 일부를 약 10배 빠르게 했다고 함
- 14개 단백질 타깃 중 9개에서 강한 후보가 나왔고, 현재 추가 조사 중이라고 밝힘
- 분자생물학 가설 비교에서는 과학자들이 Mythos 5의 가설을 Opus급 모델보다 약 80% 더 선호했다고 함
- 유전체 연구에서는 138종 동물의 수백만 개 단일세포 데이터를 모아 커스텀 ML 모델을 설계·훈련했고, Science에 실린 최근 모델보다 100배 작으면서도 더 좋은 성능을 냈다고 주장함
안전장치 설계는 별도 classifier를 앞단에 두는 방식임
- Fable 5 자체가 위험 요청에 답하기 전에, 별도 AI 시스템이 misuse나 jailbreak 시도를 감지함
- 감지 대상은 크게 사이버 공격, 생물학·화학, 모델 증류임
- 사이버 영역에서는 exploit 개발뿐 아니라 정찰, 발견, lateral movement 같은 agentic hacking 단계까지 넓게 잡음
- 외부 bug bounty 1,000시간 이상에서 universal jailbreak가 나오지 않았다고 하지만, UK AISI는 짧은 테스트 창에서 일부 진전을 보였다고 함

⚠️주의

> Fable 5부터 Mythos급 모델 트래픽은 30일 보관이 요구됨. 앤트로픽은 학습에는 쓰지 않고 안전 목적에만 쓴다고 하지만, 기업 고객은 데이터 보관 정책을 계약·보안 리뷰에서 다시 봐야 함

가격은 프론티어 모델치고 공격적으로 잡았다고 보는 게 맞음
- 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러임
- Claude Mythos Preview보다 절반 이하 가격이라고 설명함
- 개발자는 Claude API에서 claude-fable-5로 사용할 수 있음
구독 플랜 제공 방식은 좀 복잡함. 수요를 감당하기 어렵다는 뉘앙스가 강함
- 6월 22일까지는 Pro, Max, Team, seat-based Enterprise 플랜에 Fable 5가 추가 비용 없이 포함됨
- 6월 23일부터는 해당 플랜에서 빠지고, 이후 사용하려면 usage credit이 필요함
- 용량이 충분해지면 다시 구독 플랜 기본 구성으로 복귀시키겠다는 계획임
개발자 입장에서 핵심 질문은 “성능이 얼마나 좋냐”보다 “내 작업이 fallback에 걸리냐”일 가능성이 큼
- 일반 앱 개발, 리팩터링, 문서 분석, UI 프로토타이핑은 Fable 5의 수혜를 바로 볼 수 있음
- 보안 자동화, 취약점 분석, 바이오·화학 연구 자동화는 Opus 4.8 fallback이나 trusted access 정책에 걸릴 수 있음
- 즉, Fable 5는 더 똑똑한 범용 모델이라기보다 “위험한 영역은 우회시키는 초고성능 모델”에 가까움

기술 맥락

Fable 5의 가장 중요한 선택은 모델을 약하게 만드는 게 아니라, 위험 요청에서 더 낮은 계층의 모델로 우회시키는 방식이에요. 완전 거절보다 사용자 경험은 낫고, 동시에 Mythos급 능력이 공격 자동화에 바로 쓰이는 경로를 줄이려는 거죠.
classifier를 별도 시스템으로 둔 이유는 메인 모델 하나에 모든 정책 판단을 맡기기 어렵기 때문이에요. 특히 jailbreak는 사용자가 여러 턴에 걸쳐 우회할 수 있어서, 프롬프트 내용뿐 아니라 세션 패턴까지 보는 안전 레이어가 필요해요.
30일 데이터 보관 정책은 기술적으로는 새 공격과 false positive를 잡기 위한 관측 장치예요. 다만 기업 고객에게는 모델 성능보다 더 민감한 문제가 될 수 있어요. 코드, 로그, 내부 문서가 프롬프트에 들어가는 팀이라면 “학습에 안 쓴다”만으로는 충분하지 않거든요.
Mythos 5를 trusted access로만 푸는 건 dual-use 영역을 분리하려는 선택이에요. 같은 생물학 모델 능력이 신약 개발에는 도움이 되지만, 위험한 바이오 작업에도 도움이 될 수 있으니 사용자 신원과 목적을 보고 접근권을 나누는 구조예요.

이 발표의 핵심은 단순히 더 센 모델이 나왔다는 게 아니라, 프론티어 모델을 일반 공개하면서 위험 도메인을 어떻게 잘라낼지에 대한 실험이라는 점이다. 개발자 입장에서는 코딩 성능도 중요하지만, 기업 트래픽 30일 보관과 false positive가 실제 워크플로우에 얼마나 걸릴지가 더 현실적인 체크포인트다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-23

알파벳, 클라우드 82% 성장했지만 AI 인프라 투자로 현금흐름 첫 적자

알파벳이 2분기 매출 1198억 달러를 기록하며 시장 전망을 넘겼고, 클라우드 매출은 82% 급증한 248억 달러까지 뛰었다. 하지만 AI 인프라에 분기 449억 달러를 투입하면서 잉여현금흐름은 2004년 상장 이후 처음으로 분기 적자를 냈다.

ai-ml 2026-07-23

알파벳 클라우드 매출 82% 폭증했는데, 클라우드 ETF는 왜 빠졌나

알파벳의 2분기 클라우드 매출이 전년 대비 82% 늘며 월가 예상치를 크게 넘었지만, 클라우드 관련 ETF는 오히려 하락했다. 시장은 이제 클라우드 매출 성장률만 보는 게 아니라, 그 매출을 만들기 위해 데이터센터와 칩에 얼마나 많은 자본지출이 들어갔는지를 따지고 있다.

ai-ml 2026-07-23

젠슨 황 “중국산 오픈소스 AI, 좋으면 써야 한다”

젠슨 황 엔비디아 CEO가 미국 정부의 중국산 오픈소스 AI 모델 규제 움직임에 반대했다. 딥시크, 알리바바, 문샷 AI 같은 중국 모델이 백도어라는 우려는 오해에 가깝고, 좋은 오픈소스 모델은 기업들이 활용할 수 있어야 한다는 주장이다.

ai-ml 2026-07-23

업스테이지 ‘솔라 오픈 2’ 공개, 한국어·에이전트 성능으로 독파모 2라운드 승부

업스테이지가 오픈웨이트 LLM ‘솔라 오픈 2’를 공개했다. 2500억 매개변수 중 150억 개만 활성화하는 MoE 구조, 100만 토큰 컨텍스트, H200 2장 구동 가능성을 앞세워 한국어·에이전트·기업 도입성을 동시에 노린 모델이다.

ai-ml 2026-07-23

아이벡스, 오픈소스 로봇·비전으로 볼트 검사 투입 자동화한다

아이벡스가 정보통신산업진흥원의 오픈소스 사업화 과제에 선정돼 케이피에프의 자분탐상 검사라인 자동화에 들어간다. 벌크 상태로 쏟아지는 볼트류를 AI 비전으로 인식하고, 6D 자세 추정과 로봇 제어로 집어서 검사장비에 넣는 흐름까지 구현하는 게 핵심이다.

앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사