---
title: "앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회"
published: 2026-06-09T16:58:01.000Z
canonical: https://jeff.news/article/3923
---
# 앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회

앤트로픽이 일반 사용자용 최상위 모델 Claude Fable 5와 제한 접근용 Claude Mythos 5를 공개했다. 두 모델은 같은 기반 모델이지만, Fable 5는 사이버보안·생물학·화학·모델 증류 관련 위험 요청을 감지하면 Claude Opus 4.8로 자동 우회하는 안전장치를 붙였다. 코딩, 장기 작업, 비전, 생명과학 연구에서 큰 성능 향상을 주장하지만, 30일 데이터 보관 정책과 보수적인 차단 정책도 같이 따라온다.

- 앤트로픽이 Claude Fable 5와 Claude Mythos 5를 같이 공개함. 이름은 둘인데, 실은 같은 기반 모델을 두 가지 접근 정책으로 나눈 구조임
  - Fable 5는 일반 사용자용이고, 안전장치가 붙어 있음
  - Mythos 5는 같은 모델에서 일부 안전장치를 푼 버전이고, 초기에는 Project Glasswing의 사이버 방어 파트너와 인프라 제공자에게만 제공됨
  - 앤트로픽 설명으로는 Mythos급 모델은 기존 Opus급보다 위에 있는 새 성능 계층임

- Fable 5의 메시지는 꽤 노골적임. “이제 모델이 너무 세져서 그냥 풀 수는 없다”는 쪽임
  - 사이버보안, 생물학·화학, 모델 증류 관련 요청이 감지되면 Fable 5가 직접 답하지 않고 Claude Opus 4.8이 대신 응답함
  - 사용자는 fallback이 발생했다는 사실을 안내받게 됨
  - 앤트로픽은 이 fallback이 평균적으로 세션의 5% 미만에서 발생한다고 주장함
  - 반대로 말하면, 보안 연구나 바이오 쪽에서 일하는 개발자는 정상 요청도 걸릴 가능성을 감수해야 함

> [!IMPORTANT]
> Fable 5와 Mythos 5의 차이는 모델 능력이 아니라 접근 정책임. 같은 기반 모델인데, Fable 5는 위험 도메인에서 Opus 4.8로 우회하고 Mythos 5는 신뢰된 사용자에게 일부 제한을 풀어주는 식임

- 코딩 성능 쪽 사례는 개발자들이 제일 눈여겨볼 만함
  - Stripe는 5천만 줄 Ruby 코드베이스에서 수작업이면 팀 전체가 2개월 넘게 걸릴 마이그레이션을 Fable 5가 하루 만에 처리했다고 밝힘
  - Cognition의 FrontierCode 평가에서는 프로덕션 코드베이스 기준의 어려운 코딩 작업에서 프론티어 모델 중 최고 점수를 냈다고 함
  - CursorBench, GitHub, Vercel, Replit 같은 초기 테스트 파트너들도 “긴 호흡의 코딩 작업”과 “에이전트형 프로토타이핑”에서 이전 Claude보다 확실히 낫다고 평가함

- 성능 향상은 코딩에만 걸려 있지 않음. 앤트로픽은 지식 작업, 비전, 장기 기억, 과학 연구를 전부 전면에 세움
  - Hebbia의 금융 벤치마크에서는 문서 기반 추론, 차트·표 해석, 문제 해결에서 최고 점수를 냈다고 함
  - 비전 작업에서는 과학 도표에서 정확한 숫자를 뽑고, 스크린샷만 보고 웹앱 소스코드를 재구성하는 사례를 들었음
  - Pokémon FireRed를 최소한의 vision-only harness만으로 클리어했다는 예시도 붙어 있음. 벤치마크보다 이런 사례가 더 직관적으로 세게 다가오는 편임

- 장기 작업과 memory 쪽도 꽤 강조됨
  - Fable 5는 수백만 토큰 규모의 긴 작업에서도 집중력을 유지한다고 설명됨
  - Slay the Spire 실험에서는 파일 기반 persistent memory를 줬을 때 Opus 4.8보다 성능 개선폭이 3배 컸고, 최종 act에 도달한 비율도 3배 높았다고 함
  - 에이전트가 자기 노트를 남기고 다음 판단에 반영하는 형태가 점점 실제 제품 기능으로 굳어지는 분위기임

- Mythos 5의 생명과학 사례는 기대와 불안을 같이 부름
  - 내부 단백질 설계 전문가들은 Mythos 5로 약물 설계 일부를 약 10배 빠르게 했다고 함
  - 14개 단백질 타깃 중 9개에서 강한 후보가 나왔고, 현재 추가 조사 중이라고 밝힘
  - 분자생물학 가설 비교에서는 과학자들이 Mythos 5의 가설을 Opus급 모델보다 약 80% 더 선호했다고 함
  - 유전체 연구에서는 138종 동물의 수백만 개 단일세포 데이터를 모아 커스텀 ML 모델을 설계·훈련했고, Science에 실린 최근 모델보다 100배 작으면서도 더 좋은 성능을 냈다고 주장함

- 안전장치 설계는 별도 classifier를 앞단에 두는 방식임
  - Fable 5 자체가 위험 요청에 답하기 전에, 별도 AI 시스템이 misuse나 jailbreak 시도를 감지함
  - 감지 대상은 크게 사이버 공격, 생물학·화학, 모델 증류임
  - 사이버 영역에서는 exploit 개발뿐 아니라 정찰, 발견, lateral movement 같은 agentic hacking 단계까지 넓게 잡음
  - 외부 bug bounty 1,000시간 이상에서 universal jailbreak가 나오지 않았다고 하지만, UK AISI는 짧은 테스트 창에서 일부 진전을 보였다고 함

> [!WARNING]
> Fable 5부터 Mythos급 모델 트래픽은 30일 보관이 요구됨. 앤트로픽은 학습에는 쓰지 않고 안전 목적에만 쓴다고 하지만, 기업 고객은 데이터 보관 정책을 계약·보안 리뷰에서 다시 봐야 함

- 가격은 프론티어 모델치고 공격적으로 잡았다고 보는 게 맞음
  - 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러임
  - Claude Mythos Preview보다 절반 이하 가격이라고 설명함
  - 개발자는 Claude API에서 `claude-fable-5`로 사용할 수 있음

- 구독 플랜 제공 방식은 좀 복잡함. 수요를 감당하기 어렵다는 뉘앙스가 강함
  - 6월 22일까지는 Pro, Max, Team, seat-based Enterprise 플랜에 Fable 5가 추가 비용 없이 포함됨
  - 6월 23일부터는 해당 플랜에서 빠지고, 이후 사용하려면 usage credit이 필요함
  - 용량이 충분해지면 다시 구독 플랜 기본 구성으로 복귀시키겠다는 계획임

- 개발자 입장에서 핵심 질문은 “성능이 얼마나 좋냐”보다 “내 작업이 fallback에 걸리냐”일 가능성이 큼
  - 일반 앱 개발, 리팩터링, 문서 분석, UI 프로토타이핑은 Fable 5의 수혜를 바로 볼 수 있음
  - 보안 자동화, 취약점 분석, 바이오·화학 연구 자동화는 Opus 4.8 fallback이나 trusted access 정책에 걸릴 수 있음
  - 즉, Fable 5는 더 똑똑한 범용 모델이라기보다 “위험한 영역은 우회시키는 초고성능 모델”에 가까움

---

## 기술 맥락

- Fable 5의 가장 중요한 선택은 모델을 약하게 만드는 게 아니라, 위험 요청에서 더 낮은 계층의 모델로 우회시키는 방식이에요. 완전 거절보다 사용자 경험은 낫고, 동시에 Mythos급 능력이 공격 자동화에 바로 쓰이는 경로를 줄이려는 거죠.

- classifier를 별도 시스템으로 둔 이유는 메인 모델 하나에 모든 정책 판단을 맡기기 어렵기 때문이에요. 특히 jailbreak는 사용자가 여러 턴에 걸쳐 우회할 수 있어서, 프롬프트 내용뿐 아니라 세션 패턴까지 보는 안전 레이어가 필요해요.

- 30일 데이터 보관 정책은 기술적으로는 새 공격과 false positive를 잡기 위한 관측 장치예요. 다만 기업 고객에게는 모델 성능보다 더 민감한 문제가 될 수 있어요. 코드, 로그, 내부 문서가 프롬프트에 들어가는 팀이라면 “학습에 안 쓴다”만으로는 충분하지 않거든요.

- Mythos 5를 trusted access로만 푸는 건 dual-use 영역을 분리하려는 선택이에요. 같은 생물학 모델 능력이 신약 개발에는 도움이 되지만, 위험한 바이오 작업에도 도움이 될 수 있으니 사용자 신원과 목적을 보고 접근권을 나누는 구조예요.

## 핵심 포인트

- Fable 5와 Mythos 5는 같은 기반 모델이며, Fable 5는 일반 공개용 안전장치가 붙은 버전이다.
- Stripe는 5천만 줄 Ruby 코드베이스 마이그레이션을 하루 만에 처리했다고 초기 테스트 사례를 공개했다.
- 위험 요청 감지 시 응답을 Opus 4.8로 넘기며, 평균 5% 미만 세션에서 fallback이 발생한다고 밝혔다.
- Mythos 5는 Project Glasswing을 통해 일부 사이버 방어 조직과 인프라 제공자에게 제한 제공된다.
- 가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 책정됐다.

## 인사이트

이 발표의 핵심은 단순히 더 센 모델이 나왔다는 게 아니라, 프론티어 모델을 일반 공개하면서 위험 도메인을 어떻게 잘라낼지에 대한 실험이라는 점이다. 개발자 입장에서는 코딩 성능도 중요하지만, 기업 트래픽 30일 보관과 false positive가 실제 워크플로우에 얼마나 걸릴지가 더 현실적인 체크포인트다.
