본문으로 건너뛰기
피드

앤트로픽, 최상위 Claude Fable 5 공개…위험한 요청은 Opus 4.8로 우회

ai-ml 약 9분
vote
0
댓글
북마크

앤트로픽이 일반 사용자용 최상위 모델 Claude Fable 5와 제한 접근용 Claude Mythos 5를 공개했다. 두 모델은 같은 기반 모델이지만, Fable 5는 사이버보안·생물학·화학·모델 증류 관련 위험 요청을 감지하면 Claude Opus 4.8로 자동 우회하는 안전장치를 붙였다. 코딩, 장기 작업, 비전, 생명과학 연구에서 큰 성능 향상을 주장하지만, 30일 데이터 보관 정책과 보수적인 차단 정책도 같이 따라온다.

  • 1

    Fable 5와 Mythos 5는 같은 기반 모델이며, Fable 5는 일반 공개용 안전장치가 붙은 버전이다.

  • 2

    Stripe는 5천만 줄 Ruby 코드베이스 마이그레이션을 하루 만에 처리했다고 초기 테스트 사례를 공개했다.

  • 3

    위험 요청 감지 시 응답을 Opus 4.8로 넘기며, 평균 5% 미만 세션에서 fallback이 발생한다고 밝혔다.

  • 4

    Mythos 5는 Project Glasswing을 통해 일부 사이버 방어 조직과 인프라 제공자에게 제한 제공된다.

  • 5

    가격은 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러로 책정됐다.

  • 앤트로픽이 Claude Fable 5와 Claude Mythos 5를 같이 공개함. 이름은 둘인데, 실은 같은 기반 모델을 두 가지 접근 정책으로 나눈 구조임

    • Fable 5는 일반 사용자용이고, 안전장치가 붙어 있음
    • Mythos 5는 같은 모델에서 일부 안전장치를 푼 버전이고, 초기에는 Project Glasswing의 사이버 방어 파트너와 인프라 제공자에게만 제공됨
    • 앤트로픽 설명으로는 Mythos급 모델은 기존 Opus급보다 위에 있는 새 성능 계층임
  • Fable 5의 메시지는 꽤 노골적임. “이제 모델이 너무 세져서 그냥 풀 수는 없다”는 쪽임

    • 사이버보안, 생물학·화학, 모델 증류 관련 요청이 감지되면 Fable 5가 직접 답하지 않고 Claude Opus 4.8이 대신 응답함
    • 사용자는 fallback이 발생했다는 사실을 안내받게 됨
    • 앤트로픽은 이 fallback이 평균적으로 세션의 5% 미만에서 발생한다고 주장함
    • 반대로 말하면, 보안 연구나 바이오 쪽에서 일하는 개발자는 정상 요청도 걸릴 가능성을 감수해야 함

중요

> Fable 5와 Mythos 5의 차이는 모델 능력이 아니라 접근 정책임. 같은 기반 모델인데, Fable 5는 위험 도메인에서 Opus 4.8로 우회하고 Mythos 5는 신뢰된 사용자에게 일부 제한을 풀어주는 식임

  • 코딩 성능 쪽 사례는 개발자들이 제일 눈여겨볼 만함

    • Stripe는 5천만 줄 Ruby 코드베이스에서 수작업이면 팀 전체가 2개월 넘게 걸릴 마이그레이션을 Fable 5가 하루 만에 처리했다고 밝힘
    • Cognition의 FrontierCode 평가에서는 프로덕션 코드베이스 기준의 어려운 코딩 작업에서 프론티어 모델 중 최고 점수를 냈다고 함
    • CursorBench, GitHub, Vercel, Replit 같은 초기 테스트 파트너들도 “긴 호흡의 코딩 작업”과 “에이전트형 프로토타이핑”에서 이전 Claude보다 확실히 낫다고 평가함
  • 성능 향상은 코딩에만 걸려 있지 않음. 앤트로픽은 지식 작업, 비전, 장기 기억, 과학 연구를 전부 전면에 세움

    • Hebbia의 금융 벤치마크에서는 문서 기반 추론, 차트·표 해석, 문제 해결에서 최고 점수를 냈다고 함
    • 비전 작업에서는 과학 도표에서 정확한 숫자를 뽑고, 스크린샷만 보고 웹앱 소스코드를 재구성하는 사례를 들었음
    • Pokémon FireRed를 최소한의 vision-only harness만으로 클리어했다는 예시도 붙어 있음. 벤치마크보다 이런 사례가 더 직관적으로 세게 다가오는 편임
  • 장기 작업과 memory 쪽도 꽤 강조됨

    • Fable 5는 수백만 토큰 규모의 긴 작업에서도 집중력을 유지한다고 설명됨
    • Slay the Spire 실험에서는 파일 기반 persistent memory를 줬을 때 Opus 4.8보다 성능 개선폭이 3배 컸고, 최종 act에 도달한 비율도 3배 높았다고 함
    • 에이전트가 자기 노트를 남기고 다음 판단에 반영하는 형태가 점점 실제 제품 기능으로 굳어지는 분위기임
  • Mythos 5의 생명과학 사례는 기대와 불안을 같이 부름

    • 내부 단백질 설계 전문가들은 Mythos 5로 약물 설계 일부를 약 10배 빠르게 했다고 함
    • 14개 단백질 타깃 중 9개에서 강한 후보가 나왔고, 현재 추가 조사 중이라고 밝힘
    • 분자생물학 가설 비교에서는 과학자들이 Mythos 5의 가설을 Opus급 모델보다 약 80% 더 선호했다고 함
    • 유전체 연구에서는 138종 동물의 수백만 개 단일세포 데이터를 모아 커스텀 ML 모델을 설계·훈련했고, Science에 실린 최근 모델보다 100배 작으면서도 더 좋은 성능을 냈다고 주장함
  • 안전장치 설계는 별도 classifier를 앞단에 두는 방식임

    • Fable 5 자체가 위험 요청에 답하기 전에, 별도 AI 시스템이 misuse나 jailbreak 시도를 감지함
    • 감지 대상은 크게 사이버 공격, 생물학·화학, 모델 증류임
    • 사이버 영역에서는 exploit 개발뿐 아니라 정찰, 발견, lateral movement 같은 agentic hacking 단계까지 넓게 잡음
    • 외부 bug bounty 1,000시간 이상에서 universal jailbreak가 나오지 않았다고 하지만, UK AISI는 짧은 테스트 창에서 일부 진전을 보였다고 함

⚠️주의

> Fable 5부터 Mythos급 모델 트래픽은 30일 보관이 요구됨. 앤트로픽은 학습에는 쓰지 않고 안전 목적에만 쓴다고 하지만, 기업 고객은 데이터 보관 정책을 계약·보안 리뷰에서 다시 봐야 함

  • 가격은 프론티어 모델치고 공격적으로 잡았다고 보는 게 맞음

    • 입력 100만 토큰당 10달러, 출력 100만 토큰당 50달러임
    • Claude Mythos Preview보다 절반 이하 가격이라고 설명함
    • 개발자는 Claude API에서 claude-fable-5로 사용할 수 있음
  • 구독 플랜 제공 방식은 좀 복잡함. 수요를 감당하기 어렵다는 뉘앙스가 강함

    • 6월 22일까지는 Pro, Max, Team, seat-based Enterprise 플랜에 Fable 5가 추가 비용 없이 포함됨
    • 6월 23일부터는 해당 플랜에서 빠지고, 이후 사용하려면 usage credit이 필요함
    • 용량이 충분해지면 다시 구독 플랜 기본 구성으로 복귀시키겠다는 계획임
  • 개발자 입장에서 핵심 질문은 “성능이 얼마나 좋냐”보다 “내 작업이 fallback에 걸리냐”일 가능성이 큼

    • 일반 앱 개발, 리팩터링, 문서 분석, UI 프로토타이핑은 Fable 5의 수혜를 바로 볼 수 있음
    • 보안 자동화, 취약점 분석, 바이오·화학 연구 자동화는 Opus 4.8 fallback이나 trusted access 정책에 걸릴 수 있음
    • 즉, Fable 5는 더 똑똑한 범용 모델이라기보다 “위험한 영역은 우회시키는 초고성능 모델”에 가까움

기술 맥락

  • Fable 5의 가장 중요한 선택은 모델을 약하게 만드는 게 아니라, 위험 요청에서 더 낮은 계층의 모델로 우회시키는 방식이에요. 완전 거절보다 사용자 경험은 낫고, 동시에 Mythos급 능력이 공격 자동화에 바로 쓰이는 경로를 줄이려는 거죠.

  • classifier를 별도 시스템으로 둔 이유는 메인 모델 하나에 모든 정책 판단을 맡기기 어렵기 때문이에요. 특히 jailbreak는 사용자가 여러 턴에 걸쳐 우회할 수 있어서, 프롬프트 내용뿐 아니라 세션 패턴까지 보는 안전 레이어가 필요해요.

  • 30일 데이터 보관 정책은 기술적으로는 새 공격과 false positive를 잡기 위한 관측 장치예요. 다만 기업 고객에게는 모델 성능보다 더 민감한 문제가 될 수 있어요. 코드, 로그, 내부 문서가 프롬프트에 들어가는 팀이라면 “학습에 안 쓴다”만으로는 충분하지 않거든요.

  • Mythos 5를 trusted access로만 푸는 건 dual-use 영역을 분리하려는 선택이에요. 같은 생물학 모델 능력이 신약 개발에는 도움이 되지만, 위험한 바이오 작업에도 도움이 될 수 있으니 사용자 신원과 목적을 보고 접근권을 나누는 구조예요.

이 발표의 핵심은 단순히 더 센 모델이 나왔다는 게 아니라, 프론티어 모델을 일반 공개하면서 위험 도메인을 어떻게 잘라낼지에 대한 실험이라는 점이다. 개발자 입장에서는 코딩 성능도 중요하지만, 기업 트래픽 30일 보관과 false positive가 실제 워크플로우에 얼마나 걸릴지가 더 현실적인 체크포인트다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

AI가 만든 ‘록스타 개발자’ 코드, 누가 치울 건데?

이 글은 예전의 ‘록스타 개발자’가 남기던 난해한 코드베이스 문제를 지금의 AI 코딩 흐름에 빗댄다. 대규모 언어 모델(LLM)이 몇 분 만에 수만 줄을 뽑아내는 건 빠르지만, 팀이 이해하고 유지할 수 있는 구조를 망가뜨릴 수 있다는 경고다. 결론은 단순하다. AI를 개발 리더로 세우지 말고, 사람이 설계를 잡고 작은 단위로 통제해야 한다.

ai-ml

이노그리드, 2030년 국내 AI 클라우드 솔루션 1위 목표로 통합 제어 플랫폼 밀기 시작

이노그리드가 테크 비전 데이 2026에서 2030년까지 국내 AI 클라우드 솔루션 1위 기업이 되겠다는 목표와 기술 로드맵을 공개했다. GPU, NPU, CPU, QPU 같은 다양한 xPU 자원부터 AI 개발·학습·배포·운영까지 하나의 Control Plane으로 묶는 TAFA 아키텍처가 핵심이다.

ai-ml

엔비디아와 SK텔레콤, 2027년 기가와트급 AI 클라우드 가동 노림

엔비디아와 SK텔레콤이 엔비디아 DSX 플랫폼을 기반으로 국내에 기가와트급 AI 클라우드를 구축하겠다고 발표했다. 2027년 첫 AI 팩토리 가동을 목표로 하며, 모델 학습·추론·에이전틱 AI·피지컬 AI 워크로드를 처리하는 GPU 특화 클라우드를 만들겠다는 구상이다.

ai-ml

정부, 2조800억 원 들여 네이버클라우드·삼성SDS·엘리스에 GPU 9,704장 맡김

정부가 2026년 2조800억 원 규모의 첨단 GPU 확보·구축 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정했다. 총 9,704장의 베라루빈과 B300을 들여와 국내 AI 모델 개발, 국가 AI 프로젝트, 산학연 연구개발에 투입하고 일부는 CSP 자체 클라우드 서비스에 활용할 계획이다.

ai-ml

전 네이버클라우드 임원이 세운 에이투시스, 설립 한 달 안 돼 160억 시드 투자 유치

이동수 전 네이버클라우드 전무가 창업한 AI 컴퓨팅 솔루션 스타트업 에이투시스가 법인 설립 한 달도 안 돼 160억 원 규모 시드 투자를 유치했다. 회사는 AI 에이전트 연산 효율화, 모델 압축·추론 가속, 차세대 메모리 솔루션을 묶은 소프트웨어·하드웨어 통합 솔루션을 개발하겠다고 밝혔다.