본문으로 건너뛰기
피드

앤트로픽, 더 싸게 굴리는 에이전트 모델 ‘Claude Sonnet 5’ 공개

ai-ml 약 8분
vote
0
댓글
북마크

앤트로픽이 Claude Sonnet 5를 공개했어. Opus 4.8에 가까운 에이전트 성능을 더 낮은 가격으로 제공하고, 코딩·도구 사용·장기 작업 수행 능력을 크게 끌어올렸다는 게 핵심이야. 다만 새 토크나이저 때문에 같은 입력이 1.0~1.35배 더 많은 토큰으로 잡힐 수 있어 비용 계산은 다시 해봐야 해.

  • 1

    Claude Sonnet 5는 Free·Pro 기본 모델로 배포되고 Claude Code와 Claude API에서도 바로 사용 가능

  • 2

    출시가는 2026년 8월 31일까지 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러

  • 3

    Sonnet 4.6보다 추론, 도구 사용, 코딩, 지식 작업에서 개선됐고 일부 고노력 설정에서는 Opus 4.8과 비슷한 성능을 냄

  • 4

    안전 평가에서는 Sonnet 4.6보다 환각, 아첨, 악성 요청 대응이 개선됐지만 사이버 작업에는 기본 보호장치가 켜져 있음

  • 5

    새 토크나이저 적용으로 같은 입력이 1.0~1.35배 더 많은 토큰으로 계산될 수 있음

  • 앤트로픽이 Claude Sonnet 5를 공개했어. 한 줄로 말하면 ‘Opus급 에이전트 느낌을 Sonnet 가격으로 내려보겠다’는 모델임

    • Sonnet 5는 브라우저, 터미널 같은 도구를 쓰고, 계획을 세우고, 꽤 긴 작업을 자율적으로 이어가는 쪽에 초점을 맞췄어
    • 앤트로픽은 몇 달 전만 해도 더 크고 비싼 모델이 필요했던 수준의 작업을 Sonnet 5가 처리할 수 있다고 주장함
  • 포지션이 꽤 노골적이야. Sonnet 4.6보다 확실히 좋아졌고, Opus 4.8과의 격차를 줄였다는 얘기임

    • 개선 포인트는 추론, 도구 사용, 코딩, 지식 작업 같은 에이전트 핵심 영역
    • BrowseComp와 OSWorld-Verified 같은 평가에서 Sonnet 5는 Sonnet 4.6보다 일관되게 좋아졌고, 비용 대비 성능 선택지가 더 넓어졌다고 설명돼
    • 특히 중간 effort 설정에서 비용 효율이 좋아지고, 높은 effort에서는 일부 작업에서 Opus 4.8과 맞먹는다고 함

중요

> 출시 가격은 2026년 8월 31일까지 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러야. 이후에는 입력 3달러, 출력 15달러로 올라감.

  • 배포 범위도 바로 넓게 깔았어

    • Free와 Pro 플랜에서는 기본 모델로 들어감
    • Max, Team, Enterprise 사용자도 사용 가능
    • Claude Code와 Claude Platform에서도 바로 쓸 수 있고, API 모델명은 claude-sonnet-5임
  • 초기 사용 파트너들의 평가는 대체로 ‘중간에 안 멈춘다’ 쪽에 몰려 있어

    • Salesforce 계정 등급 업데이트와 엔터프라이즈 연락처 대상 런칭 공지 발송을 한 번에 끝냈다는 사례가 나옴
    • 실제 풀 리퀘스트 수십 개를 대상으로 테스트했더니, 테스트와 검증까지 스스로 밀고 갔다는 피드백도 있음
    • 어떤 사용자는 버그 조사를 시켰더니, 재현 테스트를 만들고 수정한 뒤 변경을 stash해서 버그가 다시 나타나는지 확인했다고 함. 이건 개발자 입장에선 꽤 센 디테일임
  • 코딩 쪽에서 특히 강조한 건 brownfield code, 즉 이미 낡고 복잡해진 현실 코드베이스임

    • 레이스 컨디션, 숨겨진 테스트, 아무도 건드리기 싫어하는 영역에서 원인까지 추적하고 증상 패치가 아니라 지속 가능한 수정을 만든다는 식으로 포장했어
    • 이건 새 프로젝트에서 깔끔한 예제 만드는 능력보다 훨씬 실무적인 지점이라, Claude Code 사용자라면 바로 체감 포인트가 될 수 있음
  • 안전성 평가에서는 Sonnet 4.6보다 전반적으로 나아졌다고 함

    • 악성 요청 거부, 프롬프트 인젝션 공격 저항, 환각, 아첨 성향에서 개선됐다고 설명돼
    • 자동 행동 감사에서도 오용 협력이나 기만 같은 부정렬 행동 비율이 Sonnet 4.6보다 낮게 나왔다는 입장임
    • 다만 더 강한 Opus 4.8이나 Claude Mythos Preview와 비교하면 일부 부정렬 행동은 더 높게 나왔다고 인정함
  • 사이버 보안 쪽은 일부러 선을 그었어

    • 앤트로픽은 Sonnet 5를 사이버 보안 작업용으로 의도적으로 훈련하지 않았다고 밝힘
    • Firefox 147 취약점 exploit 생성 평가에서 완전한 작동 exploit은 한 번도 만들지 못했다고 함
    • 그래도 Sonnet 4.6보다 부분 성공률은 약간 높아져서, 기본 사이버 보호장치를 켜고 출시함

⚠️주의

> Sonnet 5는 위험한 사이버 사용을 실시간으로 감지하고 차단하는 보호장치가 기본 적용돼. 보안 연구 자동화에 쓰려는 팀은 이 제약을 먼저 확인해야 함.

  • 비용 얘기에서 놓치면 안 되는 함정도 있어. Sonnet 5는 새 토크나이저를 씀

    • 같은 입력이 콘텐츠 종류에 따라 대략 1.0~1.35배 더 많은 토큰으로 매핑될 수 있다고 함
    • 앤트로픽은 도입 가격을 낮춰서 Sonnet 4.6에서 넘어갈 때 비용이 대체로 중립적이게 설계했다고 설명함
    • 그래도 실제 서비스에 붙인 팀은 평균 입력 길이, 로그, 프롬프트 템플릿 기준으로 다시 계산해봐야 함
  • 모델 선택은 이제 ‘성능 하나만 보고 Opus’가 아니라 effort와 비용 조합 게임으로 바뀌는 분위기야

    • Sonnet 5와 Opus 4.8 사이에서 effort level을 조절해 비용과 성능 균형을 맞추라는 게 앤트로픽의 메시지임
    • Chat, Cowork, Claude Code, Claude Platform 전반의 rate limit도 higher effort 사용을 감당하도록 올렸다고 함

기술 맥락

  • 이번 선택의 핵심은 Sonnet 라인을 단순 채팅 모델이 아니라 실행 계층으로 밀어 올리는 거예요. 개발팀 입장에서는 Opus급 모델을 모든 자동화에 붙이면 비용이 부담되니까, 반복적인 코딩·검색·업무 자동화는 더 싼 Sonnet으로 처리하고 어려운 판단만 상위 모델에 맡기는 구조가 자연스럽거든요.

  • effort level 이야기가 중요한 이유는 같은 모델이라도 계산을 얼마나 쓰게 하느냐에 따라 비용과 성능이 달라지기 때문이에요. 앤트로픽은 Sonnet 5가 중간 effort에서 비용 효율이 좋고, 높은 effort에서는 일부 작업에서 Opus 4.8에 가까워진다고 말해요. 팀마다 ‘빠른 초안’, ‘검증까지 끝낸 패치’, ‘고위험 변경’의 기준이 다르니 설정값을 나눠야 해요.

  • 새 토크나이저는 은근히 운영 이슈예요. 모델 단가는 낮아 보여도 같은 프롬프트가 1.35배 토큰으로 잡히면 장기 실행 에이전트의 비용이 꽤 달라질 수 있거든요. 특히 로그, 코드 컨텍스트, 테스트 출력까지 많이 먹이는 Claude Code류 워크플로에서는 실제 청구 데이터를 보고 판단해야 해요.

  • 안전장치도 성능과 분리해서 보면 안 돼요. 에이전트가 터미널과 브라우저를 만지는 순간 프롬프트 인젝션이나 위험한 사이버 요청이 실제 실행 리스크가 되거든요. Sonnet 5가 더 자율적으로 움직이는 만큼, 앤트로픽이 기본 차단 로직을 켜고 출시한 건 제품 방향과 맞물린 선택이에요.

이건 단순한 모델 업데이트라기보다 ‘비싼 최상위 모델로만 가능하던 에이전트 작업’을 Sonnet 가격대로 끌어내리는 움직임에 가까워. Claude Code나 사내 자동화에 이미 Claude를 붙여둔 팀이면 성능보다 실제 토큰 비용 변화부터 확인하는 게 포인트야.

댓글

댓글

댓글을 불러오는 중...

ai-ml

메타가 남는 AI 컴퓨팅을 클라우드로 팔 수도 있다는 얘기에 시장이 뒤집힘

메타가 남는 AI 컴퓨팅 자원과 모델 접근권을 외부에 판매하는 클라우드 사업을 검토 중이라는 보도가 나왔다. 메타 주가는 장중 10% 가까이 뛰었지만, 마이크론과 코어위브 같은 AI 인프라 관련주는 공급 과잉 우려로 크게 밀렸다. 핵심은 빅테크의 AI 투자금 회수 전략이 GPU·HBM 수요를 더 키울지, 아니면 이미 사둔 자원을 시장에 다시 풀어 수요를 잠식할지다.

ai-ml

메타, 남는 AI 컴퓨팅으로 클라우드 장사까지 노린다

메타가 자사 데이터센터의 남는 AI 컴퓨팅 자원을 외부 고객에게 파는 클라우드 사업을 검토 중이다. 모델 API를 제공하는 방식과 GPU 같은 연산 자원만 빌려주는 방식이 함께 거론되고, 이 소식에 메타 주가는 9.48% 급등한 반면 코어위브와 반도체주는 크게 흔들렸다.

ai-ml

메타, 남는 AI 연산 자원 팔아서 클라우드 사업 뛰어드나

메타가 인공초지능 개발을 위해 쌓아둔 데이터센터와 GPU 인프라를 외부 고객에게 판매하는 클라우드 사업을 검토 중인 것으로 알려졌다. 자체 AI 모델 API를 제공하는 PaaS 방식과 순수 연산 자원을 임대하는 IaaS 방식이 모두 거론되며, 시장은 메타 주가 10% 상승과 네오클라우드 주가 급락으로 바로 반응했다.

ai-ml

피지컬 AI 시대, 한국 반도체는 메모리만으론 부족하다는 경고

성균관대 이우근 교수가 피지컬 AI 시대에는 한국 반도체 산업이 메모리 중심 구조를 넘어 아날로그·통신 설계자산과 팹리스 생태계를 키워야 한다고 주장했다. 생성형 AI 덕분에 고대역폭메모리의 전략적 가치는 커졌지만, 로봇·자율주행·산업용 기계처럼 기기 자체에서 판단하고 움직이는 환경에선 센서·통신·전력관리 반도체가 더 중요해진다는 내용이다.

ai-ml

미국 중앙정보국장 “AI는 디지털 핵무기”, 조직도 코드 중심으로 바꾼다

미국 중앙정보국장이 공개 행사에서 AI를 ‘디지털 핵무기’급 기술로 규정하며, 조직을 사이버·기술 중심으로 개편하겠다고 밝혔다. 베네수엘라 대통령 체포 작전과 이란 추락 전투기 조종사 위치 파악 사례까지 언급하며 AI가 정보전의 판을 바꾸고 있다고 강조했다.