본문으로 건너뛰기
피드

아마존, 앤트로픽 모델 요금 체계 바뀌며 AI 비용 압박 커지나

ai-ml 약 5분
vote
0
댓글
북마크

아마존이 앤트로픽과의 AI 모델 이용 계약을 다시 손보면서, 내년부터 과금 기준이 연산 시간에서 토큰 수로 바뀔 가능성이 커졌다는 보도다. 아마존은 이미 쇼핑, 코딩, 업무 도구에 클로드를 많이 붙여둔 상태라 비용 부담과 기술 의존도 문제가 동시에 튀어나온 그림이다.

  • 1

    앤트로픽 과금 방식이 연산 시간 기준에서 토큰 수 기준으로 바뀌면 아마존의 AI 제품 운영비가 커질 수 있음

  • 2

    아마존은 앤트로픽 의존도를 낮추기 위해 오픈AI와의 협력, 자체 모델 노바, 경량 모델 증류까지 같이 검토 중임

  • 3

    양사는 비용 증가나 관계 악화 해석을 공식적으로는 부인하고 있음

  • 아마존이 앤트로픽 AI 모델 이용 계약을 다시 협상하면서, 내년부터 비용 계산 방식이 바뀔 수 있다는 보도가 나옴

    • 기존에는 연산 시간 기준이었는데, 앞으로는 토큰 수 기준으로 과금하는 방향이라고 함
    • 토큰은 AI가 텍스트를 처리하는 최소 단위고, 영어 기준으로 한 단어가 대략 1.3토큰 정도로 잡힘
  • 이게 민감한 이유는 아마존이 이미 클로드를 꽤 깊게 제품에 심어놨기 때문임

    • 쇼핑 보조 도구인 알렉사 포 쇼핑, 코딩 도구 키로, 업무용 도구 퀵 등에 앤트로픽 모델이 들어가 있음
    • 사용자가 많고 호출량이 큰 서비스일수록 토큰 기반 과금은 바로 운영비 압박으로 이어질 수 있음

중요

> LLM 제품에서 과금 기준이 바뀌면 단순히 벤더 비용만 오르는 게 아니라, 프롬프트 길이·응답 길이·기능 설계까지 전부 비용 변수로 바뀜.

  • 아마존은 최근 앤트로픽 한 곳에만 기대는 구도를 줄이려는 움직임도 보이고 있음

    • 지난 2월에는 오픈AI 투자 라운드에서 500억 달러, 우리 돈 약 77조원 규모의 투자를 약정한 파트너십을 맺었다고 보도됨
    • AWS에서 클로드뿐 아니라 GPT 모델도 판매하기로 했고, 아마존 자체 제품에 오픈AI 기술을 붙일 권리도 확보한 상태임
  • 내부적으로는 “우리 제품이 앤트로픽 기술에 껍데기만 씌운 것처럼 보일 수 있다”는 우려도 나온다고 함

    • AWS 쪽에는 자체 AI 모델 노바가 있는데, 정작 여러 아마존 제품이 앤트로픽 기반으로 굴러가는 게 부담이라는 얘기임
    • 기술 의존도 문제가 비용 문제랑 브랜드 문제로 같이 번지는 전형적인 상황임
  • 보안 이슈도 관계에 미묘한 그림자를 드리운 분위기임

    • 최근 미국 정부가 앤트로픽의 최상위 모델 미토스5와 페이블5에 외국인 접근을 제한하는 수출금지 지침을 냈다는 내용이 언급됨
    • 이 과정에서 아마존 측의 보안 위험성 제보가 계기가 됐다는 보도도 있음
  • 아마존이 고려한다는 또 다른 카드는 모델 증류임

    • 클로드를 기반으로 더 가벼운 모델을 만들어, 비슷한 품질을 내면서도 연산 자원을 덜 쓰는 방식임
    • 대형 모델을 매번 직접 호출하는 대신, 특정 업무에 맞춘 경량 모델로 원가를 낮추려는 전략으로 볼 수 있음

💡

> LLM 기능을 제품에 넣을 때는 “어느 모델이 제일 똑똑한가”만 보면 안 됨. 호출량이 커질수록 토큰 단가, 캐싱, 프롬프트 압축, 경량 모델 전략이 진짜 비용을 좌우함.

  • 물론 양사는 공식적으로 관계 악화나 비용 증가 해석을 부인함
    • 아마존은 앤트로픽과 기술 협업 기반의 다각적 파트너십을 계속 발전시키겠다고 밝힘
    • 앤트로픽도 클로드로 중요한 작업을 수행하는 단가는 세대가 지날수록 낮아지고 있고, 아마존은 가장 중요한 파트너 중 하나라고 설명함

기술 맥락

  • 여기서 핵심은 과금 단위가 바뀌면 아키텍처 판단도 같이 바뀐다는 점이에요. 연산 시간 기준이면 실행 시간을 줄이는 최적화가 중요하지만, 토큰 기준이면 입력 프롬프트와 출력 응답을 얼마나 짧고 정확하게 설계하느냐가 바로 비용이 되거든요.

  • 아마존처럼 쇼핑, 코딩, 업무 도구 전반에 LLM을 붙인 회사는 호출 규모가 커서 작은 단가 변화도 크게 느껴져요. 특히 사용자-facing 기능은 응답이 길어지기 쉽고, 컨텍스트를 많이 넣을수록 토큰 비용이 계속 불어나요.

  • 그래서 모델 증류가 언급되는 게 자연스러워요. 범용 대형 모델을 계속 호출하기보다, 특정 업무에 필요한 패턴만 작은 모델에 옮기면 비용과 지연 시간을 줄일 수 있거든요.

  • 다만 증류는 공짜 점심이 아니에요. 원래 모델 수준의 범용성은 줄어들 수 있고, 어떤 작업에서 품질이 깨지는지 계속 평가해야 해요. 결국 아마존의 선택은 “최고 성능 모델을 외부에서 사 쓸 것인가”와 “충분히 좋은 모델을 직접 통제할 것인가” 사이의 균형 문제에 가까워요.

LLM 시대의 진짜 락인은 API 호출 코드가 아니라 비용 구조와 제품 의존도에서 생김. 대형 플랫폼도 한 모델 벤더에 깊게 묶이면 협상력, 보안, 브랜드 독립성까지 한꺼번에 흔들릴 수 있다는 사례로 볼 만함.

댓글

댓글

댓글을 불러오는 중...

ai-ml

클로드가 애저 안으로 들어옴…앤트로픽·엔비디아·마이크로소프트 동맹 본격 가동

앤트로픽의 클로드 모델군이 엔비디아 블랙웰 울트라 기반 마이크로소프트 애저 클라우드에 정식 배포됐다. 이제 애저 고객은 외부 호출이 아니라 애저 내부에서 클로드를 직접 구동할 수 있어, 데이터 역외 이전 규제가 있는 기업에게 꽤 큰 변화다.

ai-ml

백악관 AI 규제 강화, 오픈소스 모델엔 오히려 기회 될까

미국 백악관의 AI 규제 강화 흐름 속에서 오픈소스 AI 모델이 상대적으로 주목받을 수 있다는 분석이 나왔다. 폐쇄형 모델에 대한 공급 안정성, 규제 리스크, 특정 업체 의존 문제가 커지면서 개발자와 기업이 오픈소스 대안을 더 진지하게 보고 있다는 내용이다.

ai-ml

한국은행, AI 데이터센터 투자가 미국 경제 성장축 됐다고 분석

한국은행 뉴욕 사무소가 AI 확산에 따른 컴퓨팅 수요와 데이터센터 투자를 미국 경제의 핵심 성장 동력으로 봤다. 미국에는 현재 데이터센터 4,378개가 가동 중이고, 약 2,700개가 건설 중이거나 계획 중이며, AI 반도체와 서버의 경제적 수명은 2∼3년에 불과해 투자 사이클이 계속 이어질 수 있다는 분석이다.

ai-ml

국제결제은행, AI 투자 열풍이 금융시장 흔들 수 있다고 경고

국제결제은행(BIS)이 AI 부문으로 몰리는 투자 열풍이 장기 침체와 금융시장 불안을 부를 수 있다고 경고했다. 하이퍼스케일러들은 내년까지 AI 인프라에 1조 달러 이상을 쏟아부을 예정이지만, 이제는 막대한 지출이 실제 현금 흐름과 이익으로 이어지는지 검증해야 한다는 메시지다.

ai-ml

GS, 산업 현장 안전관리 AI를 중소기업에 무상 제공

GS그룹이 안전관리 AI 에이전트 ‘에어(AIR)’를 중소기업에 무상 제공하고 있다. 작업명과 설명만 넣으면 생성형 AI가 공정, 위험요인, 위험등급, 예방 대책을 자동으로 만들고, 실제 현장에서는 위험성 평가 시간이 기존의 10분의 1로 줄었다.