---
title: "아마존, 앤트로픽 모델 요금 체계 바뀌며 AI 비용 압박 커지나"
published: 2026-06-29T18:05:01.910Z
canonical: https://jeff.news/article/4390
---
# 아마존, 앤트로픽 모델 요금 체계 바뀌며 AI 비용 압박 커지나

아마존이 앤트로픽과의 AI 모델 이용 계약을 다시 손보면서, 내년부터 과금 기준이 연산 시간에서 토큰 수로 바뀔 가능성이 커졌다는 보도다. 아마존은 이미 쇼핑, 코딩, 업무 도구에 클로드를 많이 붙여둔 상태라 비용 부담과 기술 의존도 문제가 동시에 튀어나온 그림이다.

- 아마존이 앤트로픽 AI 모델 이용 계약을 다시 협상하면서, 내년부터 비용 계산 방식이 바뀔 수 있다는 보도가 나옴
  - 기존에는 연산 시간 기준이었는데, 앞으로는 토큰 수 기준으로 과금하는 방향이라고 함
  - 토큰은 AI가 텍스트를 처리하는 최소 단위고, 영어 기준으로 한 단어가 대략 1.3토큰 정도로 잡힘

- 이게 민감한 이유는 아마존이 이미 클로드를 꽤 깊게 제품에 심어놨기 때문임
  - 쇼핑 보조 도구인 알렉사 포 쇼핑, 코딩 도구 키로, 업무용 도구 퀵 등에 앤트로픽 모델이 들어가 있음
  - 사용자가 많고 호출량이 큰 서비스일수록 토큰 기반 과금은 바로 운영비 압박으로 이어질 수 있음

> [!IMPORTANT]
> LLM 제품에서 과금 기준이 바뀌면 단순히 벤더 비용만 오르는 게 아니라, 프롬프트 길이·응답 길이·기능 설계까지 전부 비용 변수로 바뀜.

- 아마존은 최근 앤트로픽 한 곳에만 기대는 구도를 줄이려는 움직임도 보이고 있음
  - 지난 2월에는 오픈AI 투자 라운드에서 500억 달러, 우리 돈 약 77조원 규모의 투자를 약정한 파트너십을 맺었다고 보도됨
  - AWS에서 클로드뿐 아니라 GPT 모델도 판매하기로 했고, 아마존 자체 제품에 오픈AI 기술을 붙일 권리도 확보한 상태임

- 내부적으로는 “우리 제품이 앤트로픽 기술에 껍데기만 씌운 것처럼 보일 수 있다”는 우려도 나온다고 함
  - AWS 쪽에는 자체 AI 모델 노바가 있는데, 정작 여러 아마존 제품이 앤트로픽 기반으로 굴러가는 게 부담이라는 얘기임
  - 기술 의존도 문제가 비용 문제랑 브랜드 문제로 같이 번지는 전형적인 상황임

- 보안 이슈도 관계에 미묘한 그림자를 드리운 분위기임
  - 최근 미국 정부가 앤트로픽의 최상위 모델 미토스5와 페이블5에 외국인 접근을 제한하는 수출금지 지침을 냈다는 내용이 언급됨
  - 이 과정에서 아마존 측의 보안 위험성 제보가 계기가 됐다는 보도도 있음

- 아마존이 고려한다는 또 다른 카드는 모델 증류임
  - 클로드를 기반으로 더 가벼운 모델을 만들어, 비슷한 품질을 내면서도 연산 자원을 덜 쓰는 방식임
  - 대형 모델을 매번 직접 호출하는 대신, 특정 업무에 맞춘 경량 모델로 원가를 낮추려는 전략으로 볼 수 있음

> [!TIP]
> LLM 기능을 제품에 넣을 때는 “어느 모델이 제일 똑똑한가”만 보면 안 됨. 호출량이 커질수록 토큰 단가, 캐싱, 프롬프트 압축, 경량 모델 전략이 진짜 비용을 좌우함.

- 물론 양사는 공식적으로 관계 악화나 비용 증가 해석을 부인함
  - 아마존은 앤트로픽과 기술 협업 기반의 다각적 파트너십을 계속 발전시키겠다고 밝힘
  - 앤트로픽도 클로드로 중요한 작업을 수행하는 단가는 세대가 지날수록 낮아지고 있고, 아마존은 가장 중요한 파트너 중 하나라고 설명함

---

## 기술 맥락

- 여기서 핵심은 과금 단위가 바뀌면 아키텍처 판단도 같이 바뀐다는 점이에요. 연산 시간 기준이면 실행 시간을 줄이는 최적화가 중요하지만, 토큰 기준이면 입력 프롬프트와 출력 응답을 얼마나 짧고 정확하게 설계하느냐가 바로 비용이 되거든요.

- 아마존처럼 쇼핑, 코딩, 업무 도구 전반에 LLM을 붙인 회사는 호출 규모가 커서 작은 단가 변화도 크게 느껴져요. 특히 사용자-facing 기능은 응답이 길어지기 쉽고, 컨텍스트를 많이 넣을수록 토큰 비용이 계속 불어나요.

- 그래서 모델 증류가 언급되는 게 자연스러워요. 범용 대형 모델을 계속 호출하기보다, 특정 업무에 필요한 패턴만 작은 모델에 옮기면 비용과 지연 시간을 줄일 수 있거든요.

- 다만 증류는 공짜 점심이 아니에요. 원래 모델 수준의 범용성은 줄어들 수 있고, 어떤 작업에서 품질이 깨지는지 계속 평가해야 해요. 결국 아마존의 선택은 “최고 성능 모델을 외부에서 사 쓸 것인가”와 “충분히 좋은 모델을 직접 통제할 것인가” 사이의 균형 문제에 가까워요.

## 핵심 포인트

- 앤트로픽 과금 방식이 연산 시간 기준에서 토큰 수 기준으로 바뀌면 아마존의 AI 제품 운영비가 커질 수 있음
- 아마존은 앤트로픽 의존도를 낮추기 위해 오픈AI와의 협력, 자체 모델 노바, 경량 모델 증류까지 같이 검토 중임
- 양사는 비용 증가나 관계 악화 해석을 공식적으로는 부인하고 있음

## 인사이트

LLM 시대의 진짜 락인은 API 호출 코드가 아니라 비용 구조와 제품 의존도에서 생김. 대형 플랫폼도 한 모델 벤더에 깊게 묶이면 협상력, 보안, 브랜드 독립성까지 한꺼번에 흔들릴 수 있다는 사례로 볼 만함.
