---
title: "딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중"
published: 2026-06-08T20:35:04.781Z
canonical: https://jeff.news/article/3886
---
# 딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

딥시크 V4의 초저가 정책 이후 중국 AI 시장에서 API 가격 인하가 연쇄적으로 터지고 있다. 샤오미는 최대 99%, 텐센트 클라우드는 최대 97.5%까지 가격을 낮췄고, 오픈 웨이트 모델 확산이 추론 서비스의 차별점을 가격 경쟁으로 몰아가고 있다.

- 딥시크 V4가 중국 AI 시장에 제대로 가격 폭탄을 던졌음
  - 딥시크가 초저가 정책을 밀어붙이자 경쟁사들이 AI API 과금 구조를 다시 짜기 시작함
  - 단순히 모델 가격만 내려간 게 아니라 클라우드, 서버 대여, 추론 서비스까지 마진 압박이 번지는 중임

- 샤오미는 거의 항복 선언급으로 API 가격을 깎았음
  - 대표 AI 모델 MiMo-V2.5의 API 사용료를 기존 대비 최대 99% 인하함
  - 효과는 바로 나왔고, MiMo-V2.5는 OpenRouter 인기 순위 6위까지 올라감
  - 최근 7일 동안 1조7000억 개 토큰을 처리했고, 전주 대비 999% 이상 늘었다는 숫자가 나옴

> [!IMPORTANT]
> 99% 가격 인하 뒤 7일간 1조7000억 토큰 처리. 이건 단순 할인 이벤트라기보다, 개발자 트래픽을 빨아들이기 위한 인프라 전쟁에 가까움.

- 미니맥스는 무작정 가격을 깎는 대신 요금제를 복잡하게 짜는 쪽을 택했음
  - MiniMax M3를 내면서 토큰 과금에 월 7.24달러에서 69.28달러 구독제를 결합함
  - 그런데 사용자들은 토큰 소비량이 너무 높게 잡혀 월별 할당량이 며칠 만에 소진된다고 불만을 냄
  - 결국 미니맥스는 사과했고, 기존 무제한 주간 접근 권한 고객의 혜택은 유지하겠다고 물러섬

- 중국 AI 가격 전쟁은 이제 단순 덤핑이 아니라 과금 모델 싸움으로 진화 중임
  - 분석가 포에 자오는 기업 고객에게 작업 완료 기준의 실효 비용 효율성을 보여주는 요금제가 중요해지고 있다고 봄
  - 엔터프라이즈 고객은 토큰당 가격만 보는 게 아니라 실제 업무 하나를 끝내는 데 얼마가 드는지를 따지기 때문임

- 텐센트 클라우드도 API 가격을 최대 97.5%까지 내렸음
  - 딥시크 V4 계열을 포함한 AI 제품군 전반에 할인을 넣음
  - 개발자들이 더 싼 클라우드로 이동하는 걸 막으려면 대형 인프라 업체도 가격을 낮출 수밖에 없는 상황임

- 이 경쟁을 더 세게 만드는 핵심은 오픈 웨이트 모델임
  - 가중치가 공개된 모델은 여러 클라우드 벤더와 제3자 인프라 회사가 직접 호스팅할 수 있음
  - 같은 모델을 여러 곳에서 팔 수 있으니, 인프라 업체 입장에서는 성능보다 가격과 접근성이 차별점이 됨
  - MIT와 리눅스 재단, 조지아 공대 연구진의 작업 논문에 따르면 오픈 모델은 폐쇄형 대안보다 평균 15.66% 더 싼 운영 비용 편익을 제공함

- 중국 기업들이 마진을 포기하는 이유는 데이터 확보라는 계산도 깔려 있음
  - 중국정보통신기술연구원 쪽에서는 양질의 데이터가 앞으로 AI 모델 성능을 끌어올리는 가장 큰 제약이자 무기라고 봄
  - 가격을 낮춰 개발자를 끌어들이고, 사용 과정에서 생기는 데이터를 확보하려는 전략이라는 해석이 가능함

- 다만 이 게임은 공급망 전체에 부담을 주고 있음
  - 딥시크의 영구 가격 인하 선언 뒤 중국 클라우드 컴퓨팅과 서버 대여 기업 주가가 약세를 보임
  - 추론 비용이 너무 빨리 내려가면 외부 컴퓨팅 파워를 비싸게 빌리는 사업 모델 자체가 흔들릴 수 있음

---
## 기술 맥락

- 이번 이슈의 핵심은 모델 성능보다 추론 원가가 더 빠르게 상품화되고 있다는 점이에요. 같은 오픈 웨이트 모델을 여러 사업자가 호스팅할 수 있으면, 개발자 입장에서는 응답 품질이 비슷한 곳 중 더 싼 API를 고르게 되거든요.

- 샤오미와 텐센트가 90%대 가격 인하를 한 건 단순 마케팅으로 보기 어려워요. AI API 시장에서는 초기 개발자 트래픽과 사용 패턴 데이터를 잡는 쪽이 이후 모델 개선과 기업 고객 영업에서 유리해지기 때문이에요.

- 미니맥스 사례는 토큰 과금이 얼마나 민감한 UX 문제인지 보여줘요. 월 구독제를 붙여도 모델이 토큰을 많이 먹는다고 사용자가 느끼면, 실제 비용 예측성이 나빠져서 서비스 도입을 망설이게 돼요.

- 한국에서 AI 기능을 붙이는 팀이라면 모델 선택 기준을 바꿔야 해요. 토큰당 가격, 캐시 할인, 실제 워크로드 기준 비용, 데이터 처리 조건을 같이 봐야 나중에 비용 폭탄을 피할 수 있어요.

## 핵심 포인트

- 샤오미 MiMo-V2.5는 가격 인하 뒤 7일간 1조7000억 토큰을 처리하며 전주 대비 999% 이상 성장했다
- 미니맥스는 월 7.24달러에서 69.28달러 구독제와 토큰 과금을 섞었지만 사용자 불만이 바로 터졌다
- 오픈 웨이트 모델은 여러 클라우드가 같은 모델을 호스팅할 수 있게 만들어 추론 단가 경쟁을 더 세게 만든다
- 중국 기업들은 낮은 가격으로 개발자를 끌어들이고 사용 데이터를 확보하려는 전략을 깔고 있다

## 인사이트

AI 모델 경쟁이 성능 싸움에서 추론 단가와 데이터 확보 싸움으로 넘어가는 장면이다. 한국 개발자 입장에서는 모델 API를 고를 때 벤치마크만 볼 게 아니라 가격 정책, 토큰 소모 방식, 호스팅 주체까지 같이 봐야 한다.