딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

ai-ml 2026-06-08 약 5분

 tags

#deepseek #inference #cloud #open-weight #pricing

vote

북마크

딥시크 V4의 초저가 정책 이후 중국 AI 시장에서 API 가격 인하가 연쇄적으로 터지고 있다. 샤오미는 최대 99%, 텐센트 클라우드는 최대 97.5%까지 가격을 낮췄고, 오픈 웨이트 모델 확산이 추론 서비스의 차별점을 가격 경쟁으로 몰아가고 있다.

1
샤오미 MiMo-V2.5는 가격 인하 뒤 7일간 1조7000억 토큰을 처리하며 전주 대비 999% 이상 성장했다
2
미니맥스는 월 7.24달러에서 69.28달러 구독제와 토큰 과금을 섞었지만 사용자 불만이 바로 터졌다
3
오픈 웨이트 모델은 여러 클라우드가 같은 모델을 호스팅할 수 있게 만들어 추론 단가 경쟁을 더 세게 만든다
4
중국 기업들은 낮은 가격으로 개발자를 끌어들이고 사용 데이터를 확보하려는 전략을 깔고 있다

딥시크 V4가 중국 AI 시장에 제대로 가격 폭탄을 던졌음
- 딥시크가 초저가 정책을 밀어붙이자 경쟁사들이 AI API 과금 구조를 다시 짜기 시작함
- 단순히 모델 가격만 내려간 게 아니라 클라우드, 서버 대여, 추론 서비스까지 마진 압박이 번지는 중임
샤오미는 거의 항복 선언급으로 API 가격을 깎았음
- 대표 AI 모델 MiMo-V2.5의 API 사용료를 기존 대비 최대 99% 인하함
- 효과는 바로 나왔고, MiMo-V2.5는 OpenRouter 인기 순위 6위까지 올라감
- 최근 7일 동안 1조7000억 개 토큰을 처리했고, 전주 대비 999% 이상 늘었다는 숫자가 나옴

❗중요

> 99% 가격 인하 뒤 7일간 1조7000억 토큰 처리. 이건 단순 할인 이벤트라기보다, 개발자 트래픽을 빨아들이기 위한 인프라 전쟁에 가까움.

미니맥스는 무작정 가격을 깎는 대신 요금제를 복잡하게 짜는 쪽을 택했음
- MiniMax M3를 내면서 토큰 과금에 월 7.24달러에서 69.28달러 구독제를 결합함
- 그런데 사용자들은 토큰 소비량이 너무 높게 잡혀 월별 할당량이 며칠 만에 소진된다고 불만을 냄
- 결국 미니맥스는 사과했고, 기존 무제한 주간 접근 권한 고객의 혜택은 유지하겠다고 물러섬
중국 AI 가격 전쟁은 이제 단순 덤핑이 아니라 과금 모델 싸움으로 진화 중임
- 분석가 포에 자오는 기업 고객에게 작업 완료 기준의 실효 비용 효율성을 보여주는 요금제가 중요해지고 있다고 봄
- 엔터프라이즈 고객은 토큰당 가격만 보는 게 아니라 실제 업무 하나를 끝내는 데 얼마가 드는지를 따지기 때문임
텐센트 클라우드도 API 가격을 최대 97.5%까지 내렸음
- 딥시크 V4 계열을 포함한 AI 제품군 전반에 할인을 넣음
- 개발자들이 더 싼 클라우드로 이동하는 걸 막으려면 대형 인프라 업체도 가격을 낮출 수밖에 없는 상황임
이 경쟁을 더 세게 만드는 핵심은 오픈 웨이트 모델임
- 가중치가 공개된 모델은 여러 클라우드 벤더와 제3자 인프라 회사가 직접 호스팅할 수 있음
- 같은 모델을 여러 곳에서 팔 수 있으니, 인프라 업체 입장에서는 성능보다 가격과 접근성이 차별점이 됨
- MIT와 리눅스 재단, 조지아 공대 연구진의 작업 논문에 따르면 오픈 모델은 폐쇄형 대안보다 평균 15.66% 더 싼 운영 비용 편익을 제공함
중국 기업들이 마진을 포기하는 이유는 데이터 확보라는 계산도 깔려 있음
- 중국정보통신기술연구원 쪽에서는 양질의 데이터가 앞으로 AI 모델 성능을 끌어올리는 가장 큰 제약이자 무기라고 봄
- 가격을 낮춰 개발자를 끌어들이고, 사용 과정에서 생기는 데이터를 확보하려는 전략이라는 해석이 가능함
다만 이 게임은 공급망 전체에 부담을 주고 있음
- 딥시크의 영구 가격 인하 선언 뒤 중국 클라우드 컴퓨팅과 서버 대여 기업 주가가 약세를 보임
- 추론 비용이 너무 빨리 내려가면 외부 컴퓨팅 파워를 비싸게 빌리는 사업 모델 자체가 흔들릴 수 있음

기술 맥락

이번 이슈의 핵심은 모델 성능보다 추론 원가가 더 빠르게 상품화되고 있다는 점이에요. 같은 오픈 웨이트 모델을 여러 사업자가 호스팅할 수 있으면, 개발자 입장에서는 응답 품질이 비슷한 곳 중 더 싼 API를 고르게 되거든요.
샤오미와 텐센트가 90%대 가격 인하를 한 건 단순 마케팅으로 보기 어려워요. AI API 시장에서는 초기 개발자 트래픽과 사용 패턴 데이터를 잡는 쪽이 이후 모델 개선과 기업 고객 영업에서 유리해지기 때문이에요.
미니맥스 사례는 토큰 과금이 얼마나 민감한 UX 문제인지 보여줘요. 월 구독제를 붙여도 모델이 토큰을 많이 먹는다고 사용자가 느끼면, 실제 비용 예측성이 나빠져서 서비스 도입을 망설이게 돼요.
한국에서 AI 기능을 붙이는 팀이라면 모델 선택 기준을 바꿔야 해요. 토큰당 가격, 캐시 할인, 실제 워크로드 기준 비용, 데이터 처리 조건을 같이 봐야 나중에 비용 폭탄을 피할 수 있어요.

AI 모델 경쟁이 성능 싸움에서 추론 단가와 데이터 확보 싸움으로 넘어가는 장면이다. 한국 개발자 입장에서는 모델 API를 고를 때 벤치마크만 볼 게 아니라 가격 정책, 토큰 소모 방식, 호스팅 주체까지 같이 봐야 한다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-23

알파벳, 클라우드 82% 성장했지만 AI 인프라 투자로 현금흐름 첫 적자

알파벳이 2분기 매출 1198억 달러를 기록하며 시장 전망을 넘겼고, 클라우드 매출은 82% 급증한 248억 달러까지 뛰었다. 하지만 AI 인프라에 분기 449억 달러를 투입하면서 잉여현금흐름은 2004년 상장 이후 처음으로 분기 적자를 냈다.

ai-ml 2026-07-23

알파벳 클라우드 매출 82% 폭증했는데, 클라우드 ETF는 왜 빠졌나

알파벳의 2분기 클라우드 매출이 전년 대비 82% 늘며 월가 예상치를 크게 넘었지만, 클라우드 관련 ETF는 오히려 하락했다. 시장은 이제 클라우드 매출 성장률만 보는 게 아니라, 그 매출을 만들기 위해 데이터센터와 칩에 얼마나 많은 자본지출이 들어갔는지를 따지고 있다.

ai-ml 2026-07-23

젠슨 황 “중국산 오픈소스 AI, 좋으면 써야 한다”

젠슨 황 엔비디아 CEO가 미국 정부의 중국산 오픈소스 AI 모델 규제 움직임에 반대했다. 딥시크, 알리바바, 문샷 AI 같은 중국 모델이 백도어라는 우려는 오해에 가깝고, 좋은 오픈소스 모델은 기업들이 활용할 수 있어야 한다는 주장이다.

ai-ml 2026-07-23

업스테이지 ‘솔라 오픈 2’ 공개, 한국어·에이전트 성능으로 독파모 2라운드 승부

업스테이지가 오픈웨이트 LLM ‘솔라 오픈 2’를 공개했다. 2500억 매개변수 중 150억 개만 활성화하는 MoE 구조, 100만 토큰 컨텍스트, H200 2장 구동 가능성을 앞세워 한국어·에이전트·기업 도입성을 동시에 노린 모델이다.

ai-ml 2026-07-23

아이벡스, 오픈소스 로봇·비전으로 볼트 검사 투입 자동화한다

아이벡스가 정보통신산업진흥원의 오픈소스 사업화 과제에 선정돼 케이피에프의 자분탐상 검사라인 자동화에 들어간다. 벌크 상태로 쏟아지는 볼트류를 AI 비전으로 인식하고, 6D 자세 추정과 로봇 제어로 집어서 검사장비에 넣는 흐름까지 구현하는 게 핵심이다.

딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사