본문으로 건너뛰기
피드

딥시크발 가격 전쟁, 중국 AI 클라우드 마진을 갈아버리는 중

ai-ml 약 5분
vote
0
댓글
북마크

딥시크 V4의 초저가 정책 이후 중국 AI 시장에서 API 가격 인하가 연쇄적으로 터지고 있다. 샤오미는 최대 99%, 텐센트 클라우드는 최대 97.5%까지 가격을 낮췄고, 오픈 웨이트 모델 확산이 추론 서비스의 차별점을 가격 경쟁으로 몰아가고 있다.

  • 1

    샤오미 MiMo-V2.5는 가격 인하 뒤 7일간 1조7000억 토큰을 처리하며 전주 대비 999% 이상 성장했다

  • 2

    미니맥스는 월 7.24달러에서 69.28달러 구독제와 토큰 과금을 섞었지만 사용자 불만이 바로 터졌다

  • 3

    오픈 웨이트 모델은 여러 클라우드가 같은 모델을 호스팅할 수 있게 만들어 추론 단가 경쟁을 더 세게 만든다

  • 4

    중국 기업들은 낮은 가격으로 개발자를 끌어들이고 사용 데이터를 확보하려는 전략을 깔고 있다

  • 딥시크 V4가 중국 AI 시장에 제대로 가격 폭탄을 던졌음

    • 딥시크가 초저가 정책을 밀어붙이자 경쟁사들이 AI API 과금 구조를 다시 짜기 시작함
    • 단순히 모델 가격만 내려간 게 아니라 클라우드, 서버 대여, 추론 서비스까지 마진 압박이 번지는 중임
  • 샤오미는 거의 항복 선언급으로 API 가격을 깎았음

    • 대표 AI 모델 MiMo-V2.5의 API 사용료를 기존 대비 최대 99% 인하함
    • 효과는 바로 나왔고, MiMo-V2.5는 OpenRouter 인기 순위 6위까지 올라감
    • 최근 7일 동안 1조7000억 개 토큰을 처리했고, 전주 대비 999% 이상 늘었다는 숫자가 나옴

중요

> 99% 가격 인하 뒤 7일간 1조7000억 토큰 처리. 이건 단순 할인 이벤트라기보다, 개발자 트래픽을 빨아들이기 위한 인프라 전쟁에 가까움.

  • 미니맥스는 무작정 가격을 깎는 대신 요금제를 복잡하게 짜는 쪽을 택했음

    • MiniMax M3를 내면서 토큰 과금에 월 7.24달러에서 69.28달러 구독제를 결합함
    • 그런데 사용자들은 토큰 소비량이 너무 높게 잡혀 월별 할당량이 며칠 만에 소진된다고 불만을 냄
    • 결국 미니맥스는 사과했고, 기존 무제한 주간 접근 권한 고객의 혜택은 유지하겠다고 물러섬
  • 중국 AI 가격 전쟁은 이제 단순 덤핑이 아니라 과금 모델 싸움으로 진화 중임

    • 분석가 포에 자오는 기업 고객에게 작업 완료 기준의 실효 비용 효율성을 보여주는 요금제가 중요해지고 있다고 봄
    • 엔터프라이즈 고객은 토큰당 가격만 보는 게 아니라 실제 업무 하나를 끝내는 데 얼마가 드는지를 따지기 때문임
  • 텐센트 클라우드도 API 가격을 최대 97.5%까지 내렸음

    • 딥시크 V4 계열을 포함한 AI 제품군 전반에 할인을 넣음
    • 개발자들이 더 싼 클라우드로 이동하는 걸 막으려면 대형 인프라 업체도 가격을 낮출 수밖에 없는 상황임
  • 이 경쟁을 더 세게 만드는 핵심은 오픈 웨이트 모델임

    • 가중치가 공개된 모델은 여러 클라우드 벤더와 제3자 인프라 회사가 직접 호스팅할 수 있음
    • 같은 모델을 여러 곳에서 팔 수 있으니, 인프라 업체 입장에서는 성능보다 가격과 접근성이 차별점이 됨
    • MIT와 리눅스 재단, 조지아 공대 연구진의 작업 논문에 따르면 오픈 모델은 폐쇄형 대안보다 평균 15.66% 더 싼 운영 비용 편익을 제공함
  • 중국 기업들이 마진을 포기하는 이유는 데이터 확보라는 계산도 깔려 있음

    • 중국정보통신기술연구원 쪽에서는 양질의 데이터가 앞으로 AI 모델 성능을 끌어올리는 가장 큰 제약이자 무기라고 봄
    • 가격을 낮춰 개발자를 끌어들이고, 사용 과정에서 생기는 데이터를 확보하려는 전략이라는 해석이 가능함
  • 다만 이 게임은 공급망 전체에 부담을 주고 있음

    • 딥시크의 영구 가격 인하 선언 뒤 중국 클라우드 컴퓨팅과 서버 대여 기업 주가가 약세를 보임
    • 추론 비용이 너무 빨리 내려가면 외부 컴퓨팅 파워를 비싸게 빌리는 사업 모델 자체가 흔들릴 수 있음

기술 맥락

  • 이번 이슈의 핵심은 모델 성능보다 추론 원가가 더 빠르게 상품화되고 있다는 점이에요. 같은 오픈 웨이트 모델을 여러 사업자가 호스팅할 수 있으면, 개발자 입장에서는 응답 품질이 비슷한 곳 중 더 싼 API를 고르게 되거든요.

  • 샤오미와 텐센트가 90%대 가격 인하를 한 건 단순 마케팅으로 보기 어려워요. AI API 시장에서는 초기 개발자 트래픽과 사용 패턴 데이터를 잡는 쪽이 이후 모델 개선과 기업 고객 영업에서 유리해지기 때문이에요.

  • 미니맥스 사례는 토큰 과금이 얼마나 민감한 UX 문제인지 보여줘요. 월 구독제를 붙여도 모델이 토큰을 많이 먹는다고 사용자가 느끼면, 실제 비용 예측성이 나빠져서 서비스 도입을 망설이게 돼요.

  • 한국에서 AI 기능을 붙이는 팀이라면 모델 선택 기준을 바꿔야 해요. 토큰당 가격, 캐시 할인, 실제 워크로드 기준 비용, 데이터 처리 조건을 같이 봐야 나중에 비용 폭탄을 피할 수 있어요.

AI 모델 경쟁이 성능 싸움에서 추론 단가와 데이터 확보 싸움으로 넘어가는 장면이다. 한국 개발자 입장에서는 모델 API를 고를 때 벤치마크만 볼 게 아니라 가격 정책, 토큰 소모 방식, 호스팅 주체까지 같이 봐야 한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

정부, 2조800억 원 들여 GPU 9704장 확보한다

과기정통부가 2조800억 원 규모 첨단 GPU 확보·구축·운용 지원 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정했다. 총 9704장의 최신 GPU를 확보해 독자 AI 파운데이션 모델, 국가 AI 프로젝트, 산학연 연구개발, 클라우드 GPU 서비스에 투입할 계획이다.

ai-ml

AI 전력난 때문에 빅테크가 핵융합까지 당기는 중, 헬리온 4억6500만 달러 유치

샘 알트만이 투자한 헬리온이 4억6500만 달러를 새로 유치하며 기업가치 155억 달러를 기록했다. 마이크로소프트에 전력을 공급할 ‘오리온’ 원자로 건설은 AI 데이터센터 전력 수요를 빅테크가 직접 해결하려는 흐름으로 해석된다. 핵심은 AI 경쟁이 모델과 GPU를 넘어 청정 전력 확보 경쟁으로 번지고 있다는 점이다.

ai-ml

엔비디아가 한국에 그리려는 ‘AI 팩토리’, 핵심은 원전급 전력 먹는 GPU 인프라

젠슨 황은 한국 기업들과 함께 기가와트급 AI 팩토리를 구축하겠다는 구상을 밝혔다. 기존 데이터센터가 CPU 중심으로 데이터를 저장·조회했다면, AI 팩토리는 수십만 개 GPU와 초고속 네트워크, 전력·냉각 설비를 결합해 대규모 추론을 계속 수행하는 인프라다. 네이버는 초대형 AI 팩토리를 짓고, SK는 AI 팩토리로 반도체 생산을 자동화한 뒤 그 반도체를 다시 AI 팩토리에 공급하는 선순환을 노린다.

ai-ml

젠슨 황 방한 막판까지 AI 동맹 총정리, SK·LG·현대차·네이버를 하루에 훑었다

젠슨 황 엔비디아 최고경영자가 방한 마지막 일정까지 국내 대기업과 정부, 스타트업을 잇달아 만나며 한국을 AI 생태계의 핵심 파트너로 띄웠다. SK와는 AI 인프라와 반도체, LG와는 로보틱스, 현대차와는 피지컬 AI, 네이버와는 대규모 AI 인프라 협력 논의가 이어졌다. 서울대 강연에서는 AI와 로봇이 산업 전반을 바꾸는 지금이 학생들에게 큰 기회라고 강조했다.

ai-ml

AI 규제의 중심축, 이제 ‘안전’만이 아니라 안보·경쟁력·윤리로 이동 중

강력한 AI가 전쟁, 사이버안보, 산업 경쟁력의 핵심 인프라가 되면서 주요국의 규제 방향도 바뀌고 있다. 미국은 프론티어 AI 모델의 출시 전 안전성 검토를 자율 협력 방식으로 설계했고, 유럽연합은 고위험 AI 규제 적용 시점을 늦추며 산업 경쟁력 부담을 의식하기 시작했다. 한국도 AI 기본법을 단순 안전 규제 프레임이 아니라 안보·경쟁력·윤리의 균형으로 다시 봐야 한다는 주장이다.