---
title: "딥시크, V4-프로 가격 75% 인하…AI 모델 가격 전쟁 제대로 붙나"
published: 2026-05-26T08:41:01.865Z
canonical: https://jeff.news/article/3237
---
# 딥시크, V4-프로 가격 75% 인하…AI 모델 가격 전쟁 제대로 붙나

딥시크가 주력 모델 V4-프로 사용료를 75% 낮추고 이 할인을 영구 정책으로 바꿨어. 출력 토큰 가격이 GPT-5.5 대비 약 34분의 1 수준까지 내려가면서, 기업 AI 서비스가 고성능 프리미엄 모델과 저가 모델을 섞어 쓰는 멀티모델 구조로 갈 가능성이 커지고 있어.

## 가격 인하가 그냥 할인 이벤트가 아님

- 중국 AI 스타트업 딥시크가 주력 모델 V4-프로 사용료를 75% 낮췄고, 이걸 영구 정책으로 바꿨음.
  - 입력 토큰은 100만 개당 3위안, 약 595원, 0.435달러 수준.
  - 출력 토큰은 100만 개당 6위안, 약 1190원, 0.87달러 수준.
  - 기존 가격은 입력 12위안, 출력 24위안이었으니 정확히 4분의 1로 떨어진 셈임.

- 비교 대상이 되는 프리미엄 모델들과 가격 차이가 꽤 살벌함.
  - AI 코스트 체크의 5월 기준 가격으로 오픈AI GPT-5.5는 입력 5달러, 출력 30달러.
  - 앤트로픽 클로드 오퍼스 4.7은 입력 5달러, 출력 25달러.
  - 구글 제미나이 3.1 프로도 입력 2달러, 출력 12달러.
  - 단순 출력 토큰 가격만 보면 딥시크는 GPT-5.5 대비 약 34분의 1, 클로드 오퍼스 대비 약 29분의 1임.

> [!IMPORTANT]
> 이게 일시 프로모션이 아니라는 게 진짜 포인트임. 딥시크는 5월 말까지로 예정됐던 할인 정책을 영구화했고, 시장에서는 AWS 초창기식 가격 파괴 전략과 비슷하게 보고 있음.

## 성능은 느리지만 싸게 많이 돌리기 좋음

- 딥시크 V4-프로가 무조건 최고 성능이라는 얘기는 아님. 다만 가격 대비 성능이 무시하기 어려운 수준이라는 게 핵심임.
  - 독립 평가기관 Artificial Analysis 기준, 딥시크 V4는 테스트된 11개 모델 중 속도는 가장 뒤처졌음.
  - 하지만 인텔리전스 평가는 52점으로 꽤 높은 편이었음.
  - 같은 평가에서 GPT-5.5는 60점으로 1위, 클로드 오퍼스 4.7은 57점으로 2위였음.

- 100만 토큰당 성능비로 보면 딥시크가 확 튐.
  - 딥시크는 2.2달러.
  - GPT-5.5는 4.3달러, 클로드 오퍼스 4.7은 4.1달러로 후미권.
  - 이 수치는 가격 인하 전 기준이라, 인하 이후에는 딥시크의 비용 우위가 더 커질 가능성이 큼.

- 딥시크가 특히 유리한 영역은 장문 분석, 코드 생성, 대규모 추론 작업임.
  - 100만 토큰 수준의 긴 컨텍스트 처리 능력과 대규모 출력 길이를 감안하면, 문서 많이 넣고 많이 뽑는 작업에 매력적임.
  - 반복 호출이 많은 기업용 AI 서비스에서는 API 비용 자체가 운영비를 좌우함.
  - 고객지원 자동화, 대량 문서 검토, 상시 코파일럿, 멀티에이전트 워크플로 같은 곳에서 비용 차이가 바로 경쟁력으로 이어질 수 있음.

- 약점도 분명함. 싸다고 아무 데나 넣으면 답답할 수 있음.
  - Artificial Analysis는 V4-프로가 속도가 느리고 출력이 장황하다고 봤음.
  - 추론 최대화 모드에서는 지연시간도 크다고 지적함.
  - 장황한 출력은 코딩 분석에는 도움이 될 수 있지만, API 비용 증가와 응답 속도 저하, 토큰 낭비로도 이어짐.

## 화웨이 칩과 중국 AI 생태계가 배경에 있음

- 외신들은 딥시크의 가격 인하 배경으로 화웨이 어센드 칩 공급 강화를 보고 있음.
  - 딥시크는 자사 AI 모델을 화웨이 어센드 칩에 최적화해 운영하고 있음.
  - 미국의 대중국 반도체 규제로 엔비디아 최신 GPU 확보가 어려워진 중국 기업들이 자체 생태계를 구축하는 흐름과 맞물림.

- 딥시크는 이미 일부 지역에서 존재감이 큼.
  - 마이크로소프트 AI 포 굿 랩 보고서에 따르면 2025년 말 기준 딥시크 국가별 점유율은 중국 89%, 벨라루스 56%, 쿠바 49%, 러시아 43%.
  - 오픈소스 모델과 완전 무료 챗봇 제공으로 금융·기술 장벽을 낮췄고, 미국 서비스 접근이 제한된 지역에서 빠르게 성장했다는 설명임.

- 투자 측면에서도 판이 커지고 있음.
  - 딥시크는 최근 첫 투자 유치를 추진 중임.
  - 창업자 량원펑이 그동안 자신의 헤지펀드 자금으로 운영해왔고, 이번에 처음으로 30억~40억 달러 규모 투자를 유치하려는 계획임.
  - 기업가치는 최대 500억 달러까지 거론됨.
  - 중국 반도체 국가 펀드와 텐센트 등이 참여하면서 중국 대표 AI 기업으로 키우려는 움직임도 보임.

## 기업들은 결국 모델을 섞어 쓰게 될 가능성이 큼

- 오픈AI와 앤트로픽은 여전히 프리미엄 전략을 유지 중임.
  - 최고 수준 추론 성능, 안정성, 기업 보안, 생태계 통합을 앞세움.
  - 다만 딥시크가 초저가 정책을 유지하면 가격 인하 압박을 피하기 어려움.

- 컴퓨터월드는 AI 시장이 클라우드처럼 멀티모델 체제로 갈 가능성을 제시함.
  - 높은 정확도가 필요한 작업은 GPT나 클로드를 쓰고,
  - 특정 내부 업무는 도메인 특화 모델을 쓰고,
  - 반복 업무는 저가 모델을 쓰는 식임.
  - 오케스트레이션 계층에서 작업 성격에 따라 모델을 자동 선택하는 구조가 중요해질 수 있음.

- 단, 딥시크가 미국·유럽 엔터프라이즈 시장을 바로 먹기는 쉽지 않다는 지적도 있음.
  - 글로벌 기업 생태계 부족.
  - 엔터프라이즈 지원 체계 미흡.
  - 지식재산권 논란.
  - AWS, 애저, 구글 클라우드와의 통합 부족.
  - 싸고 똑똑한 모델이어도, 기업 구매에서는 지원·보안·통합이 꽤 큰 변수임.

> [!WARNING]
> 표시된 100만 토큰당 가격만 보고 비용을 계산하면 틀릴 수 있음. 컨텍스트 길이 할증, 캐시 토큰, 호스팅 가격, 토크나이저 차이, 추론 모델의 싱킹 토큰까지 들어가면 실제 청구액이 크게 달라짐.

- 토크나이저 차이도 비용 함정임.
  - 토크나이저는 텍스트를 AI 모델이 처리하는 토큰 단위로 쪼개는 도구임.
  - 같은 문장이라도 모델마다 토큰 수가 달라지고, 과금도 달라짐.
  - 기사에서는 클로드 오퍼스 4.7의 토큰 인플레이션 사례가 언급됨.
  - 새 토크나이저가 같은 텍스트를 더 잘게 쪼개면서 12~35%, 코딩 작업에서는 최대 45% 이상 더 많은 토큰을 만들었다는 주장임.
  - 100만 토큰당 가격이 같아도 실제 사용자는 같은 질문에 약 1.3배 더 낼 수 있다는 얘기임.

---

## 기술 맥락

- 딥시크 가격 인하의 핵심은 모델 품질 경쟁이 비용 구조 경쟁으로 넘어가고 있다는 점이에요. 기업 서비스에서는 모델을 한두 번 호출하는 게 아니라 고객지원, 문서 처리, 코드 분석처럼 반복 호출이 계속 발생하거든요. 그래서 토큰당 가격이 조금만 내려가도 월 운영비가 크게 달라져요.

- 멀티모델 아키텍처가 중요해지는 이유도 여기에 있어요. 모든 요청을 가장 비싼 프론티어 모델로 보내면 품질은 좋을 수 있지만 비용이 터져요. 반대로 모든 요청을 저가 모델에 보내면 정확도나 안정성이 부족할 수 있어서, 작업 난이도와 위험도에 따라 모델을 라우팅하는 계층이 필요해져요.

- 딥시크는 가격과 긴 컨텍스트에서 강점을 보이지만 속도와 지연시간 약점이 있어요. 그래서 실시간 채팅처럼 빠른 응답이 중요한 곳보다는, 대량 문서 분석이나 백그라운드 코드 리뷰처럼 시간이 조금 걸려도 비용 효율이 중요한 작업에 먼저 들어가기 쉬워요.

- 실제 비용 계산에서는 토크나이저와 싱킹 토큰을 꼭 봐야 해요. 같은 100만 토큰 가격이라도 어떤 모델은 같은 한국어·코드 입력을 더 잘게 쪼개고, 추론 모델은 내부 사고 과정에 추가 토큰을 쓰거든요. 앞으로 AI 제품을 운영하는 팀은 모델 성능표뿐 아니라 실제 청구 로그 기준으로 비용을 비교해야 해요.

## 핵심 포인트

- 딥시크 V4-프로 가격이 입력 100만 토큰당 3위안, 출력 100만 토큰당 6위안으로 인하됨
- 출력 토큰 기준 GPT-5.5 대비 약 34분의 1, 클로드 오퍼스 4.7 대비 약 29분의 1 수준
- 속도와 지연시간 약점은 있지만 장문 분석, 코드 생성, 반복 호출 많은 기업 서비스에서 비용 경쟁력이 큼

## 인사이트

모델 선택 기준이 ‘제일 똑똑한가’에서 ‘이 작업에 이 가격이면 충분한가’로 바뀌는 중이야. 개발팀 입장에서는 이제 모델 라우팅, 비용 계측, 토큰 최적화가 제품 아키텍처의 일부가 됨.
