---
title: "미국 기업들이 딥시크에 돈을 보내는 이유, 결국 토큰값이 너무 비싸서임"
published: 2026-06-06T01:05:02.659Z
canonical: https://jeff.news/article/3767
---
# 미국 기업들이 딥시크에 돈을 보내는 이유, 결국 토큰값이 너무 비싸서임

우버의 AI 코딩 도구 비용 폭증과 램프의 기업 지출 데이터는 기업들이 오픈AI, 앤트로픽만 쓰는 전략에서 벗어나고 있음을 보여준다. 딥시크는 미국 기업 신규 결제 트렌딩 1위에 올랐지만, 핵심은 중국 서버 자체가 아니라 29배에서 34배까지 벌어진 가격 차이다. 글은 한국 기업도 멀티모델 전략, 토큰 비용 거버넌스, 응용 계층 경쟁력으로 AI 조달 전략을 바꿔야 한다고 본다.

## AI 코딩 도구, 좋긴 한데 계산서가 먼저 터짐

- 우버가 올해 AI 코딩 도구 예산을 4개월 만에 다 써버렸다는 얘기가 이 글의 출발점임
  - 약 5000명의 엔지니어가 에이전틱 코딩 도구를 사용함
  - 월 사용료가 엔지니어당 150달러에서 많게는 2000달러까지 올라감
  - 결국 우버는 직원 1인당 월 1500달러 사용 한도를 설정함

- 비용 대비 효과가 아직 명확하지 않다는 내부 시각도 나옴
  - 우버 COO 앤드루 맥도널드는 AI 도구 사용량과 실제 소비자 기능 개선 사이의 연결 고리가 아직 보이지 않는다고 말함
  - 즉 “개발자가 AI를 많이 쓴다”와 “제품이 실제로 좋아진다” 사이의 증거가 아직 약하다는 뜻임

- 이건 우버만의 문제가 아님
  - 미국 기업용 지출 관리 플랫폼 램프에 따르면 기업당 AI 토큰 지출은 2025년 1월 이후 13배 증가함
  - 에이전틱 AI는 사람이 한 번 시켜도 내부적으로 여러 번 추론하고 실행하니까 토큰 소비가 기하급수적으로 늘기 쉬움

> [!IMPORTANT]
> AI 도구 비용은 이제 “개발툴 구독료”가 아니라 사용량이 폭발할 수 있는 인프라 비용에 가까워지고 있음. 특히 에이전틱 AI는 사람이 아니라 기계의 반복 루프가 비용을 만든다는 게 핵심임.

## 미국 기업들이 딥시크에 직접 결제하기 시작함

- 램프의 2026년 6월 트렌딩 소프트웨어 벤더 1위는 중국 AI 스타트업 딥시크였음
  - 램프는 5만 개 이상 미국 기업의 법인카드와 청구 데이터를 보는 플랫폼임
  - 이 순위는 특정 벤더에 처음 결제한 기업 수를 기준으로 해서, 신규 도입 흐름을 보여주는 선행 지표에 가까움

- 중요한 건 “오픈소스 모델을 내려받아 자체 서버에서 돌린다”가 아니라 “딥시크에 직접 결제한다”는 점임
  - 램프 수석 이코노미스트 아라 카라지안은 미국 기업들이 딥시크에 직접 결제하고 있다고 밝힘
  - 이 말은 기업 데이터가 중국에 있는 딥시크 서버로 오갈 수 있다는 뜻이라, 미중 기술 갈등을 생각하면 꽤 센 선택임

- 물론 아직 시장 점유율 자체는 작음
  - 램프 AI 인덱스 기준 2026년 4월 딥시크의 미국 기업 도입률은 0.1퍼센트임
  - 같은 시점 앤트로픽은 34.4퍼센트, 오픈AI는 32.3퍼센트로 시장을 양분함
  - 딥시크가 시장을 뒤집었다기보단, 새로 시도하는 기업이 빠르게 늘고 있다는 신호에 가까움

## 이유는 단순함. 가격 차이가 너무 큼

- 딥시크 V4 프로의 API 가격은 출력 토큰 100만 개당 0.87달러임
  - 딥시크는 원래 5월 31일 종료 예정이던 75퍼센트 할인 가격을 영구화함
  - 캐시 히트 가격은 100만 토큰당 0.0036달러까지 내려감

- 경쟁사 플래그십 모델과 비교하면 숫자가 확 튐
  - 오픈AI GPT-5.5는 출력 토큰 100만 개당 30달러임
  - 앤트로픽 클로드 오퍼스 4.7은 출력 토큰 100만 개당 25달러임
  - 딥시크 V4 프로와 비교하면 오픈AI는 약 34배, 앤트로픽은 약 29배 비쌈

- 벤치마크 비용 비교도 비슷한 그림임
  - 아티피셜 애널리시스 기준 같은 지능 지수 테스트를 수행하는 데 딥시크 V4 프로는 268달러가 들었음
  - 클로드 오퍼스 4.7은 4811달러가 들어 약 18배 차이가 남
  - 기업 입장에선 “성능이 조금 낮아도 18배 싸면?”이라는 질문을 안 할 수가 없음

- 딥시크의 저가 전략은 단순 할인만은 아니라고 주장됨
  - 딥시크 V4 시리즈는 화웨이 어센드 950 칩에 최적화됐다고 함
  - 미국의 반도체 수출 통제로 엔비디아 GPU를 쓰기 어려워진 상황에서, 중국 내 저비용 추론 인프라를 만든 셈임
  - 딥시크는 장문맥 추론 비용도 전작 대비 약 4분의 1로 낮췄다고 밝힘

## 오픈소스 추론 플랫폼도 같이 치고 올라옴

- 램프의 5월 데이터에서 트렌딩 상위 10개 벤더 중 4개가 AI 추론 플랫폼이었음
  - 파이어웍스AI, 팔AI, 딥인프라, 바스트AI가 포함됨
  - 이들은 오픈AI나 앤트로픽을 거치지 않고 더 넓고 저렴한 모델 선택지를 기업에 제공함

- 기업들이 모델을 업무별로 나눠 쓰기 시작했다는 해석이 나옴
  - 어려운 문제에는 비싼 프론티어 모델을 씀
  - 나머지 작업에는 저가 모델이나 오픈소스 모델을 씀
  - 이게 실무에서 말하는 모델 라우팅 전략임

- 성능 격차도 좁아지는 중이라고 글은 봄
  - 하비의 리걸 에이전트 벤치마크에서 중국 지푸AI의 GLM-5.1은 오픈소스 모델 중 최고점을 기록함
  - 클로드 오퍼스 4.7 바로 아래, GPT-5.5와 대등한 수준으로 언급됨
  - 문샷AI의 키미 K2.6과 딥시크 V4 프로도 GPT-5.5 바로 아래에 자리 잡았다고 함

## 그래도 중국 서버로 데이터 보내는 건 리스크가 큼

- 딥시크를 직접 쓰는 선택에는 보안과 규제 리스크가 분명히 있음
  - 유럽에서는 이탈리아가 2025년 1월 딥시크를 차단함
  - 독일도 데이터 보호 우려로 앱스토어 퇴출을 검토한 바 있음
  - 미국에서도 연방 정부 차원의 규제 논의가 진행 중임

- 그런데도 기업들이 시도하는 이유는 비용 압박이 그만큼 현실적이기 때문임
  - 램프 측도 이 흐름이 얼마나 오래갈지는 과대평가하지 않겠다고 말함
  - 하지만 딥시크 자체가 꺾이더라도 가격 압력의 방향은 쉽게 되돌아가기 어려움
  - 파이어웍스AI나 딥인프라처럼 미국 내 서버에서 오픈소스 모델을 저렴하게 돌리는 선택지도 이미 열려 있음

> [!WARNING]
> 저렴하다고 바로 외부 AI 서버에 민감 데이터를 보내면 보안, 개인정보, 규제 이슈가 한 번에 터질 수 있음. 비용 최적화와 데이터 거버넌스를 분리해서 보면 안 됨.

## 한국 기업이 읽어야 할 포인트

- 첫째, 단일 벤더 중심 AI 조달 전략은 점점 비싸질 가능성이 큼
  - 모든 작업에 최고가 프론티어 모델을 쓸 이유는 없음
  - 정밀도가 중요한 작업과 속도, 비용이 중요한 작업을 나눠 모델을 배정하는 게 합리적임

- 둘째, 토큰 비용을 별도 예산 항목으로 관리해야 함
  - 우버 사례처럼 AI 도구 도입은 쉬운데 비용 통제는 어려움
  - 에이전틱 AI 시대의 사용량은 사람의 클릭 수가 아니라 기계의 작업 루프가 결정함
  - 사용량 예측 모델과 비용 거버넌스를 지금부터 설계해야 함

- 셋째, 모델 가격 하락의 수혜자가 될 준비가 필요함
  - 딥시크는 첫 외부 투자에서 약 74억 달러, 우리 돈 약 10조 원을 확보함
  - 기업가치는 520억에서 590억 달러로 평가됨
  - 텐센트가 약 15억 달러, CATL이 약 7억 달러를 투자했고 창업자 량원펑도 약 30억 달러를 직접 출자함
  - 단기 수익보다 시장 점유율을 우선하는 가격 전쟁이 당분간 이어질 수 있다는 해석이 가능함

- 결론은 꽤 냉정함. AI 모델 자체는 점점 싸지고, 가치는 그 위에서 뭘 만드느냐로 옮겨갈 가능성이 큼
  - 클라우드가 범용재가 된 뒤 SaaS 기업들이 가치를 만든 것과 비슷한 흐름임
  - 한국 기업이 지금 물어야 할 질문은 “어떤 모델이 최고냐”보다 “어떤 문제를 어떤 비용 구조로 풀 거냐”에 가까움

---

## 기술 맥락

- 이 글에서 제일 중요한 선택은 단일 프론티어 모델을 계속 쓰느냐, 아니면 업무별로 모델을 라우팅하느냐예요. 토큰 비용이 13배 늘고 출력 토큰 가격이 30달러와 0.87달러로 갈라지면, 그냥 좋은 모델 하나로 밀어붙이는 방식은 재무팀에서 먼저 막힐 가능성이 커요.

- 모델 라우팅이 필요한 이유는 모든 요청이 같은 난이도가 아니기 때문이에요. 법률 검토나 핵심 코드 변경처럼 틀리면 큰일 나는 작업은 비싼 모델을 쓰고, 분류, 초안, 단순 변환 같은 작업은 저렴한 모델로 돌리는 식의 분리가 비용과 품질을 같이 잡는 현실적인 방법이에요.

- 에이전틱 AI에서는 비용 예측이 더 까다로워져요. 사람이 한 번 요청해도 에이전트가 내부에서 검색하고, 코드 쓰고, 실패하면 다시 시도하는 루프를 돌기 때문에 토큰 사용량이 사람의 체감 사용량과 다르게 튀거든요.

- 딥시크를 직접 쓰는 건 가격 면에선 매력적이지만, 데이터가 어디로 가는지가 문제예요. 그래서 한국 기업은 “중국 서버를 쓸지 말지”보다 먼저 데이터 민감도, 모델 배치 위치, 감사 로그, 벤더 계약 조건을 묶어서 봐야 해요.

- 결국 모델 가격이 내려가면 경쟁력은 모델 선택 그 자체가 아니라 운영 체계로 옮겨가요. 어떤 요청을 어떤 모델로 보내고, 얼마까지 쓰게 하고, 민감 데이터는 어디서 차단할지 정하는 레이어가 실제 차별점이 되는 거죠.

## 핵심 포인트

- 우버는 약 5000명의 엔지니어가 에이전틱 코딩 도구를 쓰며 AI 코딩 도구 예산을 4개월 만에 소진했고 1인당 월 1500달러 한도를 걸었음
- 램프 기준 기업당 AI 토큰 지출은 2025년 1월 이후 13배 증가했고, 2026년 6월 트렌딩 소프트웨어 벤더 1위는 딥시크였음
- 딥시크 V4 프로 출력 토큰 100만 개 가격은 0.87달러로, 오픈AI GPT-5.5의 30달러보다 약 34배 저렴함
- 같은 지능 지수 테스트 비용은 딥시크 V4 프로 268달러, 클로드 오퍼스 4.7 4811달러로 약 18배 차이가 났음
- 한국 기업은 단일 벤더가 아니라 작업별로 모델을 나누는 모델 라우팅과 토큰 비용 거버넌스를 준비해야 함

## 인사이트

이 글의 핵심은 딥시크 찬양이 아니라, AI 모델 시장이 성능 경쟁에서 비용 경쟁으로 넘어가고 있다는 신호다. 국내 기업도 “제일 좋은 모델 하나”보다 “어떤 업무에 어떤 가격대 모델을 쓸 것인가”를 설계해야 할 시점임.