---
title: "중국 오픈소스 AI 공세에 챗GPT 가격도 내려갈까"
published: 2026-06-12T07:05:03.216Z
canonical: https://jeff.news/article/4092
---
# 중국 오픈소스 AI 공세에 챗GPT 가격도 내려갈까

중국산 저가 AI와 오픈소스 모델 확산으로 기업용 AI 시장에 가격 경쟁이 붙고 있다. 기업들은 단순 작업엔 저렴한 모델을 쓰고, 어려운 작업에만 챗GPT·클로드·제미나이를 호출하는 이원화 전략으로 비용을 최대 95%까지 줄이려 한다.

- 중국산 저가 AI와 오픈소스 모델 확산으로 AI 업계에 가격 전쟁이 붙는 분위기임
  - 월스트리트저널 보도에 따르면 오픈AI의 챗GPT, 앤트로픽의 클로드 같은 선두 모델에도 요금 인하 압박이 커지고 있음
  - 기업 입장에선 AI 에이전트를 많이 돌릴수록 비용이 눈덩이처럼 불어나니, 이제 “성능 최고”만 보고 쓰기 어려워진 상황임

- 기업들이 쓰는 방식은 점점 투트랙으로 바뀌고 있음
  - 단순 반복 작업은 알리바바 같은 중국 기업 모델이나 오픈소스 기반 자체 AI에 맡김
  - 고차원적 판단이나 어려운 작업에서만 챗GPT, 클로드, 구글 제미나이 같은 고급 모델을 호출함
  - 경영진들은 이런 방식으로 AI 비용을 최대 95%까지 줄일 수 있다고 봄. 이 정도면 그냥 최적화가 아니라 생존 전략에 가까움

> [!IMPORTANT]
> 이제 모델 선택 기준은 “토큰당 얼마냐”에서 “작업 하나를 끝내는 데 총 얼마가 드느냐”로 이동 중임. 싼 모델이 여러 번 실패하면 비싼 모델 한 번보다 더 비쌀 수 있음.

- AI 스타트업 러브레이스의 사례가 이 흐름을 잘 보여줌
  - 앤드루 무어 대표는 자사 AI 시스템이 비용 면에서 “인색하고 깐깐하게” 움직이도록 설계됐다고 설명함
  - 기본적으로 가장 싼 모델에서 답을 뽑아내고, 정말 필요할 때만 일시적으로 고가 모델로 넘어가는 구조임
  - 개발팀 관점에선 모델 자체보다 라우팅 정책, 실패 감지, 재시도 전략이 더 중요해지는 구간임

- 오픈AI도 가격 인하를 검토 중인 것으로 알려짐
  - 고객 이탈에 대응하기 위해 대대적인 AI 요금 인하를 검토하고 있다는 보도가 나옴
  - 오픈AI 내부에선 작년에 전산 자원을 현재 시세보다 싸게 대거 조달해 둔 만큼, 비축 자원으로 가격 경쟁에서 버틸 수 있다고 보는 분위기라고 함
  - 다만 오픈AI와 앤트로픽 모두 기업공개(IPO)를 추진 중이라, 가격 전쟁이 심해지면 수익성과 투자자 심리에 부담이 될 수 있음

- 폐쇄형 모델의 프리미엄도 예전 같지 않다는 관측이 나옴
  - 컬럼비아대 비샬 미스라 부학장은 “모든 기업이 양자 중력 역학을 아는 고차원 모델이 필요하진 않다”고 말함
  - 오픈소스 모델 성능이 충분히 좋아지면서, 챗GPT 같은 폐쇄형 모델이 누리던 프리미엄 효과가 줄어들 수 있다는 얘기임
  - 실제 업무 대부분이 요약, 분류, 추출, 간단한 코드 보조라면 최고급 모델만 고집할 이유가 줄어듦

- 그래도 “싼 모델이 무조건 싸다”는 결론은 위험함
  - 기사에 따르면 앤트로픽 최신 모델의 토큰당 가격은 딥시크 오픈소스 모델보다 50배 넘게 비쌀 수 있음
  - 하지만 고가 모델이 기술적으로 4~6개월 앞서 있어 어려운 과제를 훨씬 적은 토큰으로 끝내면, 최종 비용은 오히려 낮아질 수 있음
  - 앤트로픽도 기업들이 이제 토큰당 단가가 아니라 작업당 비용으로 모델을 평가한다고 설명함

- 개발 조직이 봐야 할 포인트는 명확함
  - 모델별 단가표만 비교하면 함정에 빠질 수 있음
  - 실제 업무 샘플로 성공률, 재시도 횟수, 평균 토큰 사용량, 지연 시간, 사람이 다시 고치는 비용까지 같이 봐야 함
  - AI 도입이 커질수록 “무슨 모델을 쓰느냐”보다 “언제 어떤 모델을 부르느냐”가 비용 경쟁력이 될 가능성이 큼

---

## 기술 맥락

- 이 기사에서 중요한 선택은 고급 모델 하나에 몰빵하지 않고, 작업 난이도에 따라 모델을 나눠 쓰는 방식이에요. AI 에이전트는 호출 횟수가 많고 중간 추론도 길어져서, 작은 단가 차이가 월 비용으로는 크게 벌어지거든요.

- 저가 모델을 먼저 쓰는 전략은 캐시나 계층형 스토리지와 비슷하게 볼 수 있어요. 쉬운 작업은 싼 자원으로 처리하고, 실패하거나 난도가 높을 때만 비싼 자원으로 올리는 식이에요.

- 그래서 토큰당 가격만 보면 판단이 흔들릴 수 있어요. 어떤 모델은 토큰은 싸지만 답을 여러 번 고쳐야 하고, 어떤 모델은 비싸지만 한 번에 끝내서 작업당 비용이 낮아질 수 있거든요.

- 실무팀이 해야 할 일은 모델 벤치마크를 그대로 믿는 게 아니라, 자기 회사 업무 데이터로 라우팅 기준을 만드는 거예요. 요약, 분류, 코드 수정, 고객 응대처럼 작업별로 성공률과 비용을 따로 봐야 제대로 된 의사결정이 가능해요.

## 핵심 포인트

- 기업들이 저가 모델과 고급 폐쇄형 모델을 섞어 쓰는 이원화 전략을 확산 중
- AI 에이전트 사용량 증가로 기업용 AI 비용 부담이 커지며 가격 인하 압박 발생
- 오픈AI는 고객 이탈을 막기 위해 대규모 요금 인하를 검토 중인 것으로 알려짐
- 토큰당 가격보다 작업 하나를 끝내는 데 드는 전체 비용이 더 중요한 평가 기준으로 부상

## 인사이트

AI 비용 최적화가 이제 인프라 비용 최적화처럼 다뤄지기 시작했다. 개발팀 입장에선 ‘제일 좋은 모델 하나’보다 라우팅, 평가, fallback 설계가 더 중요한 역량이 될 수 있다.
