---
title: "중국 오픈소스 AI, 토큰 단가로 판을 흔들기 시작했다"
published: 2026-07-02T15:05:03.441Z
canonical: https://jeff.news/article/4533
---
# 중국 오픈소스 AI, 토큰 단가로 판을 흔들기 시작했다

중국 Z.ai의 GLM-5.2는 100만 토큰 컨텍스트를 지원하면서도 입력 100만 토큰당 0.94달러, 출력 100만 토큰당 3달러라는 낮은 가격을 제시했다. 성능 지표에서도 클로드 페이블, GPT 5.5를 바짝 따라가고 구글 제미나이 프로 3.1을 앞선다는 평가가 나오며, AI 경쟁의 병목이 지능보다 운영 단가와 배치로 이동하고 있다는 관점이 제시됐다.

- 중국 오픈소스 모델이 AI 업계에 주는 충격은 이제 “성능 괜찮네” 수준이 아니라 “이 가격이면 운영 구조가 바뀌겠는데?” 쪽으로 넘어가는 중
  - Z.ai, 예전 지푸AI가 6월 16일 공개한 GLM-5.2가 대표 사례로 언급됨
  - 오픈라우터(OpenRouter) 기준 가격은 입력 100만 토큰당 0.94달러, 출력 100만 토큰당 3달러
  - 원화로는 각각 약 1,300원, 약 4,200원 수준이라 장기 작업을 돌리는 서비스 입장에서는 꽤 공격적인 가격임

- GLM-5.2는 싸기만 한 모델로 소개되지 않음
  - 100만 토큰 컨텍스트(context)를 지원한다고 되어 있음
  - 코딩 에이전트와 장기 작업에 맞춰 설계된 모델로 언급됨
  - 긴 문서, 코드베이스, 반복 계획을 다루는 작업에서는 컨텍스트 크기와 토큰 단가가 같이 중요해짐

> [!IMPORTANT]
> 입력 100만 토큰 0.94달러, 출력 100만 토큰 3달러라는 가격은 에이전트 제품에 꽤 큰 의미가 있음. 에이전트는 생각보다 토큰을 많이 먹기 때문에, 단가가 내려가면 기능 실험의 폭이 바로 넓어짐.

- 성능 지표도 그냥 저가형 포지션은 아님
  - 아티피셜 애널리시스(Artificial Analysis) 기준 지능점수 51점으로 소개됨
  - 클로드 페이블, GPT 5.5를 바짝 쫓는 수준이라고 평가됨
  - 구글 제미나이 프로 3.1의 46점을 앞선다는 비교도 나옴

- 기사에서 던지는 관점은 “병목은 지능이 아니라 단가와 배치다”에 가까움
  - 모델 성능이 일정 수준 이상 올라오면, 다음 질문은 어느 모델을 얼마나 싸게, 어디에, 어떤 조합으로 배치하느냐가 됨
  - 오픈라우터 같은 모델 거래소가 주목받는 이유도 여기 있음
  - 개발자는 특정 모델 하나를 신성시하기보다, 작업별로 모델을 갈아 끼우는 식의 운영을 고민하게 됨

- 오픈AI 코덱스도 ‘모델의 부품화’ 흐름을 보여주는 사례로 언급됨
  - 하나의 거대한 만능 모델보다, 작업에 맞는 모델과 도구를 조합하는 방향이 강해지고 있다는 얘기임
  - 코딩, 검색, 장기 추론, 문서 처리처럼 워크로드별 비용 구조가 다르기 때문

---

## 기술 맥락

- 이 기사에서 중요한 선택은 “가장 똑똑한 모델 하나를 고정으로 쓸 것인가, 작업별로 가격과 성능이 맞는 모델을 골라 쓸 것인가”예요. 토큰 단가가 이렇게 벌어지면 후자가 점점 현실적인 운영 방식이 돼요.

- 100만 토큰 컨텍스트는 멋진 숫자지만, 비용과 같이 봐야 해요. 긴 문서를 다 넣을 수 있어도 입력 토큰 가격이 비싸면 제품 기능으로 자주 쓰기 어렵거든요.

- 코딩 에이전트에서는 이 문제가 더 커져요. 파일 읽기, 계획 세우기, 수정, 테스트 로그 분석을 반복하다 보면 출력보다 입력 토큰이 엄청 쌓이고, 모델 호출 횟수도 많아져요.

- 그래서 오픈라우터 같은 모델 선택 레이어가 중요해져요. 고난도 추론은 비싼 모델에 맡기고, 반복적이거나 긴 컨텍스트 작업은 저렴한 모델에 맡기는 식으로 비용 구조를 직접 설계할 수 있기 때문이에요.

## 핵심 포인트

- Z.ai의 GLM-5.2는 입력 100만 토큰 0.94달러, 출력 100만 토큰 3달러로 공개됨
- 100만 토큰 컨텍스트를 지원하고 코딩 에이전트와 장기 작업에 맞춰 설계된 모델로 소개됨
- 아티피셜 애널리시스 기준 지능점수 51점으로 클로드 페이블과 GPT 5.5를 추격하고, 제미나이 프로 3.1의 46점을 앞선다고 언급됨
- 오픈라우터 같은 모델 거래소와 모델 부품화 흐름이 AI 운영 경제의 핵심으로 제시됨

## 인사이트

이 기사의 핵심은 ‘중국 모델이 좋아졌다’보다 ‘이 정도 성능이 이 가격에 나오면 제품 설계가 바뀐다’에 가깝다. 에이전트나 장기 컨텍스트 작업은 토큰을 많이 먹기 때문에, 단가가 내려가면 그동안 비용 때문에 막혔던 기능이 갑자기 현실적인 선택지가 된다.