본문으로 건너뛰기
피드

코인베이스도 중국 오픈웨이트 AI를 기본값으로, 기업 AI 시장이 비용 싸움으로 넘어가는 중

ai-ml 약 5분
vote
0
댓글
북마크

코인베이스가 사내 AI 기본 모델로 중국 즈푸AI의 GLM 5.2, 문샷AI의 키미 2.7 같은 오픈웨이트 모델을 실험 중이다. 토큰 사용량은 폭증했는데 AI 지출은 거의 절반으로 줄었다는 게 핵심이고, 기업들이 모든 업무에 최고급 프런티어 모델을 쓰는 전략에서 벗어나고 있다.

  • 1

    코인베이스는 엔지니어가 원하는 모델을 고를 수 있게 두되 기본값을 저렴한 중국계 오픈웨이트 모델로 바꾸는 실험을 하고 있다

  • 2

    GLM-5.2 출력 가격은 100만 토큰당 4.4달러로, GPT-5.5의 15달러 대비 약 30% 수준이다

  • 3

    기업들은 일반 업무와 대량 호출 작업은 저가 모델에, 고난도 추론과 민감한 분석은 미국 프런티어 모델에 맡기는 식으로 모델을 나눠 쓰기 시작했다

  • 4

    미국의 첨단 AI 통제가 강해질수록 내려받아 자체 서버에서 굴릴 수 있는 중국 오픈웨이트 모델의 매력이 커지는 역설이 생기고 있다

  • 코인베이스가 사내 AI 기본값을 중국계 저가 모델로 바꾸는 실험을 하고 있음

    • 브라이언 암스트롱 창업자는 토큰 사용량은 폭발적으로 늘었는데 AI 지출은 거의 절반으로 줄였다고 밝힘
    • 실험 대상은 즈푸AI의 GLM 5.2, 문샷AI의 키미 2.7 같은 오픈웨이트 모델
    • 엔지니어가 원하면 다른 모델도 고를 수 있지만, 기본값을 싼 모델로 두는 식으로 비용을 잡는 구조임
  • 핵심은 “모든 업무에 최고급 AI가 필요하냐”는 질문이 기업 내부에서 본격적으로 나오기 시작했다는 점임

    • 오픈AI, 앤스로픽, 구글의 최상위 모델은 성능은 좋지만 대량 호출에서는 비용이 꽤 무거움
    • 반면 중국 오픈웨이트 모델은 직접 내려받아 자체 서버에서 돌리거나 더 낮은 비용으로 쓸 수 있음
    • GLM-5.2의 출력 가격은 100만 토큰당 4.4달러로, GPT-5.5의 15달러와 비교하면 약 30% 수준임

중요

> 기업 입장에서는 모델 성능이 1등인지보다 “충분히 정확한 답을 얼마나 싸고 빠르게 내느냐”가 더 중요한 업무가 많음. AI를 많이 쓸수록 이 차이는 그냥 취향이 아니라 비용 구조가 됨.

  • 기업용 AI는 이제 모델 하나로 다 때우는 방식이 아니라, 업무별로 모델을 나눠 쓰는 쪽으로 가고 있음

    • 일반 업무, 고객 응대, 문서 처리, 코드 보조, 에이전트 실행처럼 호출량이 많은 작업은 저렴한 모델에 맡김
    • 복잡한 전략 판단, 고난도 추론, 민감한 보안 분석, 핵심 제품 설계는 미국 프런티어 모델을 쓰는 식임
    • 개발팀 기준으로 보면 내부 챗봇, 문서 요약, 반복 코드 보조 같은 곳부터 모델 라우팅을 고민하게 되는 흐름임
  • 중국 모델이 주목받는 배경에는 미국의 첨단 AI 통제 강화도 있음

    • 미국은 주요 AI 기업의 첨단 모델을 정부에 사전 제출해 성능과 위험성을 검토받도록 하는 방향으로 움직이고 있음
    • 첨단 AI가 안보 자산처럼 취급되면서 접근성과 통제 문제가 커지는 중임
    • 반대로 중국 오픈웨이트 모델은 공개된 뒤 내려받아 자체 서버에서 실행할 수 있다는 점이 기업에게 매력으로 작용함
  • 그래서 이 뉴스는 “중국 모델이 미국 기업에 들어갔다”보다 더 큰 얘기임

    • AI 도입의 기준이 데모 성능에서 운영 비용, 배포 통제, 업무별 적합성으로 이동하고 있음
    • 코인베이스 같은 대형 기술 기업이 기본 모델을 바꿔 비용을 줄였다는 건 다른 기업에도 꽤 강한 신호가 됨
    • 한국 기업이나 개발팀도 앞으로는 “어떤 모델이 제일 똑똑한가”보다 “이 업무에는 어느 정도 모델이면 충분한가”를 먼저 따지게 될 가능성이 큼

기술 맥락

  • 여기서 중요한 선택은 단일 대규모 언어 모델(LLM)에 모든 요청을 보내지 않고, 업무 성격에 따라 모델을 나누는 거예요. 왜냐하면 문서 정리나 고객 응대처럼 반복 호출이 많은 작업은 최고 성능보다 토큰 단가가 비용을 더 크게 흔들거든요.

  • 오픈웨이트 모델을 기본값으로 두는 방식은 자체 서버 운영이나 프라이빗 배포를 염두에 둔 선택이에요. 왜냐하면 API 호출만 쓰는 구조보다 인프라 통제권이 커지고, 사용량이 커질수록 단가를 직접 최적화할 여지가 생기기 때문이에요.

  • 코인베이스 사례가 흥미로운 건 사용량이 줄어서 비용이 줄어든 게 아니라는 점이에요. 토큰 사용량은 오히려 폭증했는데 지출이 절반 가까이 줄었다는 얘기라, 모델 라우팅과 기본값 설정만으로도 운영비가 크게 달라질 수 있다는 뜻이에요.

  • 실무에서는 이 흐름이 AI 게이트웨이나 모델 라우터 같은 레이어로 이어질 가능성이 커요. 왜냐하면 제품 코드 곳곳에서 모델을 직접 고르게 두면 비용·품질·보안 정책을 일관되게 관리하기 어렵기 때문이에요.

이건 단순히 중국 AI가 싸다는 얘기가 아니라, 기업용 AI 운영이 드디어 단일 최강 모델 숭배에서 비용 최적화 문제로 넘어갔다는 신호에 가깝다. 한국 개발팀도 내부 에이전트, 문서 처리, 코드 보조를 무조건 비싼 모델에 태울 필요가 있는지 다시 계산하게 될 가능성이 크다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

클로드가 애저 안으로 들어옴…앤트로픽·엔비디아·마이크로소프트 동맹 본격 가동

앤트로픽의 클로드 모델군이 엔비디아 블랙웰 울트라 기반 마이크로소프트 애저 클라우드에 정식 배포됐다. 이제 애저 고객은 외부 호출이 아니라 애저 내부에서 클로드를 직접 구동할 수 있어, 데이터 역외 이전 규제가 있는 기업에게 꽤 큰 변화다.

ai-ml

백악관 AI 규제 강화, 오픈소스 모델엔 오히려 기회 될까

미국 백악관의 AI 규제 강화 흐름 속에서 오픈소스 AI 모델이 상대적으로 주목받을 수 있다는 분석이 나왔다. 폐쇄형 모델에 대한 공급 안정성, 규제 리스크, 특정 업체 의존 문제가 커지면서 개발자와 기업이 오픈소스 대안을 더 진지하게 보고 있다는 내용이다.

ai-ml

한국은행, AI 데이터센터 투자가 미국 경제 성장축 됐다고 분석

한국은행 뉴욕 사무소가 AI 확산에 따른 컴퓨팅 수요와 데이터센터 투자를 미국 경제의 핵심 성장 동력으로 봤다. 미국에는 현재 데이터센터 4,378개가 가동 중이고, 약 2,700개가 건설 중이거나 계획 중이며, AI 반도체와 서버의 경제적 수명은 2∼3년에 불과해 투자 사이클이 계속 이어질 수 있다는 분석이다.

ai-ml

국제결제은행, AI 투자 열풍이 금융시장 흔들 수 있다고 경고

국제결제은행(BIS)이 AI 부문으로 몰리는 투자 열풍이 장기 침체와 금융시장 불안을 부를 수 있다고 경고했다. 하이퍼스케일러들은 내년까지 AI 인프라에 1조 달러 이상을 쏟아부을 예정이지만, 이제는 막대한 지출이 실제 현금 흐름과 이익으로 이어지는지 검증해야 한다는 메시지다.

ai-ml

GS, 산업 현장 안전관리 AI를 중소기업에 무상 제공

GS그룹이 안전관리 AI 에이전트 ‘에어(AIR)’를 중소기업에 무상 제공하고 있다. 작업명과 설명만 넣으면 생성형 AI가 공정, 위험요인, 위험등급, 예방 대책을 자동으로 만들고, 실제 현장에서는 위험성 평가 시간이 기존의 10분의 1로 줄었다.