본문으로 건너뛰기
피드

기업 AI 비용 폭탄에 저가 중국 모델·라우팅 서비스로 눈 돌리는 중

ai-ml 약 5분
vote
0
댓글
북마크

기업들이 생산성 향상을 위해 AI 에이전트 사용을 늘렸다가 토큰 기반 과금 폭탄을 맞고 있음. 우버는 AI 코딩 도구 예산을 4개월 만에 소진했고, 기업들은 작업 난이도에 따라 저가 모델과 프리미엄 모델을 나눠 쓰는 라우팅 방식으로 비용을 줄이려는 중임.

  • 1

    기업용 AI 에이전트는 토큰 사용량에 비례해 비용이 커지는 종량제 구조가 많음

  • 2

    우버는 올해 AI 예산을 4개월 만에 소진해 토큰 소비 제한 조치를 걸었음

  • 3

    오픈라우터의 오픈소스 AI 토큰 처리 비율은 1월 34%에서 이달 65%로 증가

  • 4

    중국제 모델은 100만 토큰당 최저 18센트로, 미국 프리미엄 모델 평균 4달러의 5% 미만 수준

  • 기업들이 AI 에이전트를 막 밀어붙였다가 이제 비용 청구서 앞에서 멈칫하는 중임

    • 로이터 보도에 따르면, 생산성 향상을 이유로 사내 AI 사용을 장려하던 기업들이 종량제 비용 부담 때문에 더 싼 모델을 찾기 시작했음
    • 핵심은 대부분의 기업용 AI 에이전트가 AI 토큰 사용량에 비례해 요금이 올라가는 구조라는 점
  • 문제는 “많이 쓰면 좋겠지”가 바로 “얼마 나올지 모름”으로 바뀐다는 것임

    • 기업들은 AI 전환 속도전 때문에 사내 AI 에이전트 사용량을 대폭 늘리는 ‘토큰맥싱(tokenmaxxing)’을 감행했음
    • 그런데 사용량이 늘수록 비용이 예측하기 어려운 속도로 튀면서 재무 구조를 압박하기 시작함
    • 오픈AI와 앤트로픽이 토큰당 가격을 계속 낮추고는 있지만, 도구 활용 범위가 더 빠르게 넓어지면서 총비용 통제가 어려워진 셈

중요

> 우버는 AI 코딩 도구 사용량이 급증하면서 올해 책정한 AI 예산을 불과 4개월 만에 다 써버렸고, 결국 AI 토큰 소비량 제한 조치를 걸었음.

  • 그래서 기업들이 중국산 오픈소스 AI와 저가 모델 쪽으로 빠르게 눈을 돌리고 있음

    • 기사에서 언급된 중국제 AI 모델은 100만 토큰당 최저 18센트 수준
    • 미국산 프리미엄 AI 모델 평균가인 4달러와 비교하면 5% 미만이라, 비용 차이가 그냥 “조금 싸다” 수준이 아님
    • 오픈라우터에서 인기 높은 4대 AI 모델이 모두 중국제이고, 1위는 딥시크라는 점도 꽤 상징적임
  • 모델 라우팅 서비스도 같이 뜨는 중임

    • 오픈라우터 같은 서비스는 쉬운 작업을 가성비 좋은 모델에 보내고, 어려운 작업만 클로드 같은 프리미엄 모델에 맡기는 방식
    • 미국 씨티그룹 분석에 따르면 오픈라우터에서 오픈소스 AI용 토큰 처리 비율은 1월 34%에서 이달 65%로 거의 두 배가 됐음
    • 기업 입장에선 “무조건 최고 모델”보다 “작업별로 적당한 모델”이 더 현실적인 전략이 되고 있음
  • 가트너 조사도 이 흐름을 뒷받침함

    • 올해 테크 예산 증가를 예상한 기업 비율이 4분의 3에 달했음
    • 그중 절반 가까이는 두 자릿수 증가율을 예상했는데, AI 비용이 예산 논의의 큰 축으로 들어왔다는 뜻으로 볼 수 있음
  • 결론은 AI 도입의 병목이 성능에서 비용 운영으로 넘어가고 있다는 거임

    • 이제 기업 AI 전략은 어떤 모델이 제일 똑똑하냐만 보면 안 됨
    • 누가 어떤 작업에 어떤 모델을 쓰는지, 토큰 한도를 어디서 걸지, 라우팅 정책을 어떻게 짤지가 실제 운영 비용을 가르는 포인트가 됨

기술 맥락

  • 기업들이 고른 방향은 단일 프리미엄 모델 몰빵이 아니라 작업별 모델 라우팅이에요. 쉬운 작업까지 비싼 모델에 보내면 토큰 비용이 계속 새기 때문에, 난이도에 따라 저가 모델과 고성능 모델을 나눠 쓰려는 거예요.

  • 이 선택이 나온 이유는 AI 에이전트의 과금 구조가 사용량 기반이기 때문이에요. 사내에서 코딩 도구나 업무 도우미를 많이 쓰게 만들수록 생산성은 오를 수 있지만, 동시에 토큰 소비량도 예산보다 훨씬 빨리 커질 수 있거든요.

  • 오픈라우터 같은 라우팅 서비스는 이 문제를 인프라 레이어에서 풀려는 접근이에요. 사용자가 직접 매번 모델을 고르는 게 아니라, 쉬운 작업은 저렴한 모델로 보내고 어려운 작업은 클로드 같은 프리미엄 모델로 보내 비용 대비 성능을 맞추는 식이에요.

  • 우버 사례가 중요한 건 이게 실험실 얘기가 아니라 실제 기업 운영비 문제라는 점이에요. AI 코딩 도구 예산이 4개월 만에 소진됐다는 건, 개발 조직에서 AI 사용량을 통제하지 않으면 생산성 도구가 곧바로 비용 리스크가 될 수 있다는 뜻이에요.

이건 단순히 ‘중국 모델이 싸다’가 아니라, 기업 AI 도입이 비용 거버넌스 문제로 넘어갔다는 얘기임. 앞으로 사내 AI 플랫폼은 모델 성능보다 라우팅, 예산 제한, 작업별 모델 선택 같은 운영 설계가 훨씬 중요해질 가능성이 큼.

댓글

댓글

댓글을 불러오는 중...

ai-ml

AI 신약개발, 이제 모델보다 ‘스스로 실험하는 연구실’이 병목을 푸는 핵심이라는 얘기

AI가 후보물질을 빠르게 뽑아내도 기존 습식 실험실 방식으로는 검증 속도를 따라가기 어렵다는 문제가 제기됐다. 보고서는 AI 예측, 로봇 실험, 데이터 분석, 모델 재학습이 반복되는 자율실험실 기반 폐루프 운영체계가 신약 연구개발 경쟁력의 핵심 인프라가 될 수 있다고 본다.

ai-ml

성인 10명 중 4명은 매일 AI 사용, 그런데 오래 쓸수록 우울·불안 위험도 같이 올라감

생성형 AI를 최근 한 달 안에 써본 성인 500명을 조사했더니 41.4%가 거의 매일 쓰고 있었고, 정보검색·학습뿐 아니라 정서적 위안이나 고민상담에도 활용되고 있었다. 특히 하루 2시간 이상 쓰는 집단에서 우울 위험군 41.2%, 불안 위험군 35.3%가 나와, AI가 생산성 도구를 넘어 심리적 의존의 대상이 되고 있다는 신호가 잡혔다.

ai-ml

AI 비용 폭탄 맞은 기업들, 중국산 저가 모델과 라우팅으로 눈 돌린다

기업들이 AI 에이전트를 업무에 대거 도입하면서 토큰 기반 종량제 비용이 예상보다 빠르게 불어나고 있다. 우버는 AI 코딩 도구 사용 증가로 올해 AI 예산을 4개월 만에 소진했고, 기업들은 중국산 오픈소스 모델과 AI 라우팅 서비스로 비용을 낮추려는 흐름을 보이고 있다.

ai-ml

혈관조영장비도 이제 하드웨어가 아니라 AI 플랫폼 싸움으로 간다

혈관조영장비 시장이 단순히 선명한 영상을 보여주는 장비 경쟁에서 AI, 3D, 증강현실(AR)을 묶은 플랫폼 경쟁으로 넘어가고 있어. GE헬스케어는 기존 알리아 장비를 새 제품으로 갈아타게 하는 대신 대형 업그레이드로 시술 계획, 의사결정, 유지보수까지 한 번에 끌어올리는 전략을 택했어.

ai-ml

미국 AI 출시 제동, 빅테크 밸류에이션과 한국 반도체까지 흔든다

미국 정부가 국가 안보를 이유로 차세대 AI 모델 출시에 제동을 걸면서 빅테크 성장률과 밸류에이션 압박이 커지고 있다는 분석임. 동시에 중국 오픈소스 AI 모델의 저가 공세와 한국 HBM·메모리 공급망의 변동성까지 연결해 본 기사임.