본문으로 건너뛰기
피드

AI 비용 폭탄 맞은 기업들, 중국산 저가 모델과 라우팅으로 눈 돌린다

ai-ml 약 5분
vote
0
댓글
북마크

기업들이 AI 에이전트를 업무에 대거 도입하면서 토큰 기반 종량제 비용이 예상보다 빠르게 불어나고 있다. 우버는 AI 코딩 도구 사용 증가로 올해 AI 예산을 4개월 만에 소진했고, 기업들은 중국산 오픈소스 모델과 AI 라우팅 서비스로 비용을 낮추려는 흐름을 보이고 있다.

  • 1

    기업용 AI 에이전트는 토큰 사용량에 따라 비용이 커지는 종량제 구조가 많다.

  • 2

    우버는 AI 코딩 도구 사용량 급증으로 연간 AI 예산을 4개월 만에 소진했다.

  • 3

    오픈 라우터에서 오픈소스 AI 토큰 처리 비중은 1월 34%에서 이달 65%로 뛰었다.

  • 4

    중국산 모델은 100만 토큰당 최저 18센트로 미국 프리미엄 모델 평균 4달러의 5% 미만이다.

  • 기업들이 AI를 많이 쓰라고 밀어붙이다가 이제는 청구서에 맞고 있음

    • 기업용 AI 에이전트는 대부분 토큰 사용량에 따라 요금이 늘어나는 종량제 구조임
    • 생산성 올리겠다고 사내 사용량을 크게 늘리는 ‘토큰맥싱’이 벌어졌고, 그 결과 비용 예측이 점점 어려워졌다는 얘기임
  • 우버 사례가 꽤 직관적임

    • AI 코딩 도구 사용량이 급증하면서 올해 잡아둔 AI 예산을 4개월 만에 다 써버림
    • 결국 AI 토큰 소비량을 제한하는 조치를 걸 수밖에 없었다고 함
    • 개발 생산성을 올리려다 비용 거버넌스가 먼저 터진 셈이라, 남 일 같지 않음

중요

> 중국산 저가 AI 모델은 100만 토큰당 최저 18센트 수준으로 언급됨. 미국산 프리미엄 AI 모델 평균가 4달러와 비교하면 5%도 안 되는 가격임.

  • 오픈AI와 앤트로픽이 토큰 단가를 낮춰도 기업 입장에서는 문제가 끝나지 않음

    • 모델이 좋아질수록 코딩, 문서화, 분석, 고객지원처럼 활용 범위가 계속 넓어짐
    • 단가가 내려가도 사용량이 더 빨리 늘면 총비용은 오히려 튈 수 있음
    • 가트너 조사에서도 올해 테크 예산 증가를 예상한 기업이 4분의 3에 달했고, 그중 절반 가까이는 두 자릿수 증가율을 봤다고 함
  • 그래서 기업들이 중국산 오픈소스 AI와 라우팅 서비스로 이동 중임

    • 쉬운 작업은 가성비 좋은 모델에 보내고, 어려운 작업만 클로드 같은 프리미엄 모델에 맡기는 방식임
    • 한마디로 모든 요청에 최고급 모델을 태우는 낭비를 줄이겠다는 전략임
  • 숫자로 보면 이미 흐름이 꽤 선명함

    • 씨티그룹 분석에 따르면 오픈 라우터에서 오픈소스 AI용 토큰 처리 비중은 1월 34%에서 이달 65%로 거의 두 배가 됨
    • 오픈 라우터에서 가장 인기 있는 상위 4개 모델이 모두 중국산이고, 1위는 딥시크라고 함
    • 성능이 충분한 작업이라면 비용 차이가 너무 커서 기업들이 안 볼 수가 없는 구간에 들어간 것임
  • 다만 싸다고 바로 전사 도입하기에는 찝찝한 지점도 있음

    • 기업 데이터, 소스코드, 내부 문서가 오가는 업무라면 모델 출처와 데이터 처리 방식이 중요함
    • 특히 규제가 센 산업은 비용 절감만 보고 모델을 고르기 어렵고, 보안 검토와 사용 정책이 같이 붙어야 함

기술 맥락

  • 기업들이 라우팅을 보는 이유는 모든 AI 요청의 난이도가 같지 않기 때문이에요. 코드 주석 정리나 짧은 요약 같은 작업에 매번 비싼 프리미엄 모델을 쓰면, 성능은 남고 예산은 먼저 사라져요.

  • 토큰 과금은 작은 실험 단계에서는 편하지만 전사 확산이 시작되면 관리 포인트가 돼요. 사용자 수, 출력 길이, 에이전트 반복 호출이 동시에 늘어나면 단가 인하보다 사용량 증가가 더 빨라질 수 있거든요.

  • AI 라우팅은 비용과 품질을 분리해서 조절하려는 선택이에요. 쉬운 요청은 저가 모델, 민감하거나 복잡한 요청은 고성능 모델로 보내면 평균 단가를 낮추면서도 중요한 업무의 품질을 지킬 수 있어요.

  • 다만 라우팅을 제대로 하려면 모델별 보안 정책과 데이터 경계를 정해야 해요. 특히 소스코드나 고객 데이터가 들어가는 요청은 가격만 보고 외부 모델로 보내면 나중에 감사나 규제 대응에서 문제가 될 수 있어요.

AI 도입의 병목이 ‘쓸 수 있느냐’에서 ‘얼마나 통제해서 쓰느냐’로 넘어가는 중이다. 이제 기업 AI 전략은 모델 성능표만 보는 게 아니라 라우팅, 예산 제한, 보안 정책까지 같이 설계해야 한다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

AI 신약개발, 이제 모델보다 ‘스스로 실험하는 연구실’이 병목을 푸는 핵심이라는 얘기

AI가 후보물질을 빠르게 뽑아내도 기존 습식 실험실 방식으로는 검증 속도를 따라가기 어렵다는 문제가 제기됐다. 보고서는 AI 예측, 로봇 실험, 데이터 분석, 모델 재학습이 반복되는 자율실험실 기반 폐루프 운영체계가 신약 연구개발 경쟁력의 핵심 인프라가 될 수 있다고 본다.

ai-ml

성인 10명 중 4명은 매일 AI 사용, 그런데 오래 쓸수록 우울·불안 위험도 같이 올라감

생성형 AI를 최근 한 달 안에 써본 성인 500명을 조사했더니 41.4%가 거의 매일 쓰고 있었고, 정보검색·학습뿐 아니라 정서적 위안이나 고민상담에도 활용되고 있었다. 특히 하루 2시간 이상 쓰는 집단에서 우울 위험군 41.2%, 불안 위험군 35.3%가 나와, AI가 생산성 도구를 넘어 심리적 의존의 대상이 되고 있다는 신호가 잡혔다.

ai-ml

기업 AI 비용 폭탄에 저가 중국 모델·라우팅 서비스로 눈 돌리는 중

기업들이 생산성 향상을 위해 AI 에이전트 사용을 늘렸다가 토큰 기반 과금 폭탄을 맞고 있음. 우버는 AI 코딩 도구 예산을 4개월 만에 소진했고, 기업들은 작업 난이도에 따라 저가 모델과 프리미엄 모델을 나눠 쓰는 라우팅 방식으로 비용을 줄이려는 중임.

ai-ml

혈관조영장비도 이제 하드웨어가 아니라 AI 플랫폼 싸움으로 간다

혈관조영장비 시장이 단순히 선명한 영상을 보여주는 장비 경쟁에서 AI, 3D, 증강현실(AR)을 묶은 플랫폼 경쟁으로 넘어가고 있어. GE헬스케어는 기존 알리아 장비를 새 제품으로 갈아타게 하는 대신 대형 업그레이드로 시술 계획, 의사결정, 유지보수까지 한 번에 끌어올리는 전략을 택했어.

ai-ml

미국 AI 출시 제동, 빅테크 밸류에이션과 한국 반도체까지 흔든다

미국 정부가 국가 안보를 이유로 차세대 AI 모델 출시에 제동을 걸면서 빅테크 성장률과 밸류에이션 압박이 커지고 있다는 분석임. 동시에 중국 오픈소스 AI 모델의 저가 공세와 한국 HBM·메모리 공급망의 변동성까지 연결해 본 기사임.