본문으로 건너뛰기
피드

저가 AI 모델 확산, 오픈AI·앤트로픽 IPO 밸류에 찬물 끼얹나

ai-ml 약 7분
vote
0
댓글
북마크

기업들이 AI 도입 비용을 본격적으로 따지기 시작하면서 오픈AI와 앤트로픽의 높은 기업가치에 부담이 생길 수 있다는 분석이 나왔다. 중국계 저가 모델과 오픈소스 모델이 성능을 빠르게 따라붙고, 기업들은 프론티어 모델만 쓰는 대신 저가 모델을 기본으로 두는 혼합 전략으로 이동 중이다.

  • 1

    오픈AI와 앤트로픽은 각각 8000억 달러를 웃도는 기업가치 평가를 받고 있다

  • 2

    2025년 월 10만 달러 이상을 AI에 쓰는 기업 비중은 45%로, 전년 20%에서 크게 늘었다

  • 3

    최고 성능 모델 기준 비용은 클로드 4811달러, 챗GPT 3357달러인 반면 지푸 GLM은 544달러로 제시됐다

  • 4

    딥시크 V4 프리뷰는 코딩, 에이전트, 지식 벤치마크에서 주요 프론티어 모델에 근접한 성능을 보였다

  • 5

    오픈라우터에서 중국 모델 사용 비중은 2024년 약 1%에서 2026년 5월 60% 이상으로 뛰었다

  • 보급형 AI 모델 확산이 오픈AI와 앤트로픽의 IPO 밸류에 부담이 될 수 있다는 분석이 나옴

    • 두 회사 모두 각각 8000억 달러를 웃도는 기업가치를 평가받는 상황
    • 그런데 기업용 AI 시장에서는 이제 “성능 최고”만큼 “얼마나 싸게 굴릴 수 있냐”가 중요해지고 있음
    • 비싼 프론티어 모델만으로 매출과 마진을 설명하기가 점점 빡세지는 분위기임
  • 기업들이 AI 비용을 실제 손익 문제로 보기 시작함

    • 이번 실적 시즌에서 메타, 쇼피파이, 스포티파이, 핀터레스트가 AI와 추론 비용 증가로 마진 압박을 받았다고 밝힘
    • 클라우드제로 조사에 따르면 2025년 월 10만 달러 이상을 AI에 쓰는 기업 비중은 45%
    • 지난해 같은 기간 20%였던 것과 비교하면 1년 만에 두 배 이상 늘어난 셈

중요

> 월 10만 달러 이상을 AI에 쓰는 기업 비중이 20%에서 45%로 뛰었음. AI 도입이 실험 단계를 넘어가면서, 모델 비용은 이제 CFO가 보는 숫자가 됐다.

  • 가격 차이는 꽤 노골적임

    • 아티피셜 애널리시스 평가에서 최고 성능 모델 기준 비용은 앤트로픽 클로드가 4811달러
    • 오픈AI 챗GPT는 3357달러로 제시됨
    • 반면 딥시크는 1071달러, 키미는 948달러, 지푸 GLM은 544달러
    • 같은 작업 기준으로 클로드는 가장 저렴한 중국 모델보다 거의 9배 비쌌다는 계산이 나옴
  • 문제는 저가 모델이 싸기만 한 게 아니라는 점임

    • 딥시크가 지난달 공개한 차세대 모델 V4 프리뷰는 코딩, 에이전트, 지식 벤치마크에서 오픈AI, 앤트로픽, 구글 최신 모델과 비슷하거나 근접한 성능을 보였다고 함
    • 최근 넉 달 사이 문샷, 샤오미, 지푸도 비슷한 수준의 모델을 출시함
    • 즉 “싸지만 구림”이 아니라 “충분히 쓸 만한데 훨씬 쌈”이라는 구도가 만들어지는 중
  • 기업들의 모델 사용 방식도 바뀌고 있음

    • 데이터브릭스의 알리 고드시 CEO는 저렴한 오픈소스 모델을 기본으로 쓰는 방식이 확산된다고 설명함
    • 기본 모델이 해결하지 못하는 과제만 오픈AI나 앤트로픽의 프론티어 모델을 호출하는 구조
    • 기사에서는 이를 ‘어드바이저 모델’ 방식으로 설명함
  • 개발자 입장에서는 모델 라우팅이 더 중요해지는 흐름임

    • 모든 요청을 최고가 모델로 보내면 품질은 편할 수 있지만 비용이 터짐
    • 반대로 모든 요청을 저가 모델로 보내면 어려운 작업에서 품질 문제가 생길 수 있음
    • 그래서 요청 난이도에 따라 저가 모델, 오픈소스 모델, 프론티어 모델을 나눠 쓰는 전략이 현실적인 선택지가 됨
  • 오픈라우터의 사용 비중 변화는 이 흐름을 숫자로 보여줌

    • 오픈라우터에서 중국 모델 사용 비중은 2024년 약 1% 수준이었음
    • 올해 5월에는 60%를 넘어섰다고 함
    • 개발자들이 모델을 쉽게 바꿔 쓸 수 있는 환경에서는 가격 대비 성능이 좋으면 점유율이 순식간에 이동할 수 있다는 얘기임
  • 비용 절감 자체를 파는 기능도 등장하고 있음

    • 피그마는 고객 토큰 사용량을 20∼30% 줄이는 기능을 판매하고 있음
    • AI 기능이 제품 안에 깊게 들어갈수록 토큰 절감이 곧 제품 마진 개선으로 이어짐
    • 앞으로는 “어떤 모델을 쓰냐”만큼 “얼마나 덜 호출하냐”도 중요한 최적화 포인트가 될 가능성이 큼
  • 오픈AI와 앤트로픽에 불리한 지점은 성장 서사가 비용 압박과 정면충돌한다는 것임

    • 고성능 모델 개발에는 막대한 학습·추론 인프라 비용이 들어감
    • 그런데 고객은 점점 더 저렴한 대안을 비교하고 있음
    • IPO를 앞둔 회사라면 높은 기업가치를 정당화하려면 단순 모델 성능 이상의 락인, 플랫폼, 생태계, 기업용 워크플로우를 증명해야 함

기술 맥락

  • 기업들이 모델을 고르는 기준이 바뀌는 이유는 추론 비용이 반복 비용이기 때문이에요. 데모 한 번 돌릴 때는 비싼 모델을 써도 티가 덜 나지만, 제품 기능으로 붙이고 매일 수백만 번 호출하면 토큰 단가가 바로 마진을 깎아먹거든요.

  • 그래서 저가 모델을 기본값으로 두고, 어려운 요청만 프론티어 모델로 넘기는 구조가 나와요. 이 방식은 품질과 비용 사이의 타협이에요. 대부분의 평범한 요청은 싼 모델로 처리하고, 코드 생성이나 복잡한 추론처럼 실패 비용이 큰 요청만 비싼 모델에 맡기는 거죠.

  • 오픈라우터 같은 모델 라우팅 계층이 중요해지는 것도 같은 이유예요. 애플리케이션 코드가 특정 모델 하나에 강하게 묶이면 가격이나 성능 변화에 대응하기 어렵거든요. 여러 모델을 추상화해서 갈아끼울 수 있으면, 기업은 벤더 충성도보다 비용 대비 성능을 기준으로 움직일 수 있어요.

  • 피그마가 토큰 사용량을 20∼30% 줄이는 기능을 판다는 대목도 꽤 상징적이에요. 이제 AI 기능의 경쟁력은 모델 이름만이 아니라 프롬프트 압축, 캐싱, 라우팅, 재시도 제어 같은 운영 최적화까지 포함해요. 서비스 개발자는 모델 API를 붙이는 것보다, 비용이 폭주하지 않게 설계하는 쪽에 더 신경 써야 해요.

AI 모델 시장이 ‘가장 똑똑한 모델’ 경쟁에서 ‘충분히 똑똑한데 훨씬 싼 모델’ 경쟁으로 갈라지는 중임. 기업용 AI에서는 성능 1등보다 비용 대비 성능과 라우팅 전략이 더 중요한 구매 기준이 될 수 있다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

유튜브, AI 생성 영상에 자동 라벨 붙인다

유튜브가 사실적으로 보이거나 의미 있게 AI로 변경·생성된 콘텐츠에 더 눈에 띄는 라벨을 적용하고, 제작자가 AI 사용 여부를 밝히지 않아도 내부 신호로 감지되면 자동 라벨을 붙이겠다고 밝혔다. 다만 라벨만으로 추천 노출이나 수익화 자격이 바뀌지는 않으며, 제작자는 YouTube Studio에서 잘못된 판정을 수정할 수 있다.

ai-ml

테크 CEO들의 'AI 만능론', 숫자는 아직 그렇게 말하지 않는다

테크 업계에서 AI를 이유로 한 대규모 감원과 조직 재편이 이어지는 가운데, Box 창업자 애런 레비는 CEO들이 실제 업무의 마지막 1마일을 모른 채 AI 에이전트의 능력을 과대평가하고 있다고 지적했다. 2026년 첫 5개월 동안 이미 11만5430명이 해고됐고, 여러 연구는 AI 도입이 체감 생산성만큼 실제 생산성을 끌어올렸다는 근거가 아직 약하다고 말한다.

ai-ml

오픈AI와 앤트로픽, 코딩 에이전트로 드디어 돈 되는 시장을 찾은 듯

사이먼 윌리슨은 오픈AI와 앤트로픽이 코딩 에이전트와 기업용 과금으로 진짜 제품-시장 적합성을 찾았다고 봐. 개인 구독자에게는 월 100달러 플랜이 싸게 느껴지지만, 기업 고객은 이제 사용량 기준 토큰 가격을 그대로 내기 시작했고 이게 대형 고객 예산을 빠르게 흔들고 있다는 얘기야.

ai-ml

컴팔과 GMI 클라우드, 대규모 추론용 AI 인프라 구축 협력

컴팔이 실리콘밸리 기반 AI 인프라 기업 GMI 클라우드와 협력해 대규모 추론과 에이전틱 AI 워크로드에 맞춘 GPU 서버 인프라를 구축한다고 발표했어. COMPUTEX 2026에서는 NVIDIA HGX B300을 지원하는 Compal SGX30-2 같은 고성능 AI 서버 플랫폼도 선보일 예정이야.

ai-ml

AI 쓰면 편해진다더니, 직장인들은 ‘AI 과부하’에 지쳐가는 중

국내 직장인들이 AI 전환 압박, AI 답변 검증 부담, 대체 불안 때문에 피로감을 호소하고 있어. 중앙일보 설문에서는 5284명 중 31.6%가 ‘AI 답변 검증에 시간이 더 걸릴 때’를 가장 지치는 순간으로 꼽았고, 기업들은 무작정 AI 사용량을 밀어붙이는 방식에서 업무 방식 재설계로 넘어가야 한다는 지적이 나와.