본문으로 건너뛰기
피드

기업들이 비싼 프리미엄 AI 대신 오픈소스 모델로 갈아타는 중

ai-ml 약 8분
vote
0
댓글
북마크

기업들이 AI 도구를 많이 쓰기 시작하면서 토큰 비용이 예상보다 빠르게 불어나고 있다. 이 부담 때문에 딥시크, 라마, Qwen 같은 오픈소스 모델과 모델 라우팅 전략이 기업 시장에서 부상 중이다. 다만 중국산 모델 비중이 커지면서 비용 절감과 보안 리스크 사이의 줄타기도 본격화됐다.

  • 1

    오픈라우터에서 오픈소스 토큰 비중이 1월 34%에서 6월 65%로 급등했다

  • 2

    우버는 2026년 AI 예산을 4개월 만에 소진한 사례로 언급됐다

  • 3

    가트너는 2028년 AI 코딩 비용이 평균 개발자 연봉을 넘어설 수 있다고 봤다

  • 4

    기업들은 업무 난이도에 따라 프리미엄 모델과 오픈소스 모델을 나눠 쓰는 멀티모델 전략으로 이동 중이다

  • 5

    중국산 오픈소스 모델은 100만 토큰당 18센트 미만 가격으로 프리미엄 모델 대비 강한 가격 경쟁력을 보인다

AI 도입의 병목이 성능에서 청구서로 넘어가는 중

  • 기업들이 오픈소스 AI로 눈을 돌리는 이유는 단순함. 프리미엄 모델 비용이 생각보다 너무 빨리 불어나고 있음

    • 오픈라우터(OpenRouter)에서 오픈소스 토큰이 차지하는 비중은 올해 1월 34%에서 6월 65%로 뛰었음
    • 반년 만에 거의 두 배가 된 셈이라, 이건 취향 변화가 아니라 비용 구조 변화에 가까움
    • 딥시크(DeepSeek), 라마(Llama), Qwen 같은 모델이 기업 도입 후보군으로 본격적으로 올라온 상황임
  • 몇 달 전까지만 해도 회사들은 AI 사용량 증가를 생산성 향상의 지표처럼 봤음

    • 직원들이 더 많이 쓰면 더 많이 자동화되고, 더 빨리 일한다고 여기는 분위기가 있었음
    • 그런데 사용량 기반 과금이 커지면서 ‘많이 쓰는 게 좋은 것’에서 ‘많이 쓰면 예산이 터지는 것’으로 인식이 바뀌는 중임
    • 마이크로소프트, 팔로알토 네트웍스, 코인베이스 CEO들도 “더 작고 저렴한 모델로 대부분의 업무를 처리할 수 있다”는 쪽으로 말하기 시작함

중요

> 오픈소스 모델 확산의 핵심 동력은 이념이 아니라 비용임. 기업들은 이제 “최고 성능 모델 하나”보다 “업무별로 충분히 싸고 충분히 좋은 모델 조합”을 찾고 있음.

토큰 비용이 실제로 어디까지 커졌나

  • 우버 사례가 꽤 세다. 직원들이 AI 코딩 도구를 빠르게 도입하면서 2026년 연간 AI 예산을 4개월 만에 소진했다고 함

    • 결국 경영진이 직접 사용량 제한에 나설 수밖에 없었다는 얘기가 나옴
    • 개발팀 입장에서는 생산성 도구였던 게, 재무팀 입장에서는 통제해야 할 변동비가 된 셈임
  • AI 컨설팅 스타트업 블루록의 해럴드 변 CEO도 비슷한 얘기를 함

    • 라이선스 모델 변경 직후 고객사들에서 예산 초과가 20~30%에 달한다는 보고가 쏟아졌다고 함
    • 고정 구독에서 사용량 기반 과금으로 바뀌면, 초기 견적과 실제 청구액 사이가 크게 벌어질 수 있음
    • 가트너는 AI 코딩 비용이 2028년까지 평균 개발자 연봉을 넘어설 것으로 추정함. 이쯤 되면 농담이 아님

그래서 나온 해법이 멀티모델 전략

  • 기업들은 이제 모든 업무에 GPT, 클로드(Claude), 제미나이(Gemini) 같은 프리미엄 모델을 쓰지 않으려 함

    • 복잡한 코딩, 전략적 의사결정, 고난도 추론에는 비싼 모델을 씀
    • 반복 업무, 단순 요약, 분류, 초안 작성 같은 작업에는 오픈소스 모델을 투입함
    • 모델 라우팅 플랫폼은 이런 배분을 자동화해 비용과 성능 사이를 맞추는 역할을 함
  • WEKA의 발 베르코비치 최고AI책임자는 오픈소스 모델을 “프리미엄 모델 가격의 10% 수준으로 90점짜리 성능을 내는 선택지”로 설명함

    • 여기서 중요한 건 100점짜리 모델이 항상 필요한 게 아니라는 점임
    • 기업 업무의 상당수는 완벽한 추론보다 일정 수준 이상의 안정성과 낮은 비용이 더 중요함
    • 개발자 도구도 마찬가지임. 모든 자동완성과 리팩터링 제안에 최고가 모델을 태울 이유는 없음

중국산 오픈소스 모델의 존재감이 커지는 중

  • 현재 오픈소스 AI 시장의 선두권은 중국산 모델들이 강하게 잡고 있음

    • OpenRouter에서 가장 많이 사용되는 오픈소스 모델 상위 4개가 모두 중국산이라고 함
    • 1위는 DeepSeek임
    • 중국 모델들은 100만 토큰당 최고 18센트 미만 가격으로 언급됨
  • 이 가격은 프리미엄 모델과 비교하면 격차가 큼

    • 프리미엄 모델은 100만 토큰당 평균 3~5달러 수준으로 소개됨
    • 단순 계산으로도 대량 사용 기업에서는 청구서 차이가 꽤 크게 벌어짐
    • 블루록의 해럴드 변 CEO는 오픈소스 모델이 과거에는 선도 모델보다 1년 이상 뒤처졌지만, 이제 격차가 4개월 수준으로 줄었다고 봄

⚠️주의

> 비용만 보고 중국산 모델을 바로 넣기엔 민감 산업 리스크가 큼. 사이버보안, 금융, 의료처럼 데이터 통제가 중요한 영역에서는 모델 성능보다 보안 검토가 먼저일 수 있음.

프리미엄 AI 회사들도 가격 압박을 피하기 어려움

  • 오픈소스 모델 확산은 OpenAI와 Anthropic 같은 선두 기업에도 직접적인 압박임

    • 기업들이 멀티모델 전략을 쓰면, 모든 요청이 고가 모델로 가지 않음
    • 평균 매출 단가는 자연스럽게 내려갈 수밖에 없음
    • IPO를 준비하는 회사들 입장에서는 가격 인하가 성장에는 좋지만 수익성에는 부담임
  • 팔로알토 네트웍스의 니케시 아로라 CEO는 꽤 직설적으로 말함

    • 기업 시장에서 이기려면 몇 년 뒤 예상되는 낮은 가격으로 지금 당장 토큰을 공급해야 한다는 취지임
    • 외신에 따르면 오픈AI도 앤스로픽의 움직임을 의식해 대규모 가격 인하를 검토 중인 것으로 알려짐
    • 결국 기업용 AI 시장은 성능 경쟁만큼이나 가격 경쟁이 핵심 변수가 되는 중임

기술 맥락

  • 이 기사에서 가장 중요한 기술적 선택은 모델 라우팅이에요. 모든 요청을 하나의 최고급 모델로 보내면 품질은 좋아 보이지만, 회사 전체 사용량이 커지는 순간 비용이 감당하기 어려워져요. 그래서 요청의 난이도에 따라 모델을 나눠 태우는 구조가 필요해지는 거예요.

  • 토큰 기반 과금은 개발 조직의 예산 감각을 바꿔요. 예전 SaaS처럼 좌석 수만 계산하면 되는 게 아니라, 코드 생성, 리뷰, 문서 요약, 채팅 사용량이 전부 비용으로 쌓이거든요. 우버가 2026년 예산을 4개월 만에 썼다는 사례는 이 문제가 얼마나 빨리 커질 수 있는지 보여줘요.

  • 오픈소스 모델은 여기서 비용 완충재 역할을 해요. 단순하고 반복적인 작업은 저렴한 모델에 맡기고, 실패 비용이 큰 작업만 프리미엄 모델로 보내면 전체 평균 비용을 낮출 수 있어요. 이건 성능을 포기하는 전략이라기보다, 성능을 필요한 곳에만 비싸게 쓰는 전략에 가까워요.

  • 다만 중국산 모델 도입은 보안과 규제 검토가 같이 따라와야 해요. 금융, 의료, 보안 업무에서는 모델 가격이 낮아도 데이터 처리 위치, 로그 보관, 공급망 리스크가 더 큰 의사결정 기준이 될 수 있거든요. 그래서 실제 기업 아키텍처는 단일 모델 교체보다 멀티벤더 조합으로 갈 가능성이 커 보여요.

기업용 AI의 다음 싸움은 ‘누가 제일 똑똑한가’만으로 끝나지 않는다. 실제 회사에서는 청구서가 제품 전략을 바꾸고, 그 결과 모델 라우팅과 오픈소스 모델이 꽤 현실적인 아키텍처 선택지로 올라오고 있다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

그로크, 1조 원 투자 유치로 AI 추론 클라우드 확장 속도 낸다

AI 추론 전용 클라우드 기업 그로크가 6억 5,000만 달러 규모의 신규 투자를 유치했다. 엔비디아와의 비독점 라이선스 거래 이후 독립 회사로 남은 그로크는 자체 LPU와 13개 데이터센터를 앞세워 빠르고 저렴한 추론 클라우드 시장을 키우려 한다.

ai-ml

구글 클라우드에 신약·신소재용 AI 모델이 올라온다

구글 클라우드 마켓플레이스에 샌드박스AQ의 과학 연구 특화 AI 모델이 추가된다. 텍스트를 잘 쓰는 대규모 언어 모델(LLM)이 아니라 화학·생물학·물리학 문제를 수치 데이터로 푸는 거대정량모델(LQM) 쪽이라, 신약 후보와 반도체·배터리 소재 탐색에 초점이 맞춰져 있다.

ai-ml

프로수스, AI 쇼핑 비서로 커머스 수익성 끌어올리는 중

프로수스가 연간 조정 핵심이익 84% 증가를 발표하면서, 거래 데이터 기반 AI 쇼핑 비서 전략을 내세웠어. 마켓플레이스, 배달, 중고거래, 결제 데이터를 가진 플랫폼이 범용 챗봇보다 강한 AI 커머스 서비스를 만들 수 있다는 흐름이야.

ai-ml

정부, 3년 안에 로봇 두뇌용 피지컬 AI 파운데이션 모델 만든다

정부가 독자 AI 파운데이션 모델과 별도로 로봇의 두뇌 역할을 할 피지컬 AI 범용 파운데이션 모델 개발에 나서. 핵심은 대규모 언어 모델(LLM)이 아니라 시각·언어·행동(VLA), 월드모델(World Model), 로봇 제어를 묶는 풀스택 국산화야.

ai-ml

오픈클로, 모바일 앱 출시…AI 에이전트가 스마트폰 권한까지 잡기 시작함

오픈소스 AI 에이전트 프로젝트 오픈클로가 iOS와 Android용 독립 앱을 내놨어. 이제 에이전트가 카메라, 화면, 위치, 사진, 연락처, 캘린더 같은 스마트폰 기능과 연결될 수 있어서 개인 비서에 가까워지는 동시에 권한 관리 리스크도 커졌어.