오픈AI·앤스로픽에 가격 압박 온다, 기업들은 이제 AI 모델을 섞어 쓴다

ai-ml 2026-06-12 약 7분

 tags

#llm #open-source #deepseek #model-routing #ai-agent

vote

북마크

기업들이 모든 작업에 고가 모델을 쓰는 대신, 난도에 따라 저가 모델·오픈소스 모델·중국산 모델·자체 모델을 조합하기 시작했다. 일부 AI 보조 업무에서는 비용을 최대 95%까지 줄였고, 딥시크 같은 모델 사용량도 빠르게 늘고 있다. 오픈AI와 앤스로픽은 상장을 앞두고 고성능 모델 프리미엄을 계속 지킬 수 있을지 시험대에 올랐다.

1
기업들은 단순 작업에는 저가 모델을 쓰고 복잡한 작업에만 챗지피티나 클로드를 호출하는 방식으로 비용을 줄이고 있다
2
일부 AI 보조 업무에서 비용 절감 폭이 최대 95%까지 나왔고, 린디는 딥시크 전환으로 수백만 달러를 아꼈다고 밝혔다
3
버셀에서 딥시크 사용 비중은 4월 1%에서 5월 17%로 뛰었고, 오픈라우터에서는 5월 중순 이후 딥시크가 가장 많이 쓰인 AI 기업이 됐다
4
오픈소스 토큰 사용량은 큰 고객 사이에서 폐쇄형 모델보다 4배 빠르게 늘었고, 500개 넘는 조직이 독점 모델에서 오픈소스 모델로 옮겼다
5
고가 모델은 여전히 최상위 성능에서 4~6개월 앞서 있지만, 기업들은 이제 토큰당 가격보다 작업 완료 비용을 더 중요하게 본다

AI 시장에서 진짜 가격전쟁이 시작된 분위기임. 기업들이 더 이상 오픈AI·앤스로픽 같은 고가 모델만 믿고 가지 않기 시작했음
- 간단한 작업은 오픈소스 모델이나 중국산 저가 모델로 처리하고, 복잡한 작업에만 챗지피티나 클로드를 호출하는 식
- 월스트리트저널은 이런 비용 절감 도구 확산이 오픈AI와 앤스로픽에 가격 인하 압박을 주고 있다고 봄
- 두 회사는 이미 첨단 모델 개발·운영에 필요한 컴퓨팅 비용 때문에 매년 수십억 달러 손실을 보는 것으로 알려짐
핵심은 ‘모든 요청에 최고급 모델을 쓰지 말자’는 것임
- AI 작업마다 난도가 다르니, 이메일 분류나 초안 작성 같은 일은 저렴한 모델로 충분할 수 있음
- 반대로 코딩, 복잡한 추론, 고위험 판단은 여전히 고성능 모델을 쓰는 식으로 나눔
- 이 흐름은 여러 단계를 실행하는 AI 에이전트에서 특히 중요함. 단계가 많을수록 모델 호출 비용이 눈덩이처럼 불어나기 때문임

❗중요

> 일부 기업 임원들은 이런 모델 조합 방식으로 AI 보조 업무 비용을 최대 95%까지 줄일 수 있다고 말함. 이 정도면 단순 최적화가 아니라 제품 마진 구조가 바뀌는 수준임.

실제 사례도 꽤 세게 나옴
- 버그 탐지 스타트업 디테일은 작업량 90%를 앤스로픽 클로드와 구글 제미나이에서 맞춤형 모델과 중국 GLM 계열 모델로 옮겼음
- AI 비서 스타트업 린디는 딥시크 V4를 이메일함 관리, 일정 관리, 이메일 초안, 회의 녹취 같은 업무에 테스트함
- 린디는 딥시크가 앤스로픽 소넷만큼 해당 업무를 잘했고, 특히 이메일 분류에 강했다고 평가함
- 비용은 10배 저렴했고, 이 전환으로 회사가 수백만 달러를 아꼈다고 함
- 다만 내부 코딩 작업에는 여전히 더 고급 앤스로픽 모델을 사용 중임. 결국 ‘싼 모델 만능론’은 아니라는 얘기임
딥시크 같은 중국산 오픈소스 모델 사용량도 빠르게 올라오는 중임
- 버셀 플랫폼에서 딥시크 사용 비중은 4월 1%에서 5월 17%로 뛰었음
- 오픈라우터에서는 5월 중순 이후 딥시크가 가장 많이 사용된 AI 기업이 됨
- 지출 규모가 큰 고객들 사이에서 오픈소스 토큰 사용량은 지난해 가을부터 올해 봄까지 폐쇄형 모델보다 4배 빠르게 증가함
- 500개가 넘는 조직이 독점 모델에서 오픈소스 모델로 전환한 것으로 나타남
가격 차이는 토큰 단위에서 확실히 큼
- 기사에 따르면 앤스로픽의 최신 고가 모델은 딥시크 V4 프로보다 토큰당 비용이 50배 이상 비싼 것으로 전해짐
- 마이크로소프트는 더 효율적인 소형 AI 모델 제품군을 공개했고, 엔비디아도 저가 모델군 네모트론을 내놓음
- 엔비디아는 오픈소스 AI 스타트업 리플렉션에도 투자함. 빅테크도 ‘싸고 쓸만한 모델’ 시장을 그냥 두지 않겠다는 신호임
그래도 고가 모델이 무조건 밀리는 건 아님
- 연구자들은 오픈AI, 앤스로픽, 구글의 최상위 독점 모델이 오픈소스 경쟁 모델보다 여전히 4~6개월 앞서 있다고 평가함
- 복잡한 작업에서는 고성능 모델이 더 적은 토큰으로 끝내서 전체 비용이 오히려 낮아질 수도 있음
- 앤스로픽도 이제 기업들이 토큰당 가격보다 작업 하나를 처음부터 끝까지 완료하는 비용을 기준으로 모델을 평가한다고 설명함
오픈AI는 가격을 크게 낮추는 방안을 검토 중인 것으로 알려짐
- 샘 올트먼은 최근 회사 행사에서 비용이 갑자기 “엄청난 이슈”가 됐다고 말함
- 오픈AI는 지난해 대규모 자금을 투입해 낮은 가격의 컴퓨팅 자원 접근권을 확보했기 때문에 가격 경쟁에서 유리하다고 보는 분위기임
- 오픈AI와 앤스로픽 모두 기업공개를 준비하는 상황이라, 수익성과 가격 경쟁력 사이의 균형이 더 민감해짐
이 뉴스의 진짜 포인트는 AI 모델이 점점 ‘상품화’되고 있다는 점임
- 컬럼비아대 비샬 미스라는 “양자중력을 아는 모델이 필요한 것은 아니다”라고 말함
- 대부분의 기업 업무는 최고 지능 모델이 아니라 충분히 잘하고 충분히 싼 모델을 원함
- 결국 모델 성능 경쟁만큼이나 라우팅, 비용 측정, 자체 모델 튜닝, 워크로드 분리가 중요해지는 중임

기술 맥락

지금 기업들이 고르는 건 단순히 “어떤 모델이 제일 똑똑한가”가 아니에요. 같은 서비스 안에서도 이메일 분류, 일정 정리, 코드 작성, 복잡한 추론은 난도가 다르거든요. 그래서 요청을 보고 싼 모델과 비싼 모델을 나눠 쓰는 모델 라우팅이 비용 절감의 핵심이 돼요.
AI 에이전트에서 이 문제가 더 크게 터지는 이유는 호출 횟수 때문이에요. 에이전트는 한 번 답하고 끝나는 게 아니라 계획을 세우고, 도구를 호출하고, 결과를 검증하고, 다시 수정해요. 매 단계마다 최고가 모델을 쓰면 제품이 잘 팔려도 마진이 남기 어렵죠.
오픈소스 모델 전환은 비용만의 문제가 아니에요. 기업이 사내 데이터를 붙여 맞춤형 모델을 만들면 특정 업무에서는 범용 최상위 모델보다 더 나은 결과가 나올 수도 있어요. 기사에서 자체 모델과 중국산 모델을 섞는 사례가 나온 건 이 때문이에요.
다만 싼 모델로 전부 갈아타면 된다는 얘기는 아니에요. 복잡한 코딩이나 고난도 추론에서는 고성능 모델이 토큰을 덜 쓰고 한 번에 끝내서 전체 비용이 낮아질 수 있거든요. 앞으로 중요한 건 모델 브랜드가 아니라 작업 완료 비용을 계측하는 능력이에요.

AI 모델 시장이 클라우드 인프라처럼 ‘무조건 최고급’에서 ‘워크로드별 최적화’로 넘어가는 분위기다. 한국 서비스팀도 모델 하나에 올인하기보다 라우팅, 비용 계측, 자체 데이터 튜닝을 제품 아키텍처의 기본값으로 봐야 할 타이밍이다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-27

문샷AI, 허깅페이스에 3조급 오픈 모델 키미 K3 예고

문샷AI가 차세대 오픈 프런티어 모델 Kimi K3를 허깅페이스에 공개하겠다고 예고했다. K3는 세계 최초의 오픈 3T급 모델을 내세우며, 장기 코딩 작업, 지식 업무, 추론, 에이전트 기능을 겨냥한다.

ai-ml 2026-07-27

오픈AI, 아틀라스 접고 브라우저 대신 챗GPT에 에이전트 기능 흡수

오픈AI가 챗GPT 중심의 AI 브라우저 아틀라스를 종료하고, 그 기능을 챗GPT 데스크톱 앱과 크롬 확장으로 옮긴다. 브라우저 자체를 목적지로 삼기보다 사용자가 이미 머무는 크롬과 데스크톱 환경에 에이전트 기능을 심는 쪽으로 방향을 바꾼 셈이다.

ai-ml 2026-07-27

중국 DRAM 업체 CXMT, 상장 첫날 472% 폭등

중국 메모리 반도체 업체 CXMT가 상하이 STAR 마켓 상장 첫날 주가가 472% 뛰면서 본토 상장사 중 최대 시가총액 기업이 됐다. AI 수요와 미국 수출 통제 속에서 중국이 자체 DRAM과 HBM을 확보하려는 흐름이 겹친 결과지만, 장비 접근 제한과 시장 점유율 격차는 여전히 큰 숙제다.

ai-ml 2026-07-23

알파벳, 클라우드 82% 성장했지만 AI 인프라 투자로 현금흐름 첫 적자

알파벳이 2분기 매출 1198억 달러를 기록하며 시장 전망을 넘겼고, 클라우드 매출은 82% 급증한 248억 달러까지 뛰었다. 하지만 AI 인프라에 분기 449억 달러를 투입하면서 잉여현금흐름은 2004년 상장 이후 처음으로 분기 적자를 냈다.

ai-ml 2026-07-23

알파벳 클라우드 매출 82% 폭증했는데, 클라우드 ETF는 왜 빠졌나

알파벳의 2분기 클라우드 매출이 전년 대비 82% 늘며 월가 예상치를 크게 넘었지만, 클라우드 관련 ETF는 오히려 하락했다. 시장은 이제 클라우드 매출 성장률만 보는 게 아니라, 그 매출을 만들기 위해 데이터센터와 칩에 얼마나 많은 자본지출이 들어갔는지를 따지고 있다.

오픈AI·앤스로픽에 가격 압박 온다, 기업들은 이제 AI 모델을 섞어 쓴다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

오픈AI·앤스로픽에 가격 압박 온다, 기업들은 이제 AI 모델을 섞어 쓴다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사