본문으로 건너뛰기
피드

오픈AI·앤스로픽에 가격 압박 온다, 기업들은 이제 AI 모델을 섞어 쓴다

ai-ml 약 7분
vote
0
댓글
북마크

기업들이 모든 작업에 고가 모델을 쓰는 대신, 난도에 따라 저가 모델·오픈소스 모델·중국산 모델·자체 모델을 조합하기 시작했다. 일부 AI 보조 업무에서는 비용을 최대 95%까지 줄였고, 딥시크 같은 모델 사용량도 빠르게 늘고 있다. 오픈AI와 앤스로픽은 상장을 앞두고 고성능 모델 프리미엄을 계속 지킬 수 있을지 시험대에 올랐다.

  • 1

    기업들은 단순 작업에는 저가 모델을 쓰고 복잡한 작업에만 챗지피티나 클로드를 호출하는 방식으로 비용을 줄이고 있다

  • 2

    일부 AI 보조 업무에서 비용 절감 폭이 최대 95%까지 나왔고, 린디는 딥시크 전환으로 수백만 달러를 아꼈다고 밝혔다

  • 3

    버셀에서 딥시크 사용 비중은 4월 1%에서 5월 17%로 뛰었고, 오픈라우터에서는 5월 중순 이후 딥시크가 가장 많이 쓰인 AI 기업이 됐다

  • 4

    오픈소스 토큰 사용량은 큰 고객 사이에서 폐쇄형 모델보다 4배 빠르게 늘었고, 500개 넘는 조직이 독점 모델에서 오픈소스 모델로 옮겼다

  • 5

    고가 모델은 여전히 최상위 성능에서 4~6개월 앞서 있지만, 기업들은 이제 토큰당 가격보다 작업 완료 비용을 더 중요하게 본다

  • AI 시장에서 진짜 가격전쟁이 시작된 분위기임. 기업들이 더 이상 오픈AI·앤스로픽 같은 고가 모델만 믿고 가지 않기 시작했음

    • 간단한 작업은 오픈소스 모델이나 중국산 저가 모델로 처리하고, 복잡한 작업에만 챗지피티나 클로드를 호출하는 식
    • 월스트리트저널은 이런 비용 절감 도구 확산이 오픈AI와 앤스로픽에 가격 인하 압박을 주고 있다고 봄
    • 두 회사는 이미 첨단 모델 개발·운영에 필요한 컴퓨팅 비용 때문에 매년 수십억 달러 손실을 보는 것으로 알려짐
  • 핵심은 ‘모든 요청에 최고급 모델을 쓰지 말자’는 것임

    • AI 작업마다 난도가 다르니, 이메일 분류나 초안 작성 같은 일은 저렴한 모델로 충분할 수 있음
    • 반대로 코딩, 복잡한 추론, 고위험 판단은 여전히 고성능 모델을 쓰는 식으로 나눔
    • 이 흐름은 여러 단계를 실행하는 AI 에이전트에서 특히 중요함. 단계가 많을수록 모델 호출 비용이 눈덩이처럼 불어나기 때문임

중요

> 일부 기업 임원들은 이런 모델 조합 방식으로 AI 보조 업무 비용을 최대 95%까지 줄일 수 있다고 말함. 이 정도면 단순 최적화가 아니라 제품 마진 구조가 바뀌는 수준임.

  • 실제 사례도 꽤 세게 나옴

    • 버그 탐지 스타트업 디테일은 작업량 90%를 앤스로픽 클로드와 구글 제미나이에서 맞춤형 모델과 중국 GLM 계열 모델로 옮겼음
    • AI 비서 스타트업 린디는 딥시크 V4를 이메일함 관리, 일정 관리, 이메일 초안, 회의 녹취 같은 업무에 테스트함
    • 린디는 딥시크가 앤스로픽 소넷만큼 해당 업무를 잘했고, 특히 이메일 분류에 강했다고 평가함
    • 비용은 10배 저렴했고, 이 전환으로 회사가 수백만 달러를 아꼈다고 함
    • 다만 내부 코딩 작업에는 여전히 더 고급 앤스로픽 모델을 사용 중임. 결국 ‘싼 모델 만능론’은 아니라는 얘기임
  • 딥시크 같은 중국산 오픈소스 모델 사용량도 빠르게 올라오는 중임

    • 버셀 플랫폼에서 딥시크 사용 비중은 4월 1%에서 5월 17%로 뛰었음
    • 오픈라우터에서는 5월 중순 이후 딥시크가 가장 많이 사용된 AI 기업이 됨
    • 지출 규모가 큰 고객들 사이에서 오픈소스 토큰 사용량은 지난해 가을부터 올해 봄까지 폐쇄형 모델보다 4배 빠르게 증가함
    • 500개가 넘는 조직이 독점 모델에서 오픈소스 모델로 전환한 것으로 나타남
  • 가격 차이는 토큰 단위에서 확실히 큼

    • 기사에 따르면 앤스로픽의 최신 고가 모델은 딥시크 V4 프로보다 토큰당 비용이 50배 이상 비싼 것으로 전해짐
    • 마이크로소프트는 더 효율적인 소형 AI 모델 제품군을 공개했고, 엔비디아도 저가 모델군 네모트론을 내놓음
    • 엔비디아는 오픈소스 AI 스타트업 리플렉션에도 투자함. 빅테크도 ‘싸고 쓸만한 모델’ 시장을 그냥 두지 않겠다는 신호임
  • 그래도 고가 모델이 무조건 밀리는 건 아님

    • 연구자들은 오픈AI, 앤스로픽, 구글의 최상위 독점 모델이 오픈소스 경쟁 모델보다 여전히 4~6개월 앞서 있다고 평가함
    • 복잡한 작업에서는 고성능 모델이 더 적은 토큰으로 끝내서 전체 비용이 오히려 낮아질 수도 있음
    • 앤스로픽도 이제 기업들이 토큰당 가격보다 작업 하나를 처음부터 끝까지 완료하는 비용을 기준으로 모델을 평가한다고 설명함
  • 오픈AI는 가격을 크게 낮추는 방안을 검토 중인 것으로 알려짐

    • 샘 올트먼은 최근 회사 행사에서 비용이 갑자기 “엄청난 이슈”가 됐다고 말함
    • 오픈AI는 지난해 대규모 자금을 투입해 낮은 가격의 컴퓨팅 자원 접근권을 확보했기 때문에 가격 경쟁에서 유리하다고 보는 분위기임
    • 오픈AI와 앤스로픽 모두 기업공개를 준비하는 상황이라, 수익성과 가격 경쟁력 사이의 균형이 더 민감해짐
  • 이 뉴스의 진짜 포인트는 AI 모델이 점점 ‘상품화’되고 있다는 점임

    • 컬럼비아대 비샬 미스라는 “양자중력을 아는 모델이 필요한 것은 아니다”라고 말함
    • 대부분의 기업 업무는 최고 지능 모델이 아니라 충분히 잘하고 충분히 싼 모델을 원함
    • 결국 모델 성능 경쟁만큼이나 라우팅, 비용 측정, 자체 모델 튜닝, 워크로드 분리가 중요해지는 중임

기술 맥락

  • 지금 기업들이 고르는 건 단순히 “어떤 모델이 제일 똑똑한가”가 아니에요. 같은 서비스 안에서도 이메일 분류, 일정 정리, 코드 작성, 복잡한 추론은 난도가 다르거든요. 그래서 요청을 보고 싼 모델과 비싼 모델을 나눠 쓰는 모델 라우팅이 비용 절감의 핵심이 돼요.

  • AI 에이전트에서 이 문제가 더 크게 터지는 이유는 호출 횟수 때문이에요. 에이전트는 한 번 답하고 끝나는 게 아니라 계획을 세우고, 도구를 호출하고, 결과를 검증하고, 다시 수정해요. 매 단계마다 최고가 모델을 쓰면 제품이 잘 팔려도 마진이 남기 어렵죠.

  • 오픈소스 모델 전환은 비용만의 문제가 아니에요. 기업이 사내 데이터를 붙여 맞춤형 모델을 만들면 특정 업무에서는 범용 최상위 모델보다 더 나은 결과가 나올 수도 있어요. 기사에서 자체 모델과 중국산 모델을 섞는 사례가 나온 건 이 때문이에요.

  • 다만 싼 모델로 전부 갈아타면 된다는 얘기는 아니에요. 복잡한 코딩이나 고난도 추론에서는 고성능 모델이 토큰을 덜 쓰고 한 번에 끝내서 전체 비용이 낮아질 수 있거든요. 앞으로 중요한 건 모델 브랜드가 아니라 작업 완료 비용을 계측하는 능력이에요.

AI 모델 시장이 클라우드 인프라처럼 ‘무조건 최고급’에서 ‘워크로드별 최적화’로 넘어가는 분위기다. 한국 서비스팀도 모델 하나에 올인하기보다 라우팅, 비용 계측, 자체 데이터 튜닝을 제품 아키텍처의 기본값으로 봐야 할 타이밍이다.

댓글

댓글

댓글을 불러오는 중...

ai-ml

네이버클라우드, 전장에 바로 쓰는 국방 AI 전략 공개

네이버클라우드가 국방 분야 AX 전략으로 소버린 AI 기반 전력화 모델을 공개했다. 핵심은 텍스트·이미지·음성·영상을 하나의 모델에서 학습하는 옴니모달 AI와, 개발 이후 실제 작전 현장 적용까지 이어지는 FDE 중심 운영 체계다.

ai-ml

NHN, 5년 만에 CTO 부활…AI 클라우드 투자 회수전 시작

NHN이 2021년 이후 비어 있던 그룹 CTO 자리를 다시 만들고 양철웅 신임 CTO를 선임했다. 클라우드·보안·AI 인프라 투자를 그룹 AX와 외부 클라우드 매출로 연결해야 하는 게 핵심 과제다. 특히 B200 GPU 7656장, 연구개발비 비중 6.77%, 1분기 현금성 자산 감소 같은 숫자가 이번 인사의 무게를 보여준다.

ai-ml

GMI 클라우드와 마그나 AI, 소버린 AI 팩토리 글로벌 확장 추진

GMI 클라우드와 마그나 AI가 글로벌 소버린 AI 팩토리 네트워크를 공동 설계·배포·확장하는 전략적 파트너십을 맺었다. 초기 프로젝트는 말레이시아, 벨기에, 루마니아에 집중하고, 중동과 아프리카 배포도 개발 중이다.

ai-ml

대구·울산·경북 5개 SW중심대, 구글 클라우드 AI 에이전트 챌린지 마무리

경북대, 대구대, 영남대, 울산대, 한동대가 공동으로 구글 클라우드 AI 에이전트 챌린지를 진행하고 본선과 시상식을 마쳤다. 학생들은 5주간 교육을 받고 산업 현장 문제를 해결하는 AI 에이전트 프로젝트를 기획·개발했다.

ai-ml

정부는 GPU 9,704장, 엔비디아는 국내 대기업과 AI 팩토리 판 키운다

과기정통부가 네이버클라우드, 삼성SDS, 엘리스그룹과 2조 800억 원 규모로 엔비디아 베라루빈 2,016장과 B300 7,688장을 확보한다. 동시에 엔비디아는 삼성, SK, 네이버, LG와 제조·로봇·데이터센터까지 묶는 AI 팩토리 연합을 만들고 있고, 아마존의 물 사용량 공개는 AI 인프라 경쟁이 전력과 냉각 효율 싸움으로 넘어갔다는 신호다.