오픈AI·앤스로픽에 가격 압박 온다, 기업들은 이제 AI 모델을 섞어 쓴다
기업들이 모든 작업에 고가 모델을 쓰는 대신, 난도에 따라 저가 모델·오픈소스 모델·중국산 모델·자체 모델을 조합하기 시작했다. 일부 AI 보조 업무에서는 비용을 최대 95%까지 줄였고, 딥시크 같은 모델 사용량도 빠르게 늘고 있다. 오픈AI와 앤스로픽은 상장을 앞두고 고성능 모델 프리미엄을 계속 지킬 수 있을지 시험대에 올랐다.
- 1
기업들은 단순 작업에는 저가 모델을 쓰고 복잡한 작업에만 챗지피티나 클로드를 호출하는 방식으로 비용을 줄이고 있다
- 2
일부 AI 보조 업무에서 비용 절감 폭이 최대 95%까지 나왔고, 린디는 딥시크 전환으로 수백만 달러를 아꼈다고 밝혔다
- 3
버셀에서 딥시크 사용 비중은 4월 1%에서 5월 17%로 뛰었고, 오픈라우터에서는 5월 중순 이후 딥시크가 가장 많이 쓰인 AI 기업이 됐다
- 4
오픈소스 토큰 사용량은 큰 고객 사이에서 폐쇄형 모델보다 4배 빠르게 늘었고, 500개 넘는 조직이 독점 모델에서 오픈소스 모델로 옮겼다
- 5
고가 모델은 여전히 최상위 성능에서 4~6개월 앞서 있지만, 기업들은 이제 토큰당 가격보다 작업 완료 비용을 더 중요하게 본다
AI 모델 시장이 클라우드 인프라처럼 ‘무조건 최고급’에서 ‘워크로드별 최적화’로 넘어가는 분위기다. 한국 서비스팀도 모델 하나에 올인하기보다 라우팅, 비용 계측, 자체 데이터 튜닝을 제품 아키텍처의 기본값으로 봐야 할 타이밍이다.
관련 기사
네이버클라우드, 전장에 바로 쓰는 국방 AI 전략 공개
네이버클라우드가 국방 분야 AX 전략으로 소버린 AI 기반 전력화 모델을 공개했다. 핵심은 텍스트·이미지·음성·영상을 하나의 모델에서 학습하는 옴니모달 AI와, 개발 이후 실제 작전 현장 적용까지 이어지는 FDE 중심 운영 체계다.
NHN, 5년 만에 CTO 부활…AI 클라우드 투자 회수전 시작
NHN이 2021년 이후 비어 있던 그룹 CTO 자리를 다시 만들고 양철웅 신임 CTO를 선임했다. 클라우드·보안·AI 인프라 투자를 그룹 AX와 외부 클라우드 매출로 연결해야 하는 게 핵심 과제다. 특히 B200 GPU 7656장, 연구개발비 비중 6.77%, 1분기 현금성 자산 감소 같은 숫자가 이번 인사의 무게를 보여준다.
GMI 클라우드와 마그나 AI, 소버린 AI 팩토리 글로벌 확장 추진
GMI 클라우드와 마그나 AI가 글로벌 소버린 AI 팩토리 네트워크를 공동 설계·배포·확장하는 전략적 파트너십을 맺었다. 초기 프로젝트는 말레이시아, 벨기에, 루마니아에 집중하고, 중동과 아프리카 배포도 개발 중이다.
대구·울산·경북 5개 SW중심대, 구글 클라우드 AI 에이전트 챌린지 마무리
경북대, 대구대, 영남대, 울산대, 한동대가 공동으로 구글 클라우드 AI 에이전트 챌린지를 진행하고 본선과 시상식을 마쳤다. 학생들은 5주간 교육을 받고 산업 현장 문제를 해결하는 AI 에이전트 프로젝트를 기획·개발했다.
정부는 GPU 9,704장, 엔비디아는 국내 대기업과 AI 팩토리 판 키운다
과기정통부가 네이버클라우드, 삼성SDS, 엘리스그룹과 2조 800억 원 규모로 엔비디아 베라루빈 2,016장과 B300 7,688장을 확보한다. 동시에 엔비디아는 삼성, SK, 네이버, LG와 제조·로봇·데이터센터까지 묶는 AI 팩토리 연합을 만들고 있고, 아마존의 물 사용량 공개는 AI 인프라 경쟁이 전력과 냉각 효율 싸움으로 넘어갔다는 신호다.
댓글
댓글
댓글을 불러오는 중...