AI 비용 폭탄 맞은 기업들, 중국산 오픈소스 모델로 갈아타는 중
기업들이 AI 에이전트와 코딩 도구 사용량을 늘리다가 토큰 비용 폭탄을 맞고 있어. 우버는 올해 AI 예산을 4개월 만에 다 써버렸고, 기업들은 딥시크 같은 저가 중국산 오픈소스 모델과 AI 라우팅 서비스로 비용을 줄이려는 중이야.
- 1
AI 에이전트는 토큰 사용량에 따라 과금돼서 사용량이 늘수록 비용 예측이 어려워짐
- 2
우버는 AI 코딩 도구 예산을 4개월 만에 소진해 토큰 사용 제한을 걸었음
- 3
오픈라우터에서 오픈소스 AI 토큰 처리 비중은 1월 34%에서 이달 65%로 급증
- 4
중국산 모델은 100만 토큰당 최저 18센트로, 미국 프리미엄 모델 평균 4달러의 5%도 안 됨
이제 기업 AI 도입의 병목은 모델 성능보다 운영비가 될 가능성이 커졌어. 모든 작업에 최고급 모델을 쓰는 시대가 아니라, 업무 난이도별로 모델을 섞어 쓰는 비용 최적화가 기본기가 되는 흐름이야.
관련 기사
그로크, 1조 원 투자 유치로 AI 추론 클라우드 확장 속도 낸다
AI 추론 전용 클라우드 기업 그로크가 6억 5,000만 달러 규모의 신규 투자를 유치했다. 엔비디아와의 비독점 라이선스 거래 이후 독립 회사로 남은 그로크는 자체 LPU와 13개 데이터센터를 앞세워 빠르고 저렴한 추론 클라우드 시장을 키우려 한다.
구글 클라우드에 신약·신소재용 AI 모델이 올라온다
구글 클라우드 마켓플레이스에 샌드박스AQ의 과학 연구 특화 AI 모델이 추가된다. 텍스트를 잘 쓰는 대규모 언어 모델(LLM)이 아니라 화학·생물학·물리학 문제를 수치 데이터로 푸는 거대정량모델(LQM) 쪽이라, 신약 후보와 반도체·배터리 소재 탐색에 초점이 맞춰져 있다.
프로수스, AI 쇼핑 비서로 커머스 수익성 끌어올리는 중
프로수스가 연간 조정 핵심이익 84% 증가를 발표하면서, 거래 데이터 기반 AI 쇼핑 비서 전략을 내세웠어. 마켓플레이스, 배달, 중고거래, 결제 데이터를 가진 플랫폼이 범용 챗봇보다 강한 AI 커머스 서비스를 만들 수 있다는 흐름이야.
정부, 3년 안에 로봇 두뇌용 피지컬 AI 파운데이션 모델 만든다
정부가 독자 AI 파운데이션 모델과 별도로 로봇의 두뇌 역할을 할 피지컬 AI 범용 파운데이션 모델 개발에 나서. 핵심은 대규모 언어 모델(LLM)이 아니라 시각·언어·행동(VLA), 월드모델(World Model), 로봇 제어를 묶는 풀스택 국산화야.
오픈클로, 모바일 앱 출시…AI 에이전트가 스마트폰 권한까지 잡기 시작함
오픈소스 AI 에이전트 프로젝트 오픈클로가 iOS와 Android용 독립 앱을 내놨어. 이제 에이전트가 카메라, 화면, 위치, 사진, 연락처, 캘린더 같은 스마트폰 기능과 연결될 수 있어서 개인 비서에 가까워지는 동시에 권한 관리 리스크도 커졌어.
댓글
댓글
댓글을 불러오는 중...