AI 비용 줄이려면 이제 '토큰 많이 쓰기'보다 '모델 골라 쓰기'가 답이라는 흐름
기업들이 AI 사용료 폭탄을 맞으면서 모든 작업에 최신 모델을 태우는 방식에서 벗어나고 있음. 어려운 추론은 비싼 모델에 맡기고, 반복 작업은 저렴한 모델이나 오픈소스 모델로 돌리는 '모델맥싱'과 '모델 라우팅'이 뜨는 중임.
- 1
AI 수요는 계속 늘지만 최신 모델이 꼭 필요한 작업은 일부라는 인식이 커지고 있음
- 2
코인베이스 CEO는 12~18개월 안에 작업의 80%가 99% 더 저렴한 모델에서 실행될 수 있다고 봄
- 3
기업들이 API 요금 고지서를 받고 나서야 모델 사용 전략을 다시 짜기 시작함
- 4
요청을 분석해 적합한 모델로 보내주는 모델 라우팅 스타트업 사용률이 지난해 1%에서 올해 5%로 증가함
AI 도입의 다음 병목은 모델 성능이 아니라 비용 통제임. 개발팀 입장에서는 '어떤 모델이 제일 똑똑한가'보다 '이 작업에 이 모델값을 낼 이유가 있나'가 더 중요한 질문이 되고 있음.
관련 기사
구글, 메타에 팔던 제미나이 용량도 배분제로 돌렸다
구글이 메타에 제공하던 제미나이 모델 용량을 3월부터 제한했다. 클라우드 AI 수요가 폭증하면서 돈을 더 낸다고 원하는 만큼 연산 자원을 확보할 수 있다는 전제가 흔들리고 있다.
민감한 회의 녹음, 클라우드 안 보내고 PC에서 바로 전사한다
노타가 민감한 회의를 클라우드로 보내지 않고 사용자 PC 안에서 녹음과 음성 전사를 처리하는 데스크톱 기능을 공개했다. 회의 봇을 초대하지 않아도 줌, 구글 미트, 팀즈, 슬랙, 웹엑스 회의를 기록할 수 있고, 법률·금융·고객 상담처럼 데이터 통제가 중요한 환경을 겨냥했다.
AI 에이전트 비용, 이제 토큰 단가보다 ‘어디서 돌리냐’가 문제
AI 모델의 토큰 단가는 내려갔지만, 기업이 실제로 내는 AI 비용은 오히려 커지고 있다는 지적이 나왔다. 특히 자율형 AI 에이전트는 일반 챗봇보다 토큰을 4~15배 더 쓰고, 장기적으로 인프라 부하를 최대 1000배까지 키울 수 있어 로컬 컴퓨팅과 하이브리드 인프라 전략이 중요해지고 있다.
하루 학습으로 공장 투입? 피지컬 AI 스타트업 카본식스에 622억원 몰림
제조업 특화 피지컬 AI 기업 카본식스가 4030만달러, 약 622억원 규모의 시리즈A 투자를 유치했다. 핵심 제품 ‘시그마키트’는 로봇 AI, 전용 네트워크, 그리퍼, 센서, 티칭 도구를 묶어 하루 정도의 작업 학습만으로 제조 공정에 투입할 수 있게 하는 자동화 솔루션이다.
수학 난제 푸는 AI와 전기 먹는 AI, 이제는 ‘어떻게 굴릴지’가 진짜 문제
AI가 장기 추론과 이질적 지식 결합으로 연구 파트너 역할을 할 수 있다는 관점과, 동시에 데이터센터 전력·물 사용이라는 환경 비용이 커지고 있다는 문제의식을 함께 다룬 글이다. 핵심은 AI를 무조건 더 많이 쓰자는 얘기가 아니라, 자율 루프와 정렬, 에너지 절감 설계를 같이 고민해야 한다는 쪽에 가깝다.
댓글
댓글
댓글을 불러오는 중...