AI 에이전트 비용, 작업별 소형 모델로 최대 90% 줄인다는 접근이 나왔다
오픈클로 환경에서 반복적인 에이전트 하위 작업을 소형 언어 모델로 라우팅해 프런티어 모델 호출을 줄이는 방식이 공개됐다. 뉴로메트릭AI의 클로팩과 루마독의 VPS 템플릿을 결합해 호스팅 비용과 추론 비용을 같이 낮추겠다는 전략이다.
- 1
클로팩은 분류, 추출, 요약, 포맷 변환 같은 반복 작업을 작업별 소형 언어 모델로 보낸다
- 2
뉴로메트릭AI는 프런티어 모델 호출을 60~90% 줄일 수 있었다고 밝혔다
- 3
루마독은 월 1.99달러부터 시작하는 오픈클로 전용 VPS 템플릿을 제공한다
- 4
클로팩 무료 티어는 월 1억 토큰을 제공하며 신용카드 없이 시작할 수 있다
에이전트가 실험용 데모를 넘어 실제 워크플로에 들어가면 모델 성능보다 비용 곡선이 먼저 발목을 잡는다. 모든 작업을 비싼 모델에 던지는 방식은 단순하지만, 오래 운영할수록 라우팅과 모델 조합이 실력으로 보일 가능성이 크다.
관련 기사
이노그리드, 2030년 국내 AI 클라우드 솔루션 1위 목표로 통합 제어 플랫폼 밀기 시작
이노그리드가 테크 비전 데이 2026에서 2030년까지 국내 AI 클라우드 솔루션 1위 기업이 되겠다는 목표와 기술 로드맵을 공개했다. GPU, NPU, CPU, QPU 같은 다양한 xPU 자원부터 AI 개발·학습·배포·운영까지 하나의 Control Plane으로 묶는 TAFA 아키텍처가 핵심이다.
엔비디아와 SK텔레콤, 2027년 기가와트급 AI 클라우드 가동 노림
엔비디아와 SK텔레콤이 엔비디아 DSX 플랫폼을 기반으로 국내에 기가와트급 AI 클라우드를 구축하겠다고 발표했다. 2027년 첫 AI 팩토리 가동을 목표로 하며, 모델 학습·추론·에이전틱 AI·피지컬 AI 워크로드를 처리하는 GPU 특화 클라우드를 만들겠다는 구상이다.
정부, 2조800억 원 들여 네이버클라우드·삼성SDS·엘리스에 GPU 9,704장 맡김
정부가 2026년 2조800억 원 규모의 첨단 GPU 확보·구축 사업자로 네이버클라우드, 삼성SDS, 엘리스그룹을 선정했다. 총 9,704장의 베라루빈과 B300을 들여와 국내 AI 모델 개발, 국가 AI 프로젝트, 산학연 연구개발에 투입하고 일부는 CSP 자체 클라우드 서비스에 활용할 계획이다.
전 네이버클라우드 임원이 세운 에이투시스, 설립 한 달 안 돼 160억 시드 투자 유치
이동수 전 네이버클라우드 전무가 창업한 AI 컴퓨팅 솔루션 스타트업 에이투시스가 법인 설립 한 달도 안 돼 160억 원 규모 시드 투자를 유치했다. 회사는 AI 에이전트 연산 효율화, 모델 압축·추론 가속, 차세대 메모리 솔루션을 묶은 소프트웨어·하드웨어 통합 솔루션을 개발하겠다고 밝혔다.
아프리카 개발자들이 중국 AI 모델로 몰리는 이유, 결국 비용과 언어 데이터 문제
아프리카 개발자들이 자국어 AI 모델을 만들 때 구글, 마이크로소프트, 오픈AI보다 딥시크, 큐웬, 키미 같은 중국 AI 플랫폼을 더 많이 선택하고 있다는 보도다. 이유는 단순하다. 아프리카에는 1천500개에서 3천개 언어가 쓰이고, 데이터가 부족한 언어로 모델을 만들면 영어 기반보다 비용이 3배에서 30배까지 더 들 수 있기 때문이다.
댓글
댓글
댓글을 불러오는 중...