AI 비용 폭탄, 답은 더 큰 클라우드가 아니라 ‘로컬 우선 추론’일 수 있다
기업 생성형 AI 시범사업의 95%가 측정 가능한 손익 효과를 내지 못했다는 MIT 분석을 바탕으로, 기사에서는 비용 문제의 핵심이 모델 성능보다 업무 흐름과 추론 비용에 있다고 짚는다. 대안으로는 쉬운 작업을 기기나 자체 서버에서 먼저 처리하고, 어려운 작업만 클라우드로 보내는 로컬 우선 추론 전략이 제시된다. 실제 사례에서는 문서 4,700건 처리 중 70~80%를 로컬에서 걸러 클라우드 호출 비용 75%, 처리 시간 55%를 줄였다.
- 1
MIT 분석에 따르면 생성형 AI 시범사업 95%가 손익에 측정 가능한 효과를 내지 못했고, 투자 규모는 300억~400억 달러에 달함
- 2
AI 비용의 상당 부분은 학습보다 매번 모델을 호출하는 추론 단계에서 발생함
- 3
로컬 우선 추론은 쉬운 작업을 기기나 자체 서버에서 처리하고, 애매하거나 어려운 작업만 클라우드 AI로 넘기는 전략임
- 4
엔지니어링 도면 문서 4,700건 사례에서 70~80%를 로컬에서 처리해 클라우드 비용 75%, 처리 시간 55%를 줄임
- 5
가트너는 2030년까지 1조 매개변수 모델 추론 비용이 90% 이상 떨어질 수 있다고 봤지만, 에이전트형 AI의 토큰 사용량 증가가 총비용을 다시 키울 수 있다고 봄
이 기사의 핵심은 “무슨 모델을 쓰느냐”보다 “언제 비싼 모델을 부르느냐”임. 한국 기업이 AI를 파일럿에서 끝내지 않으려면 모델 성능 비교표보다 라우팅, 로컬 처리, 사람 검토 흐름을 먼저 설계해야 한다.
관련 기사
구글-스페이스X 초대형 클라우드 계약이 애저 가격 상승 신호로 읽히는 이유
구글이 스페이스X에 클라우드 컴퓨팅 용량 비용으로 월 9억 2천만 달러를 받기로 한 계약이 AI 인프라 수요와 가격 강세의 신호로 해석되고 있다. BNP 파리바는 이런 흐름이 마이크로소프트 애저의 계약 갱신 가격에도 반영되면 애저 성장률이 40% 중반까지 올라갈 수 있다고 봤다. 코파일럿 피드백 개선도 언급됐지만, 기업 고객 확산은 점진적으로 나타날 가능성이 크다.
리얼월드·엔비디아, 휴머노이드 손 성능 재는 ‘덱스벤치’ 만든다
피지컬 AI 스타트업 리얼월드가 엔비디아와 함께 휴머노이드 로봇 손의 성능 벤치마크인 덱스벤치를 출범했다. 5지 손 조작을 5개 도메인과 18개 태스크로 나눠 측정하고, 엔비디아 아이작 랩 생태계와 통합하는 것이 핵심이다. 로봇 경쟁이 하드웨어와 모델 성능을 넘어 표준 경쟁으로 넘어가고 있다는 신호다.
엔비디아 생태계에 올라탄 한국 의료 AI, 소버린 AI와 스마트 병원을 노린다
젠슨 황 방한과 엔비디아 간담회를 계기로 국내 의료 AI 기업들이 글로벌 AI 생태계의 파트너로 부각됐다는 내용이다. 루닛은 의료 특화 파운데이션 모델, 메디컬아이피는 의료 디지털 트윈, 메디아나는 병원 데이터와 피지컬 AI를 연결한 스마트 병원 모델을 내세우고 있다.
AI 로봇이 습도까지 보고 나사 조인다, 제조업 일자리 변화가 이미 시작됐다
창원의 가전부품 제조업체 신성델타테크는 AI 로봇과 비전 AI를 도입해 과거 100명이 하던 일을 60명이 처리할 수 있게 됐다고 밝혔다. 제조 현장뿐 아니라 전문·과학·기술서비스업에서도 취업자 감소가 나타나며 AI 자동화가 지식노동까지 흔들고 있다. 전문가들은 산업별 직무 재설계와 숙련 전수 체계가 필요하다고 지적한다.
미국 연방 판사 61.6%가 AI를 쓰지만, 판결문 작성은 거의 안 맡긴다
미국 연방 판사 설문에서 61.6%가 업무에 AI를 써본 적이 있다고 답했다. 하지만 주 용도는 법률 검색과 문서 검토였고, 판결문·명령서 초안 작성이나 실제 의사결정에 쓰는 비율은 각각 1.8%에 그쳤다. 한국 법원도 AI 도입을 준비 중이지만 보안과 사법 윤리 때문에 활용 범위는 조심스럽게 제한되는 분위기다.
댓글
댓글
댓글을 불러오는 중...