AI 컴퓨팅, 2033년부터 ‘학습’보다 ‘추론’이 더 커진다

ai-ml 2026-06-08 약 5분

 tags

#inference #training #cloud #finetuning #neocloud

vote

북마크

ABI리서치는 AI 클라우드 워크로드의 중심이 모델 학습에서 서비스 운영용 추론으로 이동한다고 전망했다. 2033년 추론 워크로드가 학습을 처음 추월하고, 2035년에는 추론만 약 46기가와트 규모까지 커질 것으로 예상했다.

1
2033년 AI 추론 워크로드가 학습 워크로드를 추월할 전망
2
2035년 추론 워크로드는 약 46기가와트, 학습은 약 36기가와트 예상
3
코드 생성이 2035년 약 24기가와트로 전체 추론 전력 소비의 절반 이상 차지 전망
4
파인튜닝 워크로드는 2035년 21기가와트로 파운데이션 모델 학습보다 커질 전망
5
네오클라우드 사업자가 2035년 추론 용량 15기가와트까지 하이퍼스케일러를 추격할 전망

AI 인프라 시장의 중심이 ‘초거대 모델 학습’에서 ‘실제 서비스 추론’으로 넘어가고 있다는 분석이 나옴
- 시장조사업체 ABI리서치가 AI 클라우드 워크로드 보고서에서 낸 전망임
- 핵심 예측은 2033년에 추론 워크로드가 학습 워크로드를 처음 추월한다는 것
이유는 간단함. 학습은 한 번 크게 돌리는 일이지만, 추론은 사용자가 AI를 쓸 때마다 계속 돈과 전력을 먹음
- GPT나 클로드 같은 대형 모델 개발 경쟁에서는 학습 인프라가 주인공이었음
- 그런데 기업들이 AI를 실제 업무에 붙이기 시작하면, 매 요청마다 모델을 실행하는 추론 비용이 누적됨

❗중요

> ABI리서치는 2035년 추론 워크로드가 약 46기가와트까지 커지고, 학습 워크로드는 약 36기가와트 수준에 머물 것으로 봄. AI 전력 수요의 주인공이 바뀐다는 얘기임.

추론 중에서도 코드 생성이 압도적으로 큰 비중을 차지할 전망임
- 코드 생성 워크로드는 2035년 약 24기가와트까지 성장할 것으로 예상됨
- 전체 추론 전력 소비의 절반 이상을 코드 생성이 먹는다는 계산임
- 반면 텍스트 생성은 약 7기가와트 수준으로 분석됨
오디오 생성은 절대 규모는 작지만 성장률이 빠른 쪽으로 꼽힘
- 연평균 42% 성장률을 기록할 것으로 예상됨
- 다만 기사에서 가장 큰 전력 소비 축으로 제시된 건 코드 생성임
ABI리서치 애널리스트는 다음 경쟁의 승자가 “대규모 추론을 잘 제공하는 사업자”가 될 거라고 봄
- 단순히 성능만 좋으면 안 됨
- 지연시간, 비용, 컴퓨팅 활용률까지 같이 맞춰야 함
- 에이전트 시스템의 컴퓨팅 요구가 커지는 것도 추론 시장 성장의 주요 이유로 언급됨
학습 쪽 내부 구성도 바뀔 전망임
- 파운데이션 모델 학습은 2035년 약 13기가와트 수준에 그칠 것으로 예상됨
- 반면 기업이 기존 모델을 자기 데이터에 맞게 조정하는 파인튜닝은 21기가와트까지 커질 전망임
- 즉, 모두가 새 대형 모델을 만드는 게 아니라 기존 모델을 업무별로 다듬는 수요가 커진다는 뜻임
클라우드 시장 경쟁 구도도 흔들릴 수 있음
- 2035년 추론 용량 소비에서 기존 하이퍼스케일러는 16기가와트를 점유할 것으로 전망됨
- AI 추론 특화 인프라를 내세운 네오클라우드 사업자들은 15기가와트까지 따라붙을 것으로 예상됨
- 기존 클라우드만 이기는 판이 아니라, 추론 최적화 인프라 사업자가 치고 올라올 수 있다는 얘기임

💡팁

> AI 서비스를 만드는 팀이라면 모델 성능표만 볼 게 아니라 추론 비용, 응답 지연, 동시 사용자 수, GPU 사용률을 같이 봐야 함. 앞으로 운영비의 본체는 거기에 있을 가능성이 큼.

기술 맥락

이 전망에서 중요한 선택은 학습 중심 인프라에서 추론 중심 인프라로 무게를 옮기는 거예요. 학습은 대형 모델을 만들 때 큰돈이 들지만, 추론은 서비스가 호출될 때마다 반복해서 비용이 발생하거든요.
코드 생성이 큰 비중으로 나온 것도 개발자 입장에선 꽤 현실적인 신호예요. 코드 보조 도구는 한 번 답하고 끝나는 챗봇보다 짧은 요청을 자주 처리하고, 에이전트가 붙으면 파일 읽기, 수정안 생성, 테스트 제안 같은 호출이 연쇄적으로 늘어나요.
파인튜닝 수요가 커진다는 건 기업들이 범용 모델을 그대로 쓰기보다 자기 데이터와 업무 흐름에 맞춰 조정하려 한다는 뜻이에요. 새 파운데이션 모델을 만드는 것보다 비용은 낮지만, 조직별로 계속 반복되니 전체 워크로드는 커질 수 있어요.
네오클라우드가 부상하는 이유도 여기 있어요. 기존 클라우드는 범용성이 강하지만, 추론 시장에서는 특정 모델 크기, 지연시간, 배치 처리, GPU 활용률에 맞춘 인프라가 비용 경쟁력을 만들 수 있거든요.
결국 AI 제품의 경쟁력은 모델 정확도만으로 결정되지 않아요. 같은 모델을 쓰더라도 누가 더 낮은 비용으로, 더 빠르게, 더 안정적으로 추론을 제공하느냐가 실제 서비스 품질을 가를 수 있어요.

AI 인프라 경쟁의 무게중심이 ‘누가 더 큰 모델을 학습시키나’에서 ‘누가 더 싸고 빠르게 계속 추론을 제공하나’로 넘어가는 그림임. 특히 코드 생성이 추론 전력의 절반 이상을 먹을 거라는 전망은 개발 도구 시장이 인프라 수요를 얼마나 키울지 보여줌.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-23

알파벳, 클라우드 82% 성장했지만 AI 인프라 투자로 현금흐름 첫 적자

알파벳이 2분기 매출 1198억 달러를 기록하며 시장 전망을 넘겼고, 클라우드 매출은 82% 급증한 248억 달러까지 뛰었다. 하지만 AI 인프라에 분기 449억 달러를 투입하면서 잉여현금흐름은 2004년 상장 이후 처음으로 분기 적자를 냈다.

ai-ml 2026-07-23

알파벳 클라우드 매출 82% 폭증했는데, 클라우드 ETF는 왜 빠졌나

알파벳의 2분기 클라우드 매출이 전년 대비 82% 늘며 월가 예상치를 크게 넘었지만, 클라우드 관련 ETF는 오히려 하락했다. 시장은 이제 클라우드 매출 성장률만 보는 게 아니라, 그 매출을 만들기 위해 데이터센터와 칩에 얼마나 많은 자본지출이 들어갔는지를 따지고 있다.

ai-ml 2026-07-23

젠슨 황 “중국산 오픈소스 AI, 좋으면 써야 한다”

젠슨 황 엔비디아 CEO가 미국 정부의 중국산 오픈소스 AI 모델 규제 움직임에 반대했다. 딥시크, 알리바바, 문샷 AI 같은 중국 모델이 백도어라는 우려는 오해에 가깝고, 좋은 오픈소스 모델은 기업들이 활용할 수 있어야 한다는 주장이다.

ai-ml 2026-07-23

업스테이지 ‘솔라 오픈 2’ 공개, 한국어·에이전트 성능으로 독파모 2라운드 승부

업스테이지가 오픈웨이트 LLM ‘솔라 오픈 2’를 공개했다. 2500억 매개변수 중 150억 개만 활성화하는 MoE 구조, 100만 토큰 컨텍스트, H200 2장 구동 가능성을 앞세워 한국어·에이전트·기업 도입성을 동시에 노린 모델이다.

ai-ml 2026-07-23

아이벡스, 오픈소스 로봇·비전으로 볼트 검사 투입 자동화한다

아이벡스가 정보통신산업진흥원의 오픈소스 사업화 과제에 선정돼 케이피에프의 자분탐상 검사라인 자동화에 들어간다. 벌크 상태로 쏟아지는 볼트류를 AI 비전으로 인식하고, 6D 자세 추정과 로봇 제어로 집어서 검사장비에 넣는 흐름까지 구현하는 게 핵심이다.

AI 컴퓨팅, 2033년부터 ‘학습’보다 ‘추론’이 더 커진다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

AI 컴퓨팅, 2033년부터 ‘학습’보다 ‘추론’이 더 커진다

요약

핵심 포인트

핵심 개념

분석

기술 맥락

인사이트

댓글

댓글

관련 기사