델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”

ai-ml 2026-05-21 약 6분

 tags

#ai #on-premise #cloud #hci #vmware

vote

북마크

델 테크놀로지스가 AI 워크로드를 퍼블릭 클라우드에만 두기보다 기업 데이터센터, 엣지, 데스크톱까지 분산해야 한다고 주장했다. 이유는 토큰 과금 부담, 데이터 이동 비용, VM웨어 이후 하이퍼바이저 전략 재검토까지 한꺼번에 걸려 있기 때문이다.

1
델은 에이전틱 AI 확산으로 토큰 사용량과 과금 부담이 커질 것으로 봄
2
온프레미스나 데스크사이드 AI를 “토큰 생성기”처럼 보고 예측 가능한 인프라 투자로 전환하자는 논리
3
엔비디아와 협력해 로컬 환경에서 자율형 AI 에이전트를 운영하는 델 데스크사이드 에이전틱 AI를 발표
4
분산형 프라이빗 클라우드는 HCI 대비 최대 65% 비용 효율적이라고 주장
5
VM웨어 대안을 찾는 기업을 겨냥해 현재 하이퍼바이저를 지원하면서 전환 기반을 제공

토큰 비용이 인프라 설계 변수로 올라옴

델 테크놀로지스는 앞으로 AI 인프라 전략에서 “데이터 위치”와 “토큰 비용”이 핵심 변수가 될 거라고 봄
- 바룬 차브라 델 수석부사장은 델 테크놀로지스 월드(DTW) 2026에서 한국 기자들과 만나 이 내용을 강조함
- AI 워크로드가 퍼블릭 클라우드에만 머무는 게 아니라 기업 데이터센터, 엣지, 데스크톱까지 퍼질 거라는 관점임
특히 에이전틱 AI가 확산되면 토큰 과금 부담이 빠르게 커질 수 있음
- 에이전트가 많이 실행될수록 모델 호출과 토큰 사용량도 같이 늘어남
- 퍼블릭 클라우드나 AI 제공 기업의 API는 대부분 토큰당 과금 구조라, 사용량 한도나 비용 한도에 빠르게 닿는 사례가 나온다는 설명임
- 차브라는 데스크사이드 장비나 서버를 사는 걸 “토큰 생성기”를 확보하는 것에 비유함

❗중요

> 델의 논리는 단순함. AI 호출 비용을 계속 토큰 단위로 낼지, 아니면 로컬 인프라에 투자해서 예측 가능한 비용 구조로 바꿀지 기업이 따져야 한다는 얘기임.

델은 엔비디아와 협력해 AI 팩토리 포트폴리오를 확장 중임
- 이번 행사에서는 로컬 환경에서 자율형 AI 에이전트를 구축·운영할 수 있는 ‘델 데스크사이드 에이전틱 AI’를 발표함
- 기업 데이터를 외부로 반출하지 않고도 자율형 AI 에이전트를 실행하는 솔루션으로 소개됨
- 변동성이 큰 클라우드 토큰 비용을 예측 가능한 인프라 투자로 전환한다는 메시지가 강함
프런티어 모델도 온프레미스에서 쓰는 흐름을 언급함
- 과거에는 제미나이, 그록, 오픈AI 같은 모델을 클라우드에서만 쓰는 식이었다고 설명함
- 이제는 델 서버 기반 온프레미스 환경에서도 활용할 수 있도록 지원하고 있다고 밝힘

분산형 프라이빗 클라우드와 VM웨어 이후 전략

델은 차세대 프라이빗 클라우드 방향으로 “분산형 인프라”를 밀고 있음
- 케이틀린 고든 부사장은 대부분 기업 데이터가 여전히 기업 데이터센터 안에 있다고 설명함
- AI 도입이 커져도 데이터가 있는 곳 가까이에서 처리하는 구조가 중요하다는 논리임
델 프라이빗 클라우드(DPC)는 HCI의 운영 단순성과 전통적인 3계층 아키텍처의 확장성을 섞은 형태로 소개됨
- 컴퓨팅, 스토리지, 네트워크, 가상화 계층을 독립적으로 확장할 수 있음
- 필요한 자원만 늘릴 수 있으니, 모든 자원을 노드 단위로 같이 키워야 하는 구조보다 유연하다는 주장임
비용 비교도 꽤 세게 나옴. 델은 분산형 인프라가 HCI 대비 최대 65%까지 비용 효율적이라고 말함
- HCI에서는 컴퓨트 노드가 애플리케이션 워크로드와 스토리지 워크로드를 동시에 처리해야 함
- 그래서 메모리, 드라이브, 코어, 하이퍼바이저 라이선스 비용이 커질 수 있음
- 분산형 클라우드에서는 컴퓨트가 애플리케이션 워크로드에 집중하므로 노드 수와 코어 수를 줄일 여지가 있다는 설명임

ℹ️참고

> 이 전략은 브로드컴의 VM웨어 인수 이후 하이퍼바이저 비용과 종속성을 다시 보는 기업을 정조준함.

DPC는 “VM웨어 탈출구”를 찾는 고객도 겨냥함
- 고든 부사장은 DPC가 VM웨어에서 벗어날 방법을 찾는 고객을 지원하기 위해 만들어졌다고 말함
- 현재 하이퍼바이저를 지원하면서도, 향후 다른 방향으로 전환할 수 있는 비용 효율적인 기반을 제공하겠다는 입장임

기술 맥락

델이 말하는 포인트는 “AI를 어디서 돌릴 것인가”예요. 예전에는 퍼블릭 클라우드 API를 호출하면 빨랐지만, 에이전틱 AI처럼 호출이 반복되는 구조에서는 토큰 비용이 계속 누적되거든요.
온프레미스 AI는 그래서 비용 모델을 바꾸는 선택이에요. 매번 토큰당 비용을 내는 대신 서버나 데스크사이드 장비에 투자해서, 사용량이 늘어도 비용을 더 예측하기 쉽게 만들자는 거예요.
분산형 프라이빗 클라우드 이야기는 AI뿐 아니라 가상화 비용과도 연결돼요. HCI는 운영이 단순한 대신 자원을 노드 단위로 같이 늘리는 경향이 있어서, 워크로드 특성에 따라 과투자가 생길 수 있거든요.
DPC가 VM웨어 이후 전략으로 언급되는 이유도 여기에 있어요. 기존 하이퍼바이저를 바로 버리기 어렵지만, 비용과 종속성을 줄일 수 있는 다음 기반은 준비해야 하니까요.
결국 이 기사는 클라우드 대 온프레미스의 단순 대결이 아니에요. 데이터 위치, 토큰 과금, GPU 활용, 하이퍼바이저 라이선스까지 합쳐서 AI 인프라의 총비용을 다시 계산해야 한다는 얘기에 가까워요.

AI 인프라 논의가 이제 “GPU 어디서 빌릴까”를 넘어 “토큰 과금, 데이터 위치, 하이퍼바이저 라이선스까지 합쳐서 어디에 둘까”로 바뀌는 중임. 특히 국내 기업도 VM웨어 비용과 AI 데이터 반출 이슈를 동시에 겪고 있어서 꽤 현실적인 이야기다.

이전 기사 (P)

다음 기사 (N)

댓글을 불러오는 중...

ai-ml 2026-07-13

애플 새 음성 인식 API, 온디바이스 영어 전사에서 위스퍼 스몰까지 이겼다

애플의 새 음성 인식 API인 스피치애널라이저가 리브리스피치 벤치마크에서 기존 SFSpeechRecognizer는 물론 위스퍼 스몰보다도 낮은 단어 오류율을 기록했어. 깨끗한 음성에서는 2.12%, noisy 음성에서는 4.56%로, 기존 애플 API 대비 오류율을 3.5~4배 줄였고 위스퍼 스몰보다 약 3배 빠르게 돌았어. 다만 영어·애플 플랫폼·OS 26 조건의 결과라, 다국어와 크로스플랫폼에서는 여전히 위스퍼의 장점이 남아 있어.

ai-ml 2026-07-13

AI를 진짜 잘 쓰는 기업, 미국 증시에서 연 30% 프리미엄 받는다는 연구

예일대와 로체스터대 연구진이 기업의 실제 대형 언어 모델 사용 데이터를 분석했더니, AI 활용도가 높은 상위 20% 기업이 하위 20%보다 주당 평균 0.64% 높은 초과수익률을 냈다. 단순히 AI 기업이냐가 아니라, 업무에 AI를 얼마나 깊게 쓰는지가 시장 가치에 반영되고 있다는 얘기다.

ai-ml 2026-07-13

ZTE, AI 에이전트폰으로 스마트폰 재도전…진짜 승부처는 앱 생태계

ZTE가 바이트댄스의 더우바오를 탑재한 AI 에이전트 스마트폰으로 시장 재진입을 노린다. 핵심은 사용자가 명령하면 AI가 여러 앱을 직접 열고 조작하는 방식인데, 위챗·타오바오·알리페이 같은 플랫폼과 충돌하면서 생태계 문제가 가장 큰 변수로 떠올랐다.

ai-ml 2026-07-13

노벨상 학자들까지 “AI 경제 충격, 지금 제도 안 만들면 늦다”

노벨 경제학상 수상자 15명을 포함한 학자와 기술 업계 인사 약 200명이 AI가 향후 10년 안에 경제를 급격히 바꿀 수 있다며 정책 대응을 촉구했다. 이들은 산업혁명보다 큰 변화가 훨씬 짧은 시간에 올 수 있고, 대규모 일자리 대체와 생활 수준 향상이라는 양면성이 동시에 존재한다고 봤다.

ai-ml 2026-07-13

NHN, AI 데이터센터 매출 기대감에 목표주가 5만6000원으로 상향

한국투자증권이 NHN의 목표주가를 4만5000원에서 5만6000원으로 올리고 투자의견 매수를 유지했다. 핵심 근거는 양평 AI 데이터센터 가동, 공공·민간 GPU 클러스터 수주 확대, 클라우드 사업부 신규 매출 반영이다.

델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”

요약

핵심 포인트

핵심 개념

분석

토큰 비용이 인프라 설계 변수로 올라옴

분산형 프라이빗 클라우드와 VM웨어 이후 전략

기술 맥락

인사이트

댓글

댓글

델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”

요약

핵심 포인트

핵심 개념

분석

토큰 비용이 인프라 설계 변수로 올라옴

분산형 프라이빗 클라우드와 VM웨어 이후 전략

기술 맥락

인사이트

댓글

댓글

관련 기사