---
title: "델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”"
published: 2026-05-21T03:05:05.448Z
canonical: https://jeff.news/article/3063
---
# 델 “AI 토큰 비용 폭증하면 온프레미스·분산형 클라우드가 답”

델 테크놀로지스가 AI 워크로드를 퍼블릭 클라우드에만 두기보다 기업 데이터센터, 엣지, 데스크톱까지 분산해야 한다고 주장했다. 이유는 토큰 과금 부담, 데이터 이동 비용, VM웨어 이후 하이퍼바이저 전략 재검토까지 한꺼번에 걸려 있기 때문이다.

## 토큰 비용이 인프라 설계 변수로 올라옴

- 델 테크놀로지스는 앞으로 AI 인프라 전략에서 “데이터 위치”와 “토큰 비용”이 핵심 변수가 될 거라고 봄
  - 바룬 차브라 델 수석부사장은 델 테크놀로지스 월드(DTW) 2026에서 한국 기자들과 만나 이 내용을 강조함
  - AI 워크로드가 퍼블릭 클라우드에만 머무는 게 아니라 기업 데이터센터, 엣지, 데스크톱까지 퍼질 거라는 관점임

- 특히 에이전틱 AI가 확산되면 토큰 과금 부담이 빠르게 커질 수 있음
  - 에이전트가 많이 실행될수록 모델 호출과 토큰 사용량도 같이 늘어남
  - 퍼블릭 클라우드나 AI 제공 기업의 API는 대부분 토큰당 과금 구조라, 사용량 한도나 비용 한도에 빠르게 닿는 사례가 나온다는 설명임
  - 차브라는 데스크사이드 장비나 서버를 사는 걸 “토큰 생성기”를 확보하는 것에 비유함

> [!IMPORTANT]
> 델의 논리는 단순함. AI 호출 비용을 계속 토큰 단위로 낼지, 아니면 로컬 인프라에 투자해서 예측 가능한 비용 구조로 바꿀지 기업이 따져야 한다는 얘기임.

- 델은 엔비디아와 협력해 AI 팩토리 포트폴리오를 확장 중임
  - 이번 행사에서는 로컬 환경에서 자율형 AI 에이전트를 구축·운영할 수 있는 ‘델 데스크사이드 에이전틱 AI’를 발표함
  - 기업 데이터를 외부로 반출하지 않고도 자율형 AI 에이전트를 실행하는 솔루션으로 소개됨
  - 변동성이 큰 클라우드 토큰 비용을 예측 가능한 인프라 투자로 전환한다는 메시지가 강함

- 프런티어 모델도 온프레미스에서 쓰는 흐름을 언급함
  - 과거에는 제미나이, 그록, 오픈AI 같은 모델을 클라우드에서만 쓰는 식이었다고 설명함
  - 이제는 델 서버 기반 온프레미스 환경에서도 활용할 수 있도록 지원하고 있다고 밝힘

## 분산형 프라이빗 클라우드와 VM웨어 이후 전략

- 델은 차세대 프라이빗 클라우드 방향으로 “분산형 인프라”를 밀고 있음
  - 케이틀린 고든 부사장은 대부분 기업 데이터가 여전히 기업 데이터센터 안에 있다고 설명함
  - AI 도입이 커져도 데이터가 있는 곳 가까이에서 처리하는 구조가 중요하다는 논리임

- 델 프라이빗 클라우드(DPC)는 HCI의 운영 단순성과 전통적인 3계층 아키텍처의 확장성을 섞은 형태로 소개됨
  - 컴퓨팅, 스토리지, 네트워크, 가상화 계층을 독립적으로 확장할 수 있음
  - 필요한 자원만 늘릴 수 있으니, 모든 자원을 노드 단위로 같이 키워야 하는 구조보다 유연하다는 주장임

- 비용 비교도 꽤 세게 나옴. 델은 분산형 인프라가 HCI 대비 최대 65%까지 비용 효율적이라고 말함
  - HCI에서는 컴퓨트 노드가 애플리케이션 워크로드와 스토리지 워크로드를 동시에 처리해야 함
  - 그래서 메모리, 드라이브, 코어, 하이퍼바이저 라이선스 비용이 커질 수 있음
  - 분산형 클라우드에서는 컴퓨트가 애플리케이션 워크로드에 집중하므로 노드 수와 코어 수를 줄일 여지가 있다는 설명임

> [!NOTE]
> 이 전략은 브로드컴의 VM웨어 인수 이후 하이퍼바이저 비용과 종속성을 다시 보는 기업을 정조준함.

- DPC는 “VM웨어 탈출구”를 찾는 고객도 겨냥함
  - 고든 부사장은 DPC가 VM웨어에서 벗어날 방법을 찾는 고객을 지원하기 위해 만들어졌다고 말함
  - 현재 하이퍼바이저를 지원하면서도, 향후 다른 방향으로 전환할 수 있는 비용 효율적인 기반을 제공하겠다는 입장임

---

## 기술 맥락

- 델이 말하는 포인트는 “AI를 어디서 돌릴 것인가”예요. 예전에는 퍼블릭 클라우드 API를 호출하면 빨랐지만, 에이전틱 AI처럼 호출이 반복되는 구조에서는 토큰 비용이 계속 누적되거든요.

- 온프레미스 AI는 그래서 비용 모델을 바꾸는 선택이에요. 매번 토큰당 비용을 내는 대신 서버나 데스크사이드 장비에 투자해서, 사용량이 늘어도 비용을 더 예측하기 쉽게 만들자는 거예요.

- 분산형 프라이빗 클라우드 이야기는 AI뿐 아니라 가상화 비용과도 연결돼요. HCI는 운영이 단순한 대신 자원을 노드 단위로 같이 늘리는 경향이 있어서, 워크로드 특성에 따라 과투자가 생길 수 있거든요.

- DPC가 VM웨어 이후 전략으로 언급되는 이유도 여기에 있어요. 기존 하이퍼바이저를 바로 버리기 어렵지만, 비용과 종속성을 줄일 수 있는 다음 기반은 준비해야 하니까요.

- 결국 이 기사는 클라우드 대 온프레미스의 단순 대결이 아니에요. 데이터 위치, 토큰 과금, GPU 활용, 하이퍼바이저 라이선스까지 합쳐서 AI 인프라의 총비용을 다시 계산해야 한다는 얘기에 가까워요.

## 핵심 포인트

- 델은 에이전틱 AI 확산으로 토큰 사용량과 과금 부담이 커질 것으로 봄
- 온프레미스나 데스크사이드 AI를 “토큰 생성기”처럼 보고 예측 가능한 인프라 투자로 전환하자는 논리
- 엔비디아와 협력해 로컬 환경에서 자율형 AI 에이전트를 운영하는 델 데스크사이드 에이전틱 AI를 발표
- 분산형 프라이빗 클라우드는 HCI 대비 최대 65% 비용 효율적이라고 주장
- VM웨어 대안을 찾는 기업을 겨냥해 현재 하이퍼바이저를 지원하면서 전환 기반을 제공

## 인사이트

AI 인프라 논의가 이제 “GPU 어디서 빌릴까”를 넘어 “토큰 과금, 데이터 위치, 하이퍼바이저 라이선스까지 합쳐서 어디에 둘까”로 바뀌는 중임. 특히 국내 기업도 VM웨어 비용과 AI 데이터 반출 이슈를 동시에 겪고 있어서 꽤 현실적인 이야기다.
